freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

電子商務(wù)-b-第08講(編輯修改稿)

2025-05-27 02:34 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 或稱(chēng)短語(yǔ)索引項(xiàng))兩種。單索引項(xiàng)對(duì)于英文來(lái)講是英語(yǔ)單詞,比較容易提取,因?yàn)閱卧~之間有天然的分隔符(空格);對(duì)于中文等連續(xù)書(shū)寫(xiě)的語(yǔ)言,必須進(jìn)行詞語(yǔ)的切分。 Electronic Business 電子商務(wù) 第 08講 北京科技大學(xué)經(jīng)濟(jì)管理學(xué)院 18/41 搜索引擎的原理 ?檢索器-信息查詢(xún) ?根據(jù)用戶(hù)的查詢(xún)需求在索引庫(kù)中快速檢出相關(guān)網(wǎng)頁(yè),并反饋檢索結(jié)果。 ?一般包括分類(lèi)目錄及關(guān)鍵詞兩種信息查詢(xún)方式。 Electronic Business 電子商務(wù) 第 08講 北京科技大學(xué)經(jīng)濟(jì)管理學(xué)院 19/741 搜索引擎的原理 ?檢索器的工作原理 ?檢索器的功能是根據(jù)用戶(hù)的查詢(xún)?cè)谒饕龓?kù)中快速檢出文檔,進(jìn)行文檔與查詢(xún)的相關(guān)度評(píng)價(jià),對(duì)將要輸出的結(jié)果進(jìn)行排序,并實(shí)現(xiàn)某種用戶(hù)相關(guān)性反饋機(jī)制。 ?檢索器常用的信息檢索模型有集合理論模型、代數(shù)模型、概率模型和混合模型四種。 Electronic Business 電子商務(wù) 第 08講 北京科技大學(xué)經(jīng)濟(jì)管理學(xué)院 20/41 搜索引擎的原理 ?檢索結(jié)果排序 檢索輸出結(jié)果的排列順序。一般有以下三種方法: ?概率法 是根據(jù)關(guān)鍵詞在文中出現(xiàn)的 頻率 來(lái)判定的,出現(xiàn)的次數(shù)越多,認(rèn)定其與查詢(xún)的相關(guān)程度越高; ?位置法 是根據(jù)關(guān)鍵詞在文中出現(xiàn)的 位置 來(lái)判定,位置越靠前,文件的相關(guān)程度越高; ?分類(lèi)或聚類(lèi)方法 是指搜索引擎采用 分類(lèi)或聚類(lèi) 技術(shù),自動(dòng)把查詢(xún)結(jié)果歸入到不同的類(lèi)別中。 Electronic Business 電子商務(wù) 第 08講 北京科技大學(xué)經(jīng)濟(jì)管理學(xué)院 21/41 搜索引擎的原理 ?排序技術(shù)存在不足和發(fā)展趨勢(shì) ?目前 的排序技術(shù)存在兩大不足: ?沒(méi)有真正解決相關(guān)性。 相關(guān)性是指搜索詞和頁(yè)面的相關(guān)程度。僅僅通過(guò)鏈接、錨文本、版式信息等表面特征, 不能真正判斷搜索詞和文章的相關(guān)性, 解決這個(gè)問(wèn)題的根本方法是增加語(yǔ)意理解, 例如主題詞和關(guān)鍵詞的提取, 從語(yǔ)意上分析, 得出搜索詞和網(wǎng)頁(yè)的相關(guān)程度, 分析越準(zhǔn), 效果越好。 ?搜索結(jié)果單一化。 在搜索引擎上, 任何人搜索同一個(gè)詞的結(jié)果都是一樣。這樣明顯不能滿足訪問(wèn)者的要求。為了克服搜索結(jié)果的單一化問(wèn)題, 需要對(duì)搜索結(jié)果進(jìn)行 個(gè)性化設(shè)置 。搜索結(jié)果排序要實(shí)現(xiàn)從單一化到個(gè)性化, 最理想的結(jié)果應(yīng)該是針對(duì)每個(gè)訪問(wèn)者, 根據(jù)訪問(wèn)者的搜索習(xí)慣和意愿, 對(duì)搜索結(jié)果進(jìn)行排序。搜索引擎的技術(shù)改進(jìn)和優(yōu)化都直接反應(yīng)到搜索結(jié)果的排序上。 Electronic Business 電子商務(wù) 第 08講 北京科技大學(xué)經(jīng)濟(jì)管理學(xué)院 22/41 搜索引擎的原理 ?中文搜索引擎存在不足和發(fā)展趨勢(shì) ?中文分詞: 中文分詞就是把中文的漢字序列切分成有意義的詞。 ?因?yàn)樵谏习賰|的網(wǎng)頁(yè)中找到所有結(jié)果沒(méi)有太大意義, 對(duì)于搜索引擎來(lái)說(shuō), 最重要的并不是找到所有結(jié)果, 而是把最相關(guān)的結(jié)果排在最前面, 這也稱(chēng)為相關(guān)度排序。中文分詞的準(zhǔn)確與否,常常直接影響到中文搜索引擎結(jié)果的相關(guān)度排序。 ?中文分詞技術(shù)屬于自然語(yǔ)言處理技術(shù)范疇, 現(xiàn)有的分詞算法可分為 ?基于字符串匹配的分詞方法; ?基于理解的分詞方法; ?基于統(tǒng)計(jì)的分詞方法。 Electronic Business 電子商務(wù) 第 08講 北京科技大學(xué)經(jīng)濟(jì)管理學(xué)院 23/41 搜索引擎的原理 ?用戶(hù)接口 ?用戶(hù)接口的作用是輸入用戶(hù)查詢(xún)、顯示查詢(xún)結(jié)果、提供用戶(hù)相關(guān)性反饋機(jī)制。主要的目的是方便用戶(hù)使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時(shí)的信息。 ?用戶(hù)接口的設(shè)計(jì)和實(shí)現(xiàn)使用人機(jī)交互的理論和方法,以充分適應(yīng)人類(lèi)的思維習(xí)慣。 Electronic Business 電子商務(wù) 第 08講 北京科技大學(xué)經(jīng)濟(jì)管理學(xué)
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1