freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

人工智能論文(參考版)

2024-08-15 13:28本頁(yè)面
  

【正文】 如何將人工智能的技術(shù)更好的引進(jìn)搜索引擎中,將會(huì)成為解決上述問(wèn)題的一個(gè)關(guān)鍵點(diǎn)。通過(guò)聚類(lèi),可以有效的歸納一些不在定義范圍內(nèi)或者無(wú)法定義的文檔,比如一些新興的詞匯,如火星文這類(lèi)網(wǎng)絡(luò)詞匯。搜索引擎主要還是采用分類(lèi)技術(shù)對(duì)文檔進(jìn)行分類(lèi),通過(guò)訓(xùn)練整理出比較有特征的詞庫(kù),然后再對(duì)爬蟲(chóng)收錄的文檔進(jìn)行分類(lèi)文檔聚類(lèi)文檔聚類(lèi)的目標(biāo)就是將文檔聚集成類(lèi),使得類(lèi)與類(lèi)之間的相似度盡量小,而類(lèi)內(nèi)的相似度盡量大。目前存在的分類(lèi)技術(shù)有:貝葉斯分類(lèi)、決策樹(shù)模型、感知器、最大熵建模、k最近鄰、支持向量機(jī)器、神經(jīng)網(wǎng)絡(luò)、線(xiàn)性最小平方擬合(LSF)、ngram方法、線(xiàn)性分類(lèi)器。這樣構(gòu)造的二維表表示的是文檔集合的詞條的統(tǒng)計(jì)信息,最終就可進(jìn)行分類(lèi)和聚類(lèi)挖掘。Information)、信息增益等等,這些方法各有優(yōu)缺,信息增益的定義過(guò)于復(fù)雜,互信息的效果要好于交又嫡,這是因?yàn)榛バ畔⑹菍?duì)不同的主題類(lèi)分別抽取特征詞,而交叉嫡跟特征在全部主題類(lèi)內(nèi)的分布有關(guān),是對(duì)全部主題類(lèi)來(lái)抽取特征詞。特征向量表示法,文檔被表示為文檔空間的向量,這就可以通過(guò)計(jì)算向量之間的相似性來(lái)度量文檔間的相似性。文檔表示文檔表示是指以一定的規(guī)則和描述來(lái)表示文檔或文檔集,是文檔挖掘的基礎(chǔ)。因此,首先要將這些文檔轉(zhuǎn)化為一種類(lèi)似關(guān)系數(shù)據(jù)庫(kù)中記錄的較規(guī)則、且能反映文檔內(nèi)容特征的中間表示形式,一般采用文檔特征向量表示法。這些知識(shí)有強(qiáng)、弱之分,是否具有實(shí)用價(jià)值要經(jīng)過(guò)分析評(píng)價(jià),最終得到用戶(hù)所需的有用知識(shí)。本文選擇機(jī)器學(xué)習(xí)方法,從返回的web文檔分類(lèi)、聚類(lèi)出用戶(hù)感興趣的信息。目前流行的模型和算法來(lái)源于多個(gè)領(lǐng)域,典型的如數(shù)理統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)技術(shù)等。數(shù)據(jù)挖掘數(shù)據(jù)挖掘階段是整個(gè)知識(shí)發(fā)現(xiàn)過(guò)程的核心部分,也是其關(guān)鍵技術(shù)所在。因?yàn)閷?shí)際應(yīng)用系統(tǒng)(各搜索引擎)收集到的數(shù)據(jù)是雜亂性、重復(fù)性和不完整性。三、知識(shí)發(fā)現(xiàn)過(guò)程及關(guān)鍵技術(shù)的實(shí)現(xiàn) 知識(shí)發(fā)現(xiàn)的一般過(guò)程,可分為3個(gè)階段:數(shù)
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1