freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

同類網(wǎng)站查詢接口的集成系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)論文設(shè)計(jì)(編輯修改稿)

2025-07-16 21:32 本頁面
 

【文章內(nèi)容簡介】 口的屬性標(biāo)簽應(yīng)該是該領(lǐng)域中最常用的詞匯,且屬性間的結(jié)構(gòu)合理,布局恰當(dāng),為用戶提供較好的可視化效果。3 基于本體的深網(wǎng)查詢接口集成 本體構(gòu)建和本體概念模型為了提高本體的構(gòu)建效率,并在一定程度上能夠保證領(lǐng)域本體的質(zhì)量,提出了一種半自動(dòng)構(gòu)建本體的算法。Step通過本體構(gòu)建工具構(gòu)建核心本體:1)領(lǐng)域術(shù)語抽取。確定領(lǐng)域類型,從特定領(lǐng)域深網(wǎng)查詢接口表單中對(duì)領(lǐng)域術(shù)語進(jìn)行抽取。2)領(lǐng)域概念抽取。領(lǐng)域核心本體要求領(lǐng)域概念必須是語義明確的,所以需要用領(lǐng)域內(nèi)最通用的語義來描述該類術(shù)語。3)概念間層次關(guān)系獲取。捕獲術(shù)語間的語義關(guān)系,例如同義(Synonymy)關(guān)系、繼承(IS-A)關(guān)系、包含(partof)關(guān)系等。4)領(lǐng)域本體精煉。本體工程師以本體工程學(xué)標(biāo)準(zhǔn)對(duì)已獲取的領(lǐng)域本體概念及概念間的語義關(guān)系進(jìn)行修正。5)領(lǐng)域本體描述。采用本體描述語言(如RDF,XML,OWL等)描述領(lǐng)域本體,本體描述語言提供了機(jī)器對(duì)文檔內(nèi)容可處理的機(jī)制。Step如果某個(gè)術(shù)語不存在于核心本體中,那么通過匹配方法確定術(shù)語和本體概念之間的語義關(guān)系。Step如果相匹配,那么將匹配的概念加入到核心本體適當(dāng)位置,以完成本體的自動(dòng)擴(kuò)展。完成本體構(gòu)建后,本體可以形式化地表示為概念層次結(jié)構(gòu),用戶的查詢以及相關(guān)數(shù)據(jù)可以映射到概念空間,它可以看作是一個(gè)保存概念和概念之間關(guān)系的知識(shí)系統(tǒng)。定義3 :領(lǐng)域本體概念模型(domain ontology concept model,DOCM)。描述了特定領(lǐng)域?qū)嶓w的術(shù)語組織以及術(shù)語之間的關(guān)系,每個(gè)概念可以形式化為Class={Ai,DTi,{Si},{CIi},{CAi},{SCi},{nI1,nI2,…nIk},Ni},表示與該概念相關(guān)的數(shù)據(jù)信息,其中:Ai表示概念主類,它是特定領(lǐng)域下通用的、人們易于理解的詞匯,該詞匯表示一類概念,可以看作描述這類概念的關(guān)鍵字;DTi表示概念所屬的數(shù)據(jù)類型;{Si}表示概念主類的同義詞集合,即概念別名;{CIi}表示概念主類的實(shí)例集合;{CAi}表示與概念相關(guān)的條件屬性集合,主類與條件屬性表示包含關(guān)系;{SCi}表示概念主類的子類集合,主類與子類表示繼承關(guān)系;{nI1,nI2,…,nIk}表示概念主類的k個(gè)實(shí)例的計(jì)數(shù)器;Ni表示概念主類的計(jì)數(shù)器。DOCM具有良好的組織結(jié)構(gòu),能夠清晰地描述概念及概念之間的關(guān)系。本體構(gòu)建采用Prot233。g233。(是一個(gè)史丹佛大學(xué)開發(fā)的本體編輯和知識(shí)獲取軟件,開發(fā)語言采用Java,屬于開放源碼軟件)作為本體編輯工具,并以O(shè)WL作為本體描述語言。通過對(duì)OWL文件的操作,可以很容易地實(shí)現(xiàn)對(duì)DOCM的調(diào)用。 基于本體的模式匹配基于本體的網(wǎng)站查詢接口模式匹配方式有屬性級(jí)和實(shí)例級(jí)2種匹配:定義4:本體的屬性級(jí)匹配。假設(shè)A*表示W(wǎng)eb數(shù)據(jù)庫查詢接口的屬性,Ai表示DOCM中概念節(jié)點(diǎn)Ci的概念主類,{Si}表示Ai的同義詞集合,CAi表示Ai的條件屬性,SCi表示Ai的子類,Sim(A*,Ai)表示應(yīng)用基于本體的短語相似度算法。計(jì)算A*與Ai的相似度值,σ表示相似度閾值,Ni表示Ai的計(jì)數(shù)器。屬性級(jí)匹配存在以下幾種情況:1)如果A*∈{Si}或者A*=Ai,那么表示A*與Ai是1:1的屬性匹配,Ai的計(jì)數(shù)器加1,即Ni=Ni+1;2)如 果A*{Si},A*≠Ai,且Sim(A*,Ai)≥σ,那么表示A*與Ai是1:1的屬性匹配,同時(shí),將A*作為Ai的一個(gè)同義詞加入同義詞集合{Si}中,Ai的計(jì)數(shù)器加1,即Ni=Ni+1;3)如果A*∈{CAi}∪{SCi},那么表示A*與Ai是M:1的屬性匹配,Ai的計(jì)數(shù)器加1,即Ni=Ni+1;4)如果A*DOCM,且Ai,Sim(A*,Ai)<σ,表示A*與Ai不存在匹配關(guān)系,那么創(chuàng)建一個(gè)新類Class,將A*作為Class的主類加入DOCM中,并設(shè)置A*的計(jì)數(shù)器為1。定義5:基于本體的短語相似度算法。給定短語P1和短語P2,通過預(yù)處理將短語P1和短語P2分別表示為詞集P1={c1,c2,…,cm}和P2={cl1,cl2,…,cln},對(duì)于短語P1中的每個(gè)詞匯ci(1≤i≤m,借助通用本體WordNet分別計(jì)算其與短語P2中每個(gè)詞匯clj(1≤j≤n)的相似度,其計(jì)算如式(1)所示:其中,overlap(ci,clj)表示詞匯ci與詞匯clj的語義重合度,即在WordNet概念樹中,詞匯ci與詞匯clj之間包含相同上位概念的個(gè)數(shù)。Depth(ci)表示詞匯ci的概念深度,即詞匯ci在WordNet概念樹中到達(dá)根節(jié)點(diǎn)的層次深度,同理,depth(clj)表示詞匯clj在WordNet概念樹中到達(dá)根節(jié)點(diǎn)的層次深度。如果短語P1中詞匯ci與短語P2中詞匯clj相同,那么Sim(ci,clj)=1。然后,在短語P2中找到與短語P1中詞匯ci相似度最大的值作為短語P1相似度值集中的一個(gè)值Si,從而獲得短語P1的相似度值集Sim1={S1,S2,…,Sm},采樣同樣方法獲得短語P2的相似度值集Sim2={sl1,sl2,…,sln}。短語P1和P2的最后相似度通過每個(gè)短語中詞匯各自的相似度占總單詞個(gè)數(shù)的比例獲得,其計(jì)算如式(2)所示:假設(shè)給定短語P3,δ為相似度閾值。如果Sim(P1,P2)=Sim(P1,P3)≥δ成立,那么可以推測短語P2和短語P3是語義相似的,都應(yīng)記錄于匹配對(duì)應(yīng)關(guān)系集中。通過關(guān)鍵字屬性級(jí)匹配方法,可以準(zhǔn)確識(shí)別DOCM中類或?qū)傩耘c來自不同查詢接口屬性之間的匹配關(guān)系,不僅能夠識(shí)別簡單匹配,而且能夠識(shí)別復(fù)雜匹配。相比于傳統(tǒng)模式匹配方法,大大提高了匹配精度并降低了模式匹配過程的復(fù)雜性。假設(shè)屬性e來自查詢接口QI1,屬性f來自查詢接口QI2,即e∈QI1,f∈QI2,同時(shí),在DOCM中存在主類g,該主類g包含2個(gè)同義詞匯e和f,那么,在比較查詢接口QI1中屬性e和查詢接口QI2中屬性f時(shí),首先比較查詢接口QI1中屬性e與DOCM中主類的相似度。通過比較,如果發(fā)現(xiàn)查詢接口QI1中屬性e與DOCM中主類g相似,并且在g的同義詞集合中包括同義詞f,那么DOCM中的主類g可以看作“橋接”,進(jìn)而推出查詢接口QI1中屬性e和查詢接口QI2中屬性f是相似的,此時(shí)查詢接口QI1中屬性e和查詢接口QI2中屬性f為1:1的簡單匹配。對(duì)于M:N匹配,首先將其轉(zhuǎn)換為M∶1匹配和1:N匹配,進(jìn)而獲得M:N匹配。例如:某個(gè)源查詢接口中存在屬性“公共屬性”,它包含2個(gè)條件屬性“date from”和“date to”,當(dāng)查找DOCM時(shí),DOCM中包含類屬性“from”和“to”,并且類屬性“from”和“tp”在DOCM中的概念主類為“出版日期,那么通過比較可知源查詢接口屬性“publication”與DOCM中主類“出版日期”是相似的,進(jìn)而可以推知“publication”與“from”和“to”為1:M匹配,“date from”與“publication date”為M∶1匹配,“from”和“to”與“date from”和“date to”為M:N匹配。定義6:基于本體的實(shí)例級(jí)匹配。假設(shè)A*表示W(wǎng)eb數(shù)據(jù)庫查詢接口的屬性,Ai表示DOCM中概念節(jié)點(diǎn)Ci的概念主類,{CI*}表示A*的實(shí)例集合,{CIi}表示Ai的實(shí)例集合,{NI1,NI2,…,Nik}表示Ai的k個(gè)實(shí)例計(jì)數(shù)器集合。如果A*與Ai相似,那么SiM(A*,Ai)≥σ成立,其中σ表示A*和Ai的相似度閾值。對(duì)于查詢接口屬性A*的實(shí)例Ins*j,Ins*j∈{CI*},存在以下幾種情況:1)如果INs*j∈{CIi},那么Nih\j=Nij+1;2)如果INs*j{CIi},{CIi}={INS1,…INsk},SiM(Ins*j,INsM)=Max{SiM(Ins*j,INS1),SiM(Ins*j,INS2),…,SiM(INs*j,INsk)}≥σ,1≤M≤k,那么NiM=NiM+1,否則表示實(shí)例INs*j的概念不存在于Ai的實(shí)例中,那么將INs*j作為一個(gè)新實(shí)例加入DOC
點(diǎn)擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1