freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

同類網(wǎng)站查詢接口的集成系統(tǒng)設(shè)計與實現(xiàn)_畢業(yè)論文設(shè)計(編輯修改稿)

2025-08-10 18:53 本頁面
 

【文章內(nèi)容簡介】 構(gòu)建工具構(gòu)建核心本體: 1)領(lǐng)域術(shù)語抽取。確定領(lǐng)域類型,從特定領(lǐng)域深網(wǎng)查詢接口表單中對領(lǐng)域術(shù)語進(jìn)行抽取 。 2)領(lǐng)域概念抽取。領(lǐng)域核心本體要求領(lǐng)域概念必須是語義明確的,所以需要用領(lǐng)域內(nèi)最通用的語義來描述該類術(shù)語。 3)概念間層次關(guān)系獲取。捕獲術(shù)語間的語義關(guān)系,例如同義( Synonymy)關(guān)系、繼承( IS- A)關(guān)系、包含( partof)關(guān)系等。 4)領(lǐng)域本體精煉。本體工程師以本體工程學(xué)標(biāo)準(zhǔn)對已獲取的領(lǐng)域本體概念及概念間的語義關(guān)系進(jìn)行修正。 5)領(lǐng)域本體描述。采用本體描述語言(如 RDF, XML, OWL 等)描述領(lǐng)域本體,本體描述語言提供了機(jī)器對文檔內(nèi)容可處理的機(jī)制。 Step如果某個術(shù)語不存在于核心本體中,那么通過匹配方法確定術(shù)語和本體概念之間的語義關(guān)系。 Step如果相匹配,那么將匹配的概念加入到核心本體適當(dāng)位置,以完成本體的自動擴(kuò)展。 完成本體構(gòu)建后,本體可以形式化地表示為概念層次結(jié)構(gòu),用戶的查詢以及相關(guān)數(shù)據(jù)可以映射到概念空間,它可以看作是一個保存概念和概念之間關(guān)系的知識系統(tǒng)。 定義 3 :領(lǐng)域本體概念模型( domain ontology concept model, DOCM)。描述了特淮南師范學(xué)院 20xx 屆本科畢業(yè)論文 8 定 領(lǐng)域?qū)嶓w的術(shù)語組織以及術(shù)語之間的關(guān)系,每個概念可以形式化為 Class={ Ai, DTi,{ Si},{ CIi},{ CAi},{ SCi},{ nI1, nI2,? nIk}, Ni},表示與該概念相關(guān)的數(shù)據(jù)信息,其中: Ai表示概念主類,它是特定領(lǐng)域下通用的、人們易于理解的詞匯,該詞匯表示一類概念,可以看作描述這類概念的關(guān)鍵字; DTi表示概念所屬的數(shù)據(jù)類型; { Si}表示概念主類的同義詞集合,即概念別名; { CIi}表示概念主類的實例集合; { CAi}表示與概念相關(guān)的條件屬性集合,主類與條件屬性表示包含關(guān)系; { SCi}表示概念主類的子類集合,主類與子類表示繼承關(guān)系; { nI1, nI2,?, nIk}表示概念主類的 k 個實例的計數(shù)器; Ni表示概念主類的計數(shù)器。 DOCM 具有良好的組織結(jié)構(gòu),能夠清晰地描述概念及概念之間的關(guān)系。本體構(gòu)建采用 Prot233。g233。(是一個史丹佛大學(xué)開發(fā)的本體編輯和知識獲取軟件 ,開發(fā)語言采用 Java,屬于開放源碼軟件 )作為本體編輯工具,并以 OWL 作為本體描述語言。通過對 OWL 文件的操作,可以很容易地實現(xiàn)對 DOCM 的調(diào)用。 基于本體的模式匹配 基于本體的 網(wǎng)站 查詢接口模式匹配方式 有 屬性級和實例級 2 種 匹 配: 定義 4:本體的屬性級匹配。假設(shè) A*表示 Web數(shù)據(jù)庫查詢接口的屬性, Ai表示 DOCM中概念節(jié)點Ci的概念主類,{ Si}表示 Ai 的同義詞集合, CAi 表示 Ai 的條件屬性,SCi 表示 Ai 的子類, Sim( A*, Ai)表示應(yīng)用基于本體的短語相似度算法 。 計算 A*與Ai 的相似度值,σ表示相似度閾值, Ni表示 Ai 的計數(shù)器。 屬性級匹配存在以下幾種情況: 1)如果 A*∈{ Si}或者 A*= Ai,那么表示 A*與 Ai 是 1: 1 的屬性匹配, Ai 的計數(shù)器加1,即Ni=Ni+1; 2)如 果 A*{ Si}, A*≠ Ai,且 Sim( A*, Ai)≥σ,那么表示 A*與 Ai 是 1:1的屬性匹配,同時,將 A*作為 Ai的一個同義詞加入同義詞集合{ Si}中, Ai的計數(shù)器加 1,即 Ni= Ni+ 1; 3)如果 A*∈{ CAi}∪{ SCi},那么表示 A*與 Ai 是 M: 1 的屬性匹配, Ai的計同類網(wǎng)站查詢接口的集成系統(tǒng)設(shè)計與實現(xiàn) 9 數(shù)器加1,即 Ni= Ni+ 1; 4)如果 A*DOCM Ai, Sim( A*, Ai)<σ,表示 A*與 Ai 不存在匹配關(guān)系,那么創(chuàng)建一個新類 Class,將 A*作為 Class 的主類加入 DOCM 中,并設(shè)置 A*的計數(shù)器為1。 定義 5:基于本體的短語相似度算法。給定短語 P1 和短語 P2,通過預(yù)處理將 短語P1 和短語 P2 分別表示為詞集 P1={ c1, c2,?, cm}和 P2={ cl1, cl2,?, cln},對于短語 P1 中的每個詞匯 ci( 1≤ i≤ m,借助通用本體 WordNet 分別計算其與短語 P2中每個詞匯 clj( 1≤ j≤ n)的相似度,其計算如式( 1)所示: 其中, overlap(ci,clj)表示詞匯 ci與詞匯 clj 的語義重合度,即在 WordNet 概念樹中,詞匯 ci與詞匯 clj 之間包含相同上位概念的個數(shù)。 Depth(ci)表示詞匯 ci的概念深度,即詞匯 ci 在 WordNet 概念樹中到達(dá)根節(jié)點的層次深度,同理, depth(clj)表示詞匯 clj 在WordNet 概念樹中到達(dá)根節(jié)點的層次深度。如果短語 P1 中詞匯 ci 與短語 P2 中詞匯 clj相同,那么 Sim(ci, clj)= 1。然后,在短語 P2 中找到與短語 P1 中詞匯 ci相似度最大的值作為短語 P1 相似度值集中的一個值 Si,從而獲得短語 P1 的相似度值集 Sim1={ S1,S2,?, Sm},采樣同樣方法獲得短語 P2 的相似度值集 Sim2={ sl1, sl2,?, sln}。短語 P1 和 P2 的最后相似度通過每個短語中詞匯各自的相似度占總單詞個數(shù)的比例獲得,其計算如式 (2)所示: 假設(shè)給 定短語 P3,δ為相似度閾值。如果 Sim(P1, P2)= Sim(P1, P3)≥δ成立,那么可以推測短語 P2 和短語 P3 是語義相似的,都應(yīng)記錄于匹配對應(yīng)關(guān)系集中。 通過 關(guān)鍵字 屬性級匹配方法,可以準(zhǔn)確識別 DOCM 中類或?qū)傩耘c來自不同查詢接口屬性之間的匹配關(guān)系,不僅能夠識別簡單匹配,而且能夠識別復(fù)雜匹配。相比于傳統(tǒng)模式匹配方法,大大提高了匹配精度并降低了模式匹配過程的復(fù)雜性。 假設(shè)屬性e來自查詢接口 QI1,屬性f來自查詢接口 QI2,即 e∈ QI1, f∈ QI2,同時,在 DOCM 中存在主類 g,該主類 g 包含 2 個同義詞匯 e 和 f,那么,在比較查詢接口 QI1 中屬性 e 和查詢接口 QI2 中屬性 f 時,首先比較查詢接口 QI1 中屬性 e 與 DOCM淮南師范學(xué)院 20xx 屆本科畢業(yè)論文 10 中主類的相似度。通過比較,如果發(fā)現(xiàn)查詢接口 QI1 中屬性 e 與 DOCM 中主類 g 相似,并且在 g 的同義詞集合中包括同義詞 f,那么 DOCM 中的主類 g 可以看作“橋接”,進(jìn)而推出查詢接口 QI1 中屬性 e 和查詢接口 QI2 中屬性 f 是相似的,此時查詢接口 QI1 中屬性 e 和查詢接口 QI2 中屬性 f 為 1:1 的簡單匹配。 對于 M:N 匹配,首先將其轉(zhuǎn)換為 M∶ 1 匹配和 1: N 匹配,進(jìn)而獲得 M: N 匹配。例如:某個源查詢接口中存在屬性“ 公共屬性 ”,它包含 2 個條件屬性“ date from”和“ date to”,當(dāng)查找 DOCM 時, DOCM 中包含類屬性“ from”和“ to”,并且類屬性“ from”和“ tp”在 DOCM 中的概念主類為“ 出版日期 ,那么通過比較可知源查詢接口屬性“ publication”與 DOCM 中主類“ 出版日期 ”是相似的,進(jìn)而可以推知“ publication”與“ from”和“ to”為 1:M 匹配,“ date from”與“ publication date”為 M∶ 1 匹配,“ from”和“ to”與“ date from”和“ date to”為 M: N 匹配。 定義 6:基于本體的實例級匹配。假設(shè) A*表示 Web 數(shù)據(jù)庫查詢接口的屬性, Ai表示DOCM 中概念節(jié)點 Ci 的概念主類,{ CI*}表示 A*的實例集合,{ CIi}表示 Ai 的實例集合,{ NI1, NI2,?, Nik}表示 Ai 的 k 個實例計數(shù)器集合。如果 A*與 Ai 相似,那么 SiM(A*, Ai)≥σ成立,其中σ表示 A*和 Ai 的相似度閾值。對于查詢接口屬性 A*的實例 Ins*j, Ins*j∈{ CI*},存在以下幾種情況: 1)如果 INs *j∈{ CIi},那么 Nih\j= Nij+ 1; 2)如果 INs*j{ CIi},{ CIi}={ INS1,? INsk}, SiM(Ins*j, INsM)= Max{ SiM(Ins*j,INS1), SiM(Ins*j, INS2),?, SiM(INs *j, INsk)}≥σ, 1≤ M≤ k,那么 NiM= NiM+ 1,否則表示實例 INs*j 的概念不存在于 Ai 的實例中,那么將 INs*j 作為一個新實例加入 DOCM 中類 Ai 的{ CIi}中,同時,將新實例的初始計數(shù)器設(shè)置為 1。 例3、假設(shè)源查詢接口包含屬性“ category”,其實例空間為{“ architecture and photo
點擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1