freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)庫(kù)智能查詢接口的實(shí)現(xiàn)—計(jì)算機(jī)(論文)-文庫(kù)吧資料

2024-12-15 00:51本頁(yè)面
  

【正文】 y Language,結(jié)構(gòu)查詢語(yǔ)言 )是一個(gè)功能強(qiáng)大的數(shù)據(jù)庫(kù)語(yǔ)言。 ( 4) 數(shù)據(jù)使用權(quán)限設(shè)置:針對(duì)用戶的不同使用要求,確定數(shù)據(jù)的用戶使用權(quán)限,確保數(shù)據(jù)安全。數(shù)據(jù)表設(shè)計(jì)不僅要滿足數(shù)據(jù)存儲(chǔ)的要求,還要增加一些如反映有關(guān)信息、操作責(zé)任、中間數(shù)據(jù)的字段或臨時(shí)數(shù)據(jù)表。 ( 2) 數(shù)據(jù)表定義:數(shù)據(jù)表定義指定義數(shù)據(jù)庫(kù)中數(shù)據(jù)表的結(jié)構(gòu),數(shù)據(jù)表的邏輯結(jié)構(gòu)包括:屬性名稱、類型、表示形式、缺省值、校驗(yàn)規(guī)則、是否關(guān)鍵字、可否為空等。 數(shù)據(jù)庫(kù)設(shè)計(jì)的步驟主要是: ( 1) 數(shù)據(jù)庫(kù)結(jié)構(gòu)定義:目前的 數(shù)據(jù)庫(kù)管理系統(tǒng)( DBMS)有的是支持聯(lián)機(jī)事務(wù)處理 CLTP(負(fù)責(zé)對(duì)事務(wù)數(shù)據(jù)進(jìn)行采集、處理、存儲(chǔ))的操作型 DBMS,有的可支持?jǐn)?shù)據(jù)倉(cāng)庫(kù)、有聯(lián)機(jī)分析處理 CLAP(指為支持決策的制定對(duì)數(shù)據(jù)的一種加工操作)功能的大型 DBMS,有的數(shù)據(jù)庫(kù)是關(guān)系型的、有的可支持面向?qū)ο髷?shù)據(jù)庫(kù)。 數(shù)據(jù)庫(kù)設(shè)計(jì)主要是進(jìn)行數(shù)據(jù)庫(kù)的邏輯設(shè)計(jì),即將數(shù)據(jù)按一定的分類、分組系統(tǒng)和邏輯層次組織起來(lái),是面向用戶的。 ( 4) 物理設(shè)計(jì)的任務(wù)是確定所有屬性的類型、寬度與取值范圍,設(shè)計(jì)出基本表的主鍵,將所有的表名與字段名英文化(現(xiàn)在很多軟件能支持中文字段,如 Access 2021), 實(shí)現(xiàn)物理建庫(kù),完成數(shù)據(jù)庫(kù)物理設(shè)計(jì)字典。 ( 2) 概念設(shè)計(jì)的任務(wù)是從 DFD 出發(fā),繪制出本主題的實(shí)體-關(guān)系圖,并列出各個(gè)實(shí)體與關(guān)系的綱要表。信息管理系統(tǒng)所涉及的數(shù)據(jù)庫(kù)設(shè)計(jì)分五個(gè)步驟:數(shù)據(jù)庫(kù)需求分 析、概念設(shè)計(jì)、邏輯設(shè)計(jì)、物理設(shè)計(jì)與加載測(cè)試。目前新詞識(shí)別準(zhǔn)確率已經(jīng)成為評(píng)價(jià)一個(gè)分詞系統(tǒng)好壞的重要標(biāo)志之一。如果把「王軍虎」做為一個(gè)詞收錄到字典中去,全世界有那么多名字,而且每時(shí)每刻都有新增的人名,收錄這些人名本身就是一項(xiàng)巨大的工程。也就是那些在字典中都沒(méi)有收錄過(guò),但又確實(shí)能稱為詞的那些詞。 * 新詞識(shí)別。真歧義意思是給出一句話,由人去判斷也不知道哪個(gè)應(yīng)該是詞,哪個(gè)應(yīng)該不是詞。例如,在句子「這個(gè)門把手壞了」中,「把手」是個(gè)詞,但在句子「請(qǐng)把手拿開(kāi)」中,「把手」就不是一個(gè)詞;在句子「將軍任命了一名中將」中,「中將」是個(gè)詞,但在句子「產(chǎn)量三年中將增長(zhǎng)兩倍」中,「中將」就不再是詞。由于沒(méi)有人的知識(shí)去理解,計(jì)算機(jī)很難知道到底哪個(gè)方案 正確。像這種交叉歧義十分常見(jiàn),前面舉的「和服」的例子,其實(shí)就是因?yàn)榻徊嫫缌x引起的錯(cuò)誤。例如:表面的,因?yàn)椤副砻妗购汀该娴摹苟际窃~,那么這個(gè)短語(yǔ)就可以分成「表面 的」和「表面的」。 * 歧義識(shí)別。中文是一種十分復(fù)雜的語(yǔ)言,讓計(jì)算機(jī)理解中文語(yǔ)言更是困難。筆者了解,海量科技的分詞算法就采用「復(fù)方分詞法」,所謂復(fù)方,相當(dāng)于用中藥中的復(fù)方概念,即用不同的藥才綜合起來(lái)去醫(yī)治疾病,同樣,對(duì)于中文詞的識(shí)別,需要多種算法來(lái)處理不同的問(wèn)題。 到底哪種分詞算法的準(zhǔn)確度更高,目前并無(wú)定論。但這種方法也有一定的局限性,會(huì)經(jīng)常抽出一些共現(xiàn)頻度高、但并不是詞的常用字組,例如「這一」、「之一」、「有的」、「我的」、「許多的」等,并且對(duì)常用詞的識(shí)別精度差,時(shí)空開(kāi)銷大。當(dāng)緊密程度高于某一個(gè)閾值時(shí),便可認(rèn)為此字組可能構(gòu)成了一個(gè)詞。定義兩個(gè)字的互現(xiàn)信息,計(jì)算 兩個(gè)漢字 X、 Y 的相鄰共現(xiàn)概率。因此字與字相鄰共現(xiàn)的頻率或概率能夠較好的反映成詞的可信度。由于漢語(yǔ)語(yǔ)言知識(shí)的籠統(tǒng)、復(fù)雜性,難以將各種語(yǔ)言信息組織成機(jī)器可直接讀取的形式,因此目前基于理解的分詞系統(tǒng)還處在試驗(yàn)階段。在總控部分的協(xié)調(diào)下,分詞子系統(tǒng)可以獲得有關(guān)詞、句 子等的句法和語(yǔ)義信息來(lái)對(duì)分詞歧義進(jìn)行判斷,即它模擬了人對(duì)句子的理解過(guò)程。其基本思想就是在分詞的同時(shí)進(jìn)行句法、語(yǔ)義分析,利用句法信息和語(yǔ)義信息來(lái)處理歧義現(xiàn)象。 對(duì)于機(jī)械分詞方法,可以建立一個(gè)一般的模型,在這方面有專業(yè)的學(xué)術(shù)論文,這里不做詳細(xì)論述。 一種方法是改進(jìn)掃描方式,稱為特征掃描或標(biāo)志切分,優(yōu)先在待分析字符串中識(shí)別和切分出一些帶有明顯特征的詞,以這些詞作為斷點(diǎn),可將原字符串分為較小的串再來(lái)進(jìn)機(jī)械分詞,從而減少匹配的錯(cuò)誤率。但這種精度還遠(yuǎn)遠(yuǎn)不能滿足實(shí)際的需要。一般說(shuō)來(lái),逆向匹配的切分精度略高于正向匹配,遇到的歧義現(xiàn)象也較少。 還可以將上述各種方法相互組合,例如,可以將正向最大匹配方法和逆向最大匹配方法結(jié)合起來(lái)構(gòu)成雙向匹配法。按照掃描方向的不同,串匹配分詞方法可以分 為正向匹配和逆向匹配;按照不同長(zhǎng)度優(yōu)先匹配的情況,可以分為最大(最長(zhǎng))匹配和最?。ㄗ疃蹋┢ヅ洌话凑帐欠衽c詞性標(biāo)注過(guò)程相結(jié)合,又可以分為單純分詞方法和分詞與標(biāo)注相結(jié)合的一體化方法。 現(xiàn)有的分詞算法可分為三大類:基于字符串匹配的分詞方法、基于理解的分詞方法和基于統(tǒng)計(jì)的分詞方法。我是一個(gè)學(xué)生,分詞的結(jié)果是:我 是 一個(gè) 學(xué)生。計(jì)算機(jī)可以很簡(jiǎn)單通過(guò)空格知道 student 是一個(gè)單詞,但是不能很容易明白「學(xué)」、「生」兩個(gè)字合起來(lái)才表示一個(gè)詞。 中文分詞技術(shù) 中文切詞 基本介紹 眾所周知,英文是以詞為單位的,詞和詞之間是靠空格隔開(kāi),而中文是以字為單位,句子中所有的字連起來(lái)才能描述一個(gè)意思。具體的有語(yǔ)音、手勢(shì)、虛擬空間等操作計(jì)算機(jī)的方式,而語(yǔ)音、手寫等交互方式都是以自然語(yǔ)言理解為基礎(chǔ)的。人們不得不問(wèn),為什么還要研究自然語(yǔ)言界面?目前,圖形界面雖然在直觀友好方面比原先的字符界面大大改進(jìn)了,但使用者仍需要將腦中所想的( What)轉(zhuǎn)化成如何操作( How)來(lái)完成任務(wù)的執(zhí)行步驟。NChiql 原型系統(tǒng)具有良好的可移植性、可用性、可適應(yīng)性、魯棒性和智能性,它采用三層結(jié)構(gòu),可以直接嫁接在不同廠家的 DBMS 引擎上。如何將自然語(yǔ)言查詢與現(xiàn)存的數(shù)據(jù)庫(kù)語(yǔ)義信息結(jié)合,是解決這一處理目標(biāo)的關(guān)鍵。我們認(rèn)為,在研究方法上應(yīng)定位于以數(shù)據(jù)庫(kù)語(yǔ)義為中心的思想。 數(shù)據(jù)庫(kù)自然語(yǔ)言界面研究展望 我們認(rèn)為,目前首先要解決的是研究方法問(wèn)題。 受限語(yǔ)言的處理方法(受限語(yǔ)法和界面生成)可以在一定程度上解決范圍失配問(wèn)題,但這不是從根本上解決問(wèn)題的方法。如領(lǐng)域知識(shí)提取技術(shù)既增加了系統(tǒng)的可移植性,也是解決另兩類問(wèn)題所必需的。 對(duì)現(xiàn)存問(wèn)題的解決 為解決數(shù)據(jù)庫(kù)自然語(yǔ)言界面中存在的問(wèn)題,目前技術(shù)研究主要朝以下三方面努力: ? 增強(qiáng)系統(tǒng)的可移植性; ? 擴(kuò)展系統(tǒng)的語(yǔ)言范疇; ? 擴(kuò)展 系統(tǒng)的概念范疇。解決受限自然語(yǔ)言的途徑有兩個(gè)方面,一是改進(jìn)處理方法,增大可處理的語(yǔ)言面,我們稱之為主動(dòng)性方法;另一方面是在不降低表達(dá)能力的情況下,能以一種清晰的方法告訴用戶語(yǔ)言的受限范圍,從而減少用戶出錯(cuò)的情況,我們稱之為被動(dòng)性方法。因此,對(duì)一個(gè)自然語(yǔ)言更新所潛在的問(wèn)題是實(shí)現(xiàn)上可能存在多個(gè)數(shù)據(jù)庫(kù)更新操作,稱為候選更新( CandidateUpdate)。就關(guān)系模式來(lái)講,是與表的結(jié)構(gòu)和表的參照關(guān)系有關(guān)的,而自然語(yǔ)言用戶的最大特點(diǎn)是不用了解數(shù)據(jù)庫(kù)的結(jié)構(gòu)。 自然語(yǔ)言更新處理 自然語(yǔ)言更新處理在某種意義上講要比自然語(yǔ)言的查詢更難處理。對(duì)直接性查詢,當(dāng)出現(xiàn)歧義時(shí),也必須用到知識(shí)加以處理。前者若稱為直接性查詢,后者則可稱為間接性查詢。 自然語(yǔ)言查詢中的知識(shí)處理 自然語(yǔ)言查詢的最大特點(diǎn)在于它是基于現(xiàn)實(shí)世界的概念模型即領(lǐng)域知識(shí)而提問(wèn)的。由于有了中間語(yǔ)言,當(dāng)系統(tǒng)架構(gòu)于不同的 DBMS 之上時(shí),只需對(duì)其中的查詢生成和查詢處理模塊做必要的調(diào)整即可。 上述處理框架也被稱為是一種基于中間語(yǔ)言的處理邏輯。前兩種方法一般比較常見(jiàn),第三種方法我們認(rèn)為是一種更適合數(shù)據(jù)庫(kù)自然語(yǔ)言查詢處理的方法。 自然語(yǔ)言分析階段是自然語(yǔ)言界面系統(tǒng)的核心,其主要任務(wù)是進(jìn)行語(yǔ)法語(yǔ)義分析。好的提取方法必須能充分減少用戶負(fù)擔(dān),增強(qiáng)自動(dòng)生成能力。在很多 NLIDB 系統(tǒng)中都采用了提取技術(shù)。可以預(yù)見(jiàn),進(jìn)入 21 世紀(jì)后,隨著技術(shù)水平的不斷提高, NLIDB 必將獲得長(zhǎng)足的發(fā)展,這完全符合未來(lái)計(jì)算機(jī)的發(fā)展方向和未來(lái)計(jì)算機(jī)的應(yīng)用需求。中國(guó)人民大學(xué)、香港中文大學(xué)和北京大學(xué)在國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目的支持下,開(kāi)展了 “ 中文數(shù)據(jù)庫(kù)系統(tǒng)及其界面研究 ” 課題,在中文數(shù)據(jù)庫(kù)環(huán)境下,從可移植性體系結(jié)構(gòu)、領(lǐng)域知識(shí)的自動(dòng)提取、自然語(yǔ)言查詢分析處理、受限中文查詢語(yǔ)言的設(shè)計(jì)實(shí)現(xiàn)與評(píng)估、智能界面管理等方面進(jìn)行了多方位全面、系統(tǒng)的深入探索,已經(jīng)取得了 可喜的研究成果。進(jìn)入 90 年代后,國(guó)內(nèi)在從事數(shù)據(jù)庫(kù)漢語(yǔ)查詢界面方面的研究有了一些進(jìn)展,但在系統(tǒng)建設(shè)方面只停留在原型系統(tǒng)的水平上,難以見(jiàn)到一些成熟的系統(tǒng)。 我國(guó)在這方面的研究基本是在漢語(yǔ)自然語(yǔ)言查詢界面的范疇下展開(kāi)的,以體現(xiàn)我國(guó)用戶使用漢語(yǔ)的特色。 進(jìn)入 90 年代,盡管對(duì) NLIDB 的研究失去了往日的火熱,但依然有一些研究工作在扎實(shí)地進(jìn)行著。但不幸的是, 80年代末及 90 年代初,圖形用戶界面技術(shù)的巨大進(jìn)步極大地沖擊了自然語(yǔ)言界面的研究。較有名的系統(tǒng)有 Intellect、 Teli、 Datatalker。 可移植性系統(tǒng)的產(chǎn)生使系統(tǒng)具有了一定的通用性。 Ask 系統(tǒng)通過(guò)支持自學(xué)習(xí)能力來(lái)滿足系統(tǒng)的可移植性要求。 Team 系統(tǒng)研制的突出目標(biāo)是自然語(yǔ)言界面的可移植性,即界面可以在不同領(lǐng)域之間或不同數(shù)據(jù)庫(kù)模式之間方便移植。因?yàn)橛么罅烤λ_(kāi)發(fā)的一個(gè)系統(tǒng)只能適用某一類應(yīng)用,這顯然不令人滿意。 Planes 雖未實(shí)現(xiàn)它所提出的所有目標(biāo),但它們確實(shí)是很重要的建議,是后續(xù)系統(tǒng)的主要實(shí)踐內(nèi)容。 Planes的主要特點(diǎn)是其注重系統(tǒng)的自然性,提出了一系列很重要的系統(tǒng)目標(biāo)。 Planes 是 70 年代后期的另一個(gè)重要系統(tǒng)。 Ladder 是產(chǎn)生于 70 年代后期的一個(gè)重要系統(tǒng)。盡管這些系統(tǒng)還局限在某個(gè)領(lǐng)域內(nèi),屬于專用系統(tǒng),但其自然語(yǔ)言的處理能力已大為提高。 專用系統(tǒng)( 70~ 80 年代) 70 年代,自然語(yǔ)言處理取得長(zhǎng)足的進(jìn)步,在句法、語(yǔ)義分析中提出了許多知識(shí)表示和處理模型,如擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)、格語(yǔ)法、語(yǔ)義網(wǎng)絡(luò)語(yǔ)法、概念從屬理論等。同時(shí),為了探索新的 NLP 方法,一些研究人工智能的學(xué)者開(kāi)發(fā)了一批應(yīng)用軟件,其中最典型的代表是 1963年由 建立的 Baseball 系統(tǒng),它用于檢索美國(guó)一年內(nèi)各球隊(duì)比賽的時(shí)間、地點(diǎn)及比賽成績(jī)等, 可以說(shuō)是最早的 NLIDB 系統(tǒng)。其發(fā)展大致可分為三個(gè)時(shí)期。 數(shù)據(jù)庫(kù)自然語(yǔ)言界面 的發(fā)展過(guò)程 數(shù)據(jù)庫(kù)自然語(yǔ)言界面是伴隨著自然語(yǔ)言處理( NLP)的發(fā)展而發(fā)展的,其研究歷史可追溯到 60 年代初。開(kāi)展中文數(shù)據(jù)庫(kù)自然語(yǔ)言界面的研究,可填補(bǔ)這方面的空白,特別在今天,計(jì)算機(jī)漢語(yǔ)手寫體及語(yǔ)音識(shí)別已初步達(dá)到實(shí)用階段,漢語(yǔ)語(yǔ)言界面若與手寫體、語(yǔ)音識(shí)別成龍配套,其前景將十分誘人。 對(duì)數(shù)據(jù)庫(kù)界面的研究在我國(guó)一直未引起足夠的重視。它的優(yōu)勢(shì)具體表現(xiàn)在: ? 用戶無(wú)需了解數(shù)據(jù)庫(kù)的內(nèi)部結(jié)構(gòu); ? 用戶不再需要熟悉數(shù)據(jù)庫(kù)本身的查詢語(yǔ)言; ? 大大減輕了用戶的培訓(xùn)負(fù)擔(dān)。自然語(yǔ)言界面提供了用戶直接以人類語(yǔ)言(而不是人工語(yǔ)言或機(jī)器語(yǔ)言)的方式向數(shù)據(jù)庫(kù)系統(tǒng)發(fā)問(wèn),以獲得所需的信息的方式。表格界面雖不用掌握語(yǔ)法,但還是要了解數(shù)據(jù)庫(kù)的結(jié)構(gòu)。 目前,數(shù)據(jù)庫(kù)的用戶界面主要有以下幾種: ? 基于語(yǔ)法的形式查詢語(yǔ)言,如 SQL; ? 基于表格的界面,如 QBE、 FORM; ? 基于圖形的用戶界面 GUI; ? 基于自然語(yǔ)言的界面 NLIDB。 從廣義上講,數(shù)據(jù)庫(kù)自然語(yǔ)言界面應(yīng)當(dāng)包括數(shù)據(jù)定義、數(shù)據(jù)更新和數(shù)據(jù)查詢等功能,旨在為與數(shù)據(jù)庫(kù)有關(guān)的各種操作提供一個(gè)易于使用的環(huán)境。 它溝通了現(xiàn)實(shí)世界與機(jī)器世界對(duì)信息的不同理解方式,是多學(xué)科交叉的產(chǎn)物,其中涉及數(shù)據(jù)庫(kù)系統(tǒng)、自然語(yǔ)言處理、人工智能、人機(jī)界面等多方面的研究。數(shù)據(jù)庫(kù)自然語(yǔ)言界面 (NLIDB)顯然最符合這類用戶的要求。 數(shù)據(jù)庫(kù)系統(tǒng)是最適合使用自然語(yǔ)言界面的軟件系統(tǒng)。許多年來(lái),人們一直在 努力改善人機(jī)界面,使計(jì)算機(jī)易用易學(xué)。 關(guān)鍵詞 : 智能檢索接口系統(tǒng) , 自然語(yǔ)言處理 , Ado, VC++ 目錄 摘 要 ............................................................................................................... 1 目錄 ........................................................................................................................ 2 第一章 前言 ........................................................................................................... 4 數(shù)據(jù)庫(kù)自然語(yǔ)言界面 ................................................................................... 4 數(shù)據(jù)庫(kù)自然語(yǔ)言界面的發(fā)展過(guò)程 ................................................................. 7 早期系統(tǒng)( 60~ 70年代) ........................
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1