freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

數(shù)據(jù)庫智能查詢接口的實現(xiàn)—-文庫吧資料

2024-12-15 09:18本頁面
  

【正文】 y Language,結構查詢語言 )是一個功能強大的數(shù)據(jù)庫語言。 ( 4) 數(shù)據(jù)使用權限設置:針對用戶的不同使用要求,確定數(shù)據(jù)的用戶使用權限,確保數(shù)據(jù)安全。數(shù)據(jù)表設計不僅要滿足數(shù)據(jù)存儲的要求,還要增加一些如反映有關信息、操作責任、中間數(shù)據(jù)的字段或臨時數(shù)據(jù)表。 ( 2) 數(shù)據(jù)表定義:數(shù)據(jù)表定義指定義數(shù)據(jù)庫中數(shù)據(jù)表的結構,數(shù)據(jù)表的邏輯結構包括:屬性名稱、類型、表示形式、缺省值、校驗規(guī)則、是否關鍵字、可否為空等。 數(shù)據(jù)庫設計的步驟主要是: ( 1) 數(shù)據(jù)庫結構定義:目前的 數(shù)據(jù)庫管理系統(tǒng)( DBMS)有的是支持聯(lián)機事務處理 CLTP(負責對事務數(shù)據(jù)進行采集、處理、存儲)的操作型 DBMS,有的可支持數(shù)據(jù)倉庫、有聯(lián)機分析處理 CLAP(指為支持決策的制定對數(shù)據(jù)的一種加工操作)功能的大型 DBMS,有的數(shù)據(jù)庫是關系型的、有的可支持面向對象數(shù)據(jù)庫。 數(shù)據(jù)庫設計主要是進行數(shù)據(jù)庫的邏輯設計,即將數(shù)據(jù)按一定的分類、分組系統(tǒng)和邏輯層次組織起來,是面向用戶的。 ( 4) 物理設計的任務是確定所有屬性的類型、寬度與取值范圍,設計出基本表的主鍵,將所有的表名與字段名英文化(現(xiàn)在很多軟件能支持中文字段,如 Access 2021), 實現(xiàn)物理建庫,完成數(shù)據(jù)庫物理設計字典。 ( 2) 概念設計的任務是從 DFD 出發(fā),繪制出本主題的實體-關系圖,并列出各個實體與關系的綱要表。信息管理系統(tǒng)所涉及的數(shù)據(jù)庫設計分五個步驟:數(shù)據(jù)庫需求分 析、概念設計、邏輯設計、物理設計與加載測試。目前新詞識別準確率已經(jīng)成為評價一個分詞系統(tǒng)好壞的重要標志之一。如果把「王軍虎」做為一個詞收錄到字典中去,全世界有那么多名字,而且每時每刻都有新增的人名,收錄這些人名本身就是一項巨大的工程。也就是那些在字典中都沒有收錄過,但又確實能稱為詞的那些詞。 * 新詞識別。真歧義意思是給出一句話,由人去判斷也不知道哪個應該是詞,哪個應該不是詞。例如,在句子「這個門把手壞了」中,「把手」是個詞,但在句子「請把手拿開」中,「把手」就不是一個詞;在句子「將軍任命了一名中將」中,「中將」是個詞,但在句子「產(chǎn)量三年中將增長兩倍」中,「中將」就不再是詞。由于沒有人的知識去理解,計算機很難知道到底哪個方案 正確。像這種交叉歧義十分常見,前面舉的「和服」的例子,其實就是因為交叉歧義引起的錯誤。例如:表面的,因為「表面」和「面的」都是詞,那么這個短語就可以分成「表面 的」和「表面的」。 * 歧義識別。中文是一種十分復雜的語言,讓計算機理解中文語言更是困難。筆者了解,海量科技的分詞算法就采用「復方分詞法」,所謂復方,相當于用中藥中的復方概念,即用不同的藥才綜合起來去醫(yī)治疾病,同樣,對于中文詞的識別,需要多種算法來處理不同的問題。 到底哪種分詞算法的準確度更高,目前并無定論。但這種方法也有一定的局限性,會經(jīng)常抽出一些共現(xiàn)頻度高、但并不是詞的常用字組,例如「這一」、「之一」、「有的」、「我的」、「許多的」等,并且對常用詞的識別精度差,時空開銷大。當緊密程度高于某一個閾值時,便可認為此字組可能構成了一個詞。定義兩個字的互現(xiàn)信息,計算 兩個漢字 X、 Y 的相鄰共現(xiàn)概率。因此字與字相鄰共現(xiàn)的頻率或概率能夠較好的反映成詞的可信度。由于漢語語言知識的籠統(tǒng)、復雜性,難以將各種語言信息組織成機器可直接讀取的形式,因此目前基于理解的分詞系統(tǒng)還處在試驗階段。在總控部分的協(xié)調下,分詞子系統(tǒng)可以獲得有關詞、句 子等的句法和語義信息來對分詞歧義進行判斷,即它模擬了人對句子的理解過程。其基本思想就是在分詞的同時進行句法、語義分析,利用句法信息和語義信息來處理歧義現(xiàn)象。 對于機械分詞方法,可以建立一個一般的模型,在這方面有專業(yè)的學術論文,這里不做詳細論述。 一種方法是改進掃描方式,稱為特征掃描或標志切分,優(yōu)先在待分析字符串中識別和切分出一些帶有明顯特征的詞,以這些詞作為斷點,可將原字符串分為較小的串再來進機械分詞,從而減少匹配的錯誤率。但這種精度還遠遠不能滿足實際的需要。一般說來,逆向匹配的切分精度略高于正向匹配,遇到的歧義現(xiàn)象也較少。 還可以將上述各種方法相互組合,例如,可以將正向最大匹配方法和逆向最大匹配方法結合起來構成雙向匹配法。按照掃描方向的不同,串匹配分詞方法可以分 為正向匹配和逆向匹配;按照不同長度優(yōu)先匹配的情況,可以分為最大(最長)匹配和最?。ㄗ疃蹋┢ヅ?;按照是否與詞性標注過程相結合,又可以分為單純分詞方法和分詞與標注相結合的一體化方法。 現(xiàn)有的分詞算法可分為三大類:基于字符串匹配的分詞方法、基于理解的分詞方法和基于統(tǒng)計的分詞方法。我是一個學生,分詞的結果是:我 是 一個 學生。計算機可以很簡單通過空格知道 student 是一個單詞,但是不能很容易明白「學」、「生」兩個字合起來才表示一個詞。 中文分詞技術 中文切詞 基本介紹 眾所周知,英文是以詞為單位的,詞和詞之間是靠空格隔開,而中文是以字為單位,句子中所有的字連起來才能描述一個意思。具體的有語音、手勢、虛擬空間等操作計算機的方式,而語音、手寫等交互方式都是以自然語言理解為基礎的。人們不得不問,為什么還要研究自然語言界面?目前,圖形界面雖然在直觀友好方面比原先的字符界面大大改進了,但使用者仍需要將腦中所想的( What)轉化成如何操作( How)來完成任務的執(zhí)行步驟。NChiql 原型系統(tǒng)具有良好的可移植性、可用性、可適應性、魯棒性和智能性,它采用三層結構,可以直接嫁接在不同廠家的 DBMS 引擎上。如何將自然語言查詢與現(xiàn)存的數(shù)據(jù)庫語義信息結合,是解決這一處理目標的關鍵。我們認為,在研究方法上應定位于以數(shù)據(jù)庫語義為中心的思想。 數(shù)據(jù)庫自然語言界面研究展望 我們認為,目前首先要解決的是研究方法問題。 受限語言的處理方法(受限語法和界面生成)可以在一定程度上解決范圍失配問題,但這不是從根本上解決問題的方法。如領域知識提取技術既增加了系統(tǒng)的可移植性,也是解決另兩類問題所必需的。 對現(xiàn)存問題的解決 為解決數(shù)據(jù)庫自然語言界面中存在的問題,目前技術研究主要朝以下三方面努力: ? 增強系統(tǒng)的可移植性; ? 擴展系統(tǒng)的語言范疇; ? 擴展 系統(tǒng)的概念范疇。解決受限自然語言的途徑有兩個方面,一是改進處理方法,增大可處理的語言面,我們稱之為主動性方法;另一方面是在不降低表達能力的情況下,能以一種清晰的方法告訴用戶語言的受限范圍,從而減少用戶出錯的情況,我們稱之為被動性方法。因此,對一個自然語言更新所潛在的問題是實現(xiàn)上可能存在多個數(shù)據(jù)庫更新操作,稱為候選更新( CandidateUpdate)。就關系模式來講,是與表的結構和表的參照關系有關的,而自然語言用戶的最大特點是不用了解數(shù)據(jù)庫的結構。 自然語言更新處理 自然語言更新處理在某種意義上講要比自然語言的查詢更難處理。對直接性查詢,當出現(xiàn)歧義時,也必須用到知識加以處理。前者若稱為直接性查詢,后者則可稱為間接性查詢。 自然語言查詢中的知識處理 自然語言查詢的最大特點在于它是基于現(xiàn)實世界的概念模型即領域知識而提問的。由于有了中間語言,當系統(tǒng)架構于不同的 DBMS 之上時,只需對其中的查詢生成和查詢處理模塊做必要的調整即可。 上述處理框架也被稱為是一種基于中間語言的處理邏輯。前兩種方法一般比較常見,第三種方法我們認為是一種更適合數(shù)據(jù)庫自然語言查詢處理的方法。 自然語言分析階段是自然語言界面系統(tǒng)的核心,其主要任務是進行語法語義分析。好的提取方法必須能充分減少用戶負擔,增強自動生成能力。在很多 NLIDB 系統(tǒng)中都采用了提取技術??梢灶A見,進入 21 世紀后,隨著技術水平的不斷提高, NLIDB 必將獲得長足的發(fā)展,這完全符合未來計算機的發(fā)展方向和未來計算機的應用需求。中國人民大學、香港中文大學和北京大學在國家自然科學基金重點項目的支持下,開展了 “ 中文數(shù)據(jù)庫系統(tǒng)及其界面研究 ” 課題,在中文數(shù)據(jù)庫環(huán)境下,從可移植性體系結構、領域知識的自動提取、自然語言查詢分析處理、受限中文查詢語言的設計實現(xiàn)與評估、智能界面管理等方面進行了多方位全面、系統(tǒng)的深入探索,已經(jīng)取得了 可喜的研究成果。進入 90 年代后,國內在從事數(shù)據(jù)庫漢語查詢界面方面的研究有了一些進展,但在系統(tǒng)建設方面只停留在原型系統(tǒng)的水平上,難以見到一些成熟的系統(tǒng)。 我國在這方面的研究基本是在漢語自然語言查詢界面的范疇下展開的,以體現(xiàn)我國用戶使用漢語的特色。 進入 90 年代,盡管對 NLIDB 的研究失去了往日的火熱,但依然有一些研究工作在扎實地進行著。但不幸的是, 80年代末及 90 年代初,圖形用戶界面技術的巨大進步極大地沖擊了自然語言界面的研究。較有名的系統(tǒng)有 Intellect、 Teli、 Datatalker。 可移植性系統(tǒng)的產(chǎn)生使系統(tǒng)具有了一定的通用性。 Ask 系統(tǒng)通過支持自學習能力來滿足系統(tǒng)的可移植性要求。 Team 系統(tǒng)研制的突出目標是自然語言界面的可移植性,即界面可以在不同領域之間或不同數(shù)據(jù)庫模式之間方便移植。因為用大量精力所開發(fā)的一個系統(tǒng)只能適用某一類應用,這顯然不令人滿意。 Planes 雖未實現(xiàn)它所提出的所有目標,但它們確實是很重要的建議,是后續(xù)系統(tǒng)的主要實踐內容。 Planes的主要特點是其注重系統(tǒng)的自然性,提出了一系列很重要的系統(tǒng)目標。 Planes 是 70 年代后期的另一個重要系統(tǒng)。 Ladder 是產(chǎn)生于 70 年代后期的一個重要系統(tǒng)。盡管這些系統(tǒng)還局限在某個領域內,屬于專用系統(tǒng),但其自然語言的處理能力已大為提高。 專用系統(tǒng)( 70~ 80 年代) 70 年代,自然語言處理取得長足的進步,在句法、語義分析中提出了許多知識表示和處理模型,如擴充轉移網(wǎng)絡、格語法、語義網(wǎng)絡語法、概念從屬理論等。同時,為了探索新的 NLP 方法,一些研究人工智能的學者開發(fā)了一批應用軟件,其中最典型的代表是 1963年由 建立的 Baseball 系統(tǒng),它用于檢索美國一年內各球隊比賽的時間、地點及比賽成績等, 可以說是最早的 NLIDB 系統(tǒng)。其發(fā)展大致可分為三個時期。 數(shù)據(jù)庫自然語言界面 的發(fā)展過程 數(shù)據(jù)庫自然語言界面是伴隨著自然語言處理( NLP)的發(fā)展而發(fā)展的,其研究歷史可追溯到 60 年代初。開展中文數(shù)據(jù)庫自然語言界面的研究,可填補這方面的空白,特別在今天,計算機漢語手寫體及語音識別已初步達到實用階段,漢語語言界面若與手寫體、語音識別成龍配套,其前景將十分誘人。 對數(shù)據(jù)庫界面的研究在我國一直未引起足夠的重視。它的優(yōu)勢具體表現(xiàn)在: ? 用戶無需了解數(shù)據(jù)庫的內部結構; ? 用戶不再需要熟悉數(shù)據(jù)庫本身的查詢語言; ? 大大減輕了用戶的培訓負擔。自然語言界面提供了用戶直接以人類語言(而不是人工語言或機器語言)的方式向數(shù)據(jù)庫系統(tǒng)發(fā)問,以獲得所需的信息的方式。表格界面雖不用掌握語法,但還是要了解數(shù)據(jù)庫的結構。 目前,數(shù)據(jù)庫的用戶界面主要有以下幾種: ? 基于語法的形式查詢語言,如 SQL; ? 基于表格的界面,如 QBE、 FORM; ? 基于圖形的用戶界面 GUI; ? 基于自然語言的界面 NLIDB。 從廣義上講,數(shù)據(jù)庫自然語言界面應當包括數(shù)據(jù)定義、數(shù)據(jù)更新和數(shù)據(jù)查詢等功能,旨在為與數(shù)據(jù)庫有關的各種操作提供一個易于使用的環(huán)境。 它溝通了現(xiàn)實世界與機器世界對信息的不同理解方式,是多學科交叉的產(chǎn)物,其中涉及數(shù)據(jù)庫系統(tǒng)、自然語言處理、人工智能、人機界面等多方面的研究。數(shù)據(jù)庫自然語言界面 (NLIDB)顯然最符合這類用戶的要求。 數(shù)據(jù)庫系統(tǒng)是最適合使用自然語言界面的軟件系統(tǒng)。許多年來,人們一直在 努力改善人機界面,使計算機易用易學。 關鍵詞 : 智能檢索接口系統(tǒng) , 自然語言處理 , Ado, VC++ 目錄 摘 要 ............................................................................................................... 1 目錄 ........................................................................................................................ 2 第一章 前言 ........................................................................................................... 4 數(shù)據(jù)庫自然語言界面 ................................................................................... 4 數(shù)據(jù)庫自然語言界面的發(fā)展過程 ................................................................. 7 早期系統(tǒng)( 60~ 70年代) ........................
點擊復制文檔內容
研究報告相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1