freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

中英雙語語料庫畢業(yè)設計論文-畢業(yè)設計-資料下載頁

2025-01-19 00:21本頁面

【導讀】儲存和處理,用于語言學研究的文本庫。它為語言教學和研究提供了自然出現(xiàn)的。真實語料和科學的研究方法,在這些領域正發(fā)揮越來越大的作用。的認可,國際國內(nèi)在語料庫的建設和研究方面均做了大量的工作。才剛剛起步,目前國內(nèi)中醫(yī)英語缺乏統(tǒng)一標準,中醫(yī)術語的翻譯存在許多的不足,這對于將我國傳統(tǒng)醫(yī)學推向世界產(chǎn)生了一定的阻礙。在這種背景下并且得到中國。系統(tǒng)構建了一個層次清晰、界面友好的B/S版“中醫(yī)中英雙語平行語料庫”。系統(tǒng)實現(xiàn)了自動分詞、語料正確性檢查、分詞搜索等核心技術。中英雙語語料庫、中醫(yī)專業(yè)英語、AJAX應用。

  

【正文】 法,并實現(xiàn) 句子標簽的刪除、添加、自動分詞等操作( ParagraphBLL 類與該類功能相似)。 表示層 主要表示 WEB 方式,也可 以表示成 WINFORM 方式 ,WEB 方式也可以表現(xiàn)成: aspx,如果邏輯層相當強大和完善,無論表現(xiàn)層如何定義和更改,邏輯層都能完善地提供服務。 表示層也就是在瀏覽器中看到的界面實現(xiàn)效果,在此不詳述。 第 5章 關鍵技術的實現(xiàn) 27 自動標識關鍵詞及刪除關鍵詞標簽技術 [1][2] 1.思想描述:對語料庫進行入庫時,對是關鍵詞的詞語加上標簽作為標記,然后采用一種算法提取該關鍵詞語插入到數(shù)據(jù)庫關鍵詞表中,以便查詢句子或段落直接匹配關鍵詞表;當用關鍵詞查詢句子或段落時,對句子或段落中的關鍵詞中的標記進行刪除,查詢出來的句子或段落都是連貫的 語句。處理流程圖如 所示。 圖 關鍵詞標識及關鍵詞標簽刪除 2.提取關鍵字是句子或段落入庫的關鍵點,以下對語料數(shù)據(jù)提取關鍵字方法作詳細闡述。 ①語料數(shù)據(jù)提取關鍵字方法主要思想:對傳入的數(shù)據(jù)中的英文單詞進行拆分、對比,來發(fā)現(xiàn)關鍵字,并存如臨時數(shù)據(jù)表中,為了是不同的使用者之間不會產(chǎn)生干擾,特為每個管理員建立臨時表 t_userid。并在退出是刪除; ②傳入?yún)?shù)說明: ref string CN //句子或段落的中文語料 ref string EN //句子或段落的英文語料 ③匹配規(guī)則: 被檢測的單詞 為關鍵詞 該關鍵詞的對應翻譯在中文語料中出現(xiàn) 該關鍵詞不是其他關鍵詞中的組成部分 ④返回值: void ⑤本系統(tǒng)涉及此技術的部分代碼: public static void autoSplitKeyWord(ref string CN,ref string EN) { int i = 0。 //標識關鍵詞標簽 int cur = 0。 //遍歷英文句子每個字母使用的下標用來判斷當前字 母是否為單詞結束時的符號 int be_cur = 0。 //上一次單個單詞的結束位置 int cBegin = 0。 //中文關鍵詞在中文句子中的開始位置 語料庫 標識關鍵詞算法 入庫對象 刪除 標簽算法 查詢結果 查詢 操作 用戶 查詢操作成功 入庫 操作 用戶 第 5章 關鍵技術的實現(xiàn) 28 int curKey = 1。 //找到關鍵詞的下標位置 int MaxKeyLength = 0。 //存儲關鍵詞中最長單詞的長度 char c = new char()。 //當前下標指向的字母 string word = 。 //存儲根據(jù)單詞結束符找出的單詞 KeyWords realKey = null。 //存儲確定后的關鍵詞,根據(jù)單詞長度確定,取長優(yōu)先 while (cur ) { c = EN[cur]。 if ((39。 39。) || (39。.39。) || (39。,39。) || (39。39。)) { word = (be_cur, cur be_cur)。 ListWordEC WordList = (word)。 if ( != 0) { MaxKeyLength = 0。 //初始化最長單詞長度 realKey = null。 //初始化最后確定的單詞 foreach (WordEC wordec in WordList) { curKey = ().IndexOf(())。 if (curKey = 0 amp。amp。 curKey == be_cur) { cBegin = ()。 //關鍵詞在中文句子中的開始位置 if (cBegin = 0) //該關鍵詞的中文翻譯存在于中文句子中 { if ( MaxKeyLength) //該匹配的英文關鍵詞是最長的,則選中該關鍵詞作為該句子中的關鍵詞對 { realKey = new KeyWords()。 MaxKeyLength = 。 = 。 = 。 } } } } 第 5章 關鍵技術的實現(xiàn) 29 if (realKey != null) { i++。 Tag tag = new Tag(i)。 //生成 keyi/keyi形式的標簽 //在英文句子中插入標簽 EN = (be_cur, )。 EN = (be_cur + + , )。 //在中文句子中插入標簽 CN = (cBegin, )。 CN = (cBegin + + , )。 //計算下一個要查找英文句子中是否有關鍵詞存在的位置 cur = be_cur + + 。 } } be_cur = cur + 1。 } cur += 1。 } } 3. 刪除句子或段落語料中的關鍵詞標簽 ①語料數(shù)據(jù)檢查標簽方法及刪除標簽主要思想:使用正則表達式來檢查標簽并將其刪除,可以提高程序的執(zhí)行效率。 ②傳入?yún)?shù)說 明: content:原本字符串。 ③返回值:新產(chǎn)生的字符串。 ④本系統(tǒng)涉及此技術的部分代碼: //使用正則表達式刪除 keyN/keyN成對標簽 public string DeTag(string content) { string tmpContent。 tmpContent = (content, key[199]|/key[199], , )。 tmpContent = (tmpContent, Sentence[199]|/Sentence[199], , )。 return tmpContent。 } 第 5章 關鍵技術的實現(xiàn) 30 使用 JavaScript 插入標簽和檢查語料的正確性 [5][18][19] 插入標簽功能 思想描述:為用戶提供便捷的標簽插入功能,標識 關鍵詞。在插入標簽的同時還會檢測標簽的完整性。因為關鍵詞標簽的作用是標識中文和英文語料中對應的單詞,所以該程序設定了當某種語言的關鍵詞用標簽標識后,那么只有另一種語言中對應的關鍵詞用相同的標簽標識后才能進行下一個關鍵詞的標識操作。實現(xiàn)該功能的代碼如下: //在句子語料中插入關鍵詞標簽 function insertTag(selObj){ var rang = ()。 var length。 var arrTag = new Array(2)。 var arrTmpTag = new Array(2)。 var objTag = [lbxTag]。 var obj = 。 //如果文本框中沒有關鍵詞被選中,或者是文本框不可用,則退出函數(shù) if(== || ==true){ return。 } if( 0){ showTips(請先選擇關鍵詞標簽后,再在中文或英文文本框中劃選要加上關鍵詞標簽的詞語! )。 return。 } var sTag = [].text。 length = arrTag[0] = (0,length/2)。 arrTag[1] = (parseInt(length/2),length)。 for(var i=0。i。i++){ length = obj[i]. arrTmpTag[0] = obj[i].(0,length/2)。 arrTmpTag[1] = obj[i].(parseInt(length/2),length)。 if((arrTmpTag[0])=0 || (arrTmpTag[1])=0){ alert(選擇的關鍵詞中不能包含關鍵詞標簽! )。 return。 } } //檢測要插入的標簽是否已存在于句子語料中 if((arrTag[0]) 0 amp。amp。 (arrTag[1]) 第 5章 關鍵技術的實現(xiàn) 31 0){ //不存在 //檢測關鍵詞標 簽完整性 if(!chkTag((,arrTag[0]++arrTag[1]))){ return。 } = arrTag[0]++arrTag[1] //由負負得正可知, flag=1 乘以 1 那么 flag=1,再乘上 1 那么 flag=1,也就是說乘兩次 1就得到原先的 1 //也 就是說當 flag 的值再次為 1時,則中文、英文句子都用同一個標簽標識了關鍵字, flag==1 時則表示只在中文或英文中標識了關鍵字。 flag*=1。 if(flag==1){ oldSelect = 。 if(==txtCW){ [txtEW].=FFCC99。 alert(請在“英文句子”中選擇要用“ + sTag + ”標簽標識的關鍵字! )。 }else{ [txtCW].=FFCC99。 alert(請在“中文句子”中選擇要用“ + sTag + ”標簽標識的關鍵字! )。 } }else{ = 1。 [txtCW].=。 [txtEW].=。 }
點擊復制文檔內(nèi)容
法律信息相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1