正文內(nèi)容

中文分詞_畢業(yè)設(shè)計(jì)說(shuō)明書(shū)-wenkub

2022-12-04 16:18:08 本頁(yè)面

　

【正文】，但隨著 Java Servlet 的推出， Java 在電子商務(wù)方面開(kāi)始嶄露頭角，最新的 JSP(Java Server Page)技術(shù)的推出，更是讓 Java 成為基于 Web的應(yīng)用程序的首選開(kāi)發(fā)工具，目前的 Java 技術(shù)已成為所有大型電子商務(wù)項(xiàng)目的必然選擇。內(nèi)蒙古工業(yè)大學(xué)本科畢業(yè)設(shè)計(jì)說(shuō)明書(shū) 2 第一章技術(shù)概述本設(shè)計(jì)中所用到的技術(shù) 包括 Java、 Hibernate、 Struts 和 JSP 等。本課題主要研究的是中文分詞在搜索引擎中的分詞算法。一個(gè)是歧義識(shí)別，一個(gè)是新詞識(shí)別。中文分詞技術(shù)屬于自然語(yǔ)言處理技術(shù)范疇，對(duì)于一句話，人們可以通過(guò)自己的知識(shí)來(lái) 劃分哪些是詞，哪些不是詞。關(guān)鍵詞：中文分詞；詞典；搜索引擎內(nèi)蒙古工業(yè)大學(xué)本科畢業(yè)設(shè)計(jì)說(shuō)明書(shū) Abstract With the information rapid growth, the search engine became the people to search the information the first choice tool, in the polling message process, the inquiry content already included the western languages also to include Chinese, Chinese and the western languages is different, Western writing (for example English) between the word had the blank space achievement to separate, the puter was very easy the word to separate. But in Chinese sentence, between the word and the word the obvious separating character, cannot analyze Chinese sentence to use Chinese word segmentation technology. This design mainly studies Chinese word segmentation algorithm, carries on the application in the puter specialized search system. In system39。本系統(tǒng)中設(shè)計(jì)的中文分詞算法，主要是采用最大正向分詞算法把兩字以上的詞語(yǔ) 拆分出來(lái)。而在中文句子里，詞和詞之間沒(méi)有明顯的分隔符，要把中文句子拆分成詞就需要使用中文分詞技術(shù)。本設(shè)計(jì) 主要是研究中文分詞算法，在計(jì)算機(jī)專(zhuān)業(yè)搜索系統(tǒng) 進(jìn)行應(yīng)用。這樣既可以提高分詞的速度，又可以提高搜索的速度和效率。s Chinese word segmentation algorithm uses the mechanical participle algorithm, through with the lexicon parison, carries on Chinese words and expressions resolution. The search engine is not carries on the match to entire inquiry content to inquire, but is divides the key word to carry on the inquiry. In this system designs Chinese word segmentation algorithm, are mainly uses most Taisho to analyze to the participle algorithm two characters above words and expressions? Like this both may enhance the participle the speed, and may enhance the search the speed and the efficiency. This system take the Java technology as a foundation, involves to related technologies and so on Struts, Hibernate, JSP. This system has the good readability, the feasibility, to be possible Unger, the extendibility and the probability. Key words: Chinese word segmentation。但如何讓計(jì)算機(jī) 識(shí)別那些是詞，那些不是詞？其處理過(guò)程就是分詞算法。歧義是指同樣的一句話，可能有兩種或者更多的切分方法。分詞準(zhǔn)確性對(duì)搜索引擎來(lái)說(shuō)十分重要，但如果分詞速度太慢，即使準(zhǔn)確性再高，對(duì)于搜索引擎來(lái)說(shuō)也是不可用的。下面簡(jiǎn)單的介紹下這些技術(shù)。 Hibernate概述 Hibernate是 JDBC（ Java Database Connectivity）的輕量級(jí)的對(duì)象封裝。 Hibernate 是一個(gè)和 JDBC 密切關(guān)聯(lián)的框架，所以 Hibernate 的兼容性和 JDBC 驅(qū)動(dòng)，和數(shù)據(jù)庫(kù)都有一定的關(guān)系，但是和使用它的 Java 程序，和 App Server沒(méi)有任何關(guān)系，也不存在兼容性問(wèn)題。MVC即 ModelViewController的縮寫(xiě)，是一種常用的設(shè)計(jì)模式。 Struts 跟 Tomcat、 Turbine 等諸多 Apache 項(xiàng)目一樣，是開(kāi) 源軟件，這是它的一大優(yōu)點(diǎn)，使開(kāi)發(fā)者能更深入的了解其內(nèi)部實(shí)現(xiàn)機(jī)制。 JSP 技術(shù)是行業(yè)協(xié)作的結(jié)果，它的設(shè)計(jì)是開(kāi)放的，符合行業(yè)標(biāo)準(zhǔn)的，并支持絕大多數(shù)的服務(wù)器、瀏覽器和相關(guān)工具。內(nèi)蒙古工業(yè)大學(xué)本科畢業(yè)設(shè)計(jì)說(shuō)明書(shū) 4 第二章系統(tǒng)分析系統(tǒng)功能分析系統(tǒng)功能框圖計(jì)算機(jī)專(zhuān)業(yè)搜索系統(tǒng)的功能框圖如圖 21所示圖 21 功能框圖系統(tǒng)功能介紹（ 1）信息搜索功能 1）中文分詞這塊是本設(shè)計(jì)的主要內(nèi)容，用來(lái)把中文句子拆分成一個(gè)一個(gè)的詞語(yǔ)。 2）用戶登錄填寫(xiě)好登錄用戶名和密碼后，提交到數(shù)據(jù)庫(kù)進(jìn)行查詢，當(dāng) 用戶名和密碼正確后，轉(zhuǎn)到頁(yè)面。數(shù)據(jù)庫(kù)是表的集合，通常一個(gè)系統(tǒng)只需一個(gè)數(shù)據(jù)庫(kù)。圖 22 用戶注冊(cè)用例圖（ 2）忘記密碼用例圖這部分實(shí)現(xiàn)的是會(huì)員當(dāng)忘記密碼時(shí)，可以通過(guò)這里進(jìn)行找回密碼，這里找回的密碼是系統(tǒng)新設(shè)定的密碼。內(nèi)蒙古工業(yè)大學(xué)本科畢業(yè)設(shè)計(jì)說(shuō)明書(shū) 6 圖 23 忘記密碼用例圖圖 24 用戶登錄用例圖（ 4）系統(tǒng) 核心用例圖搜索中心提供中文信息搜索。圖 25 系統(tǒng) 核心用例圖系統(tǒng)開(kāi)發(fā)環(huán)境（ 1）硬件環(huán)境設(shè)計(jì) 本系統(tǒng) 時(shí)，要求的硬件環(huán)境如表 21所示表 21 硬件環(huán)境表內(nèi)存 1G CPU Inter(R) Celeron (R) CPU 內(nèi)蒙古工業(yè)大學(xué)本科畢業(yè)設(shè)計(jì)說(shuō)明書(shū) 7 （ 2）軟件環(huán)境設(shè)計(jì)本系統(tǒng)時(shí)，要求的軟件環(huán)境如表 22所示表 22 軟件環(huán)境表操作系統(tǒng) Linux 開(kāi)發(fā)工具及相關(guān)技術(shù) MyEclipse、 Java、 Hibernate、 Struts 內(nèi)蒙古工業(yè)大學(xué)本科畢業(yè)設(shè)計(jì)說(shuō)明書(shū) 8 第三章系統(tǒng)總體設(shè)計(jì) 系統(tǒng)設(shè)計(jì)目的在搜索中文句子時(shí)，和搜索英文句子不一樣。開(kāi)發(fā)設(shè)計(jì)思想本系統(tǒng)主要是實(shí)現(xiàn)中文分詞算法，通過(guò)中文分詞算法進(jìn)行中文搜索。然后在程序中通過(guò) List中的內(nèi)容和拆分的詞進(jìn)行比較。（ 2）業(yè)務(wù)邏輯層處理外部視圖的命令和設(shè)計(jì)中文分詞算法來(lái)實(shí)現(xiàn)中文搜索。（ 4）數(shù)據(jù)庫(kù)層創(chuàng)建數(shù)據(jù)庫(kù)。取出中文字符串與詞典進(jìn) 行順序比較保存這個(gè) 詞字符串正向自減一個(gè) 字符字符串長(zhǎng) 度是否為 1YYN開(kāi) 始結(jié) 束N 圖 41 中文分詞流程圖（ 2）中文分詞算法描述詞典，用來(lái) 保存中文詞語(yǔ) 的文件，在進(jìn)行中文分詞時(shí)，與拆分出的詞進(jìn)行比較。減少一個(gè)字，再與詞典中的各行詞比較，結(jié)果相同保存到內(nèi)容中。 List l = new ArrayList()。 } 計(jì)算機(jī)專(zhuān)業(yè)搜索此模塊主要實(shí)現(xiàn)搜索功能。不相同就繼續(xù)上次操作，直到全部結(jié)束。 //1 調(diào)用 IParticipleService 接口 IParticipleService service=(IParticipleService)

點(diǎn)擊復(fù)制文檔內(nèi)容

公司管理相關(guān)推薦

采煤畢業(yè)設(shè)計(jì)說(shuō)明書(shū)-資料下載頁(yè)

【總結(jié)】I摘要本采區(qū)設(shè)計(jì)一水平在-150m，在一水平上根據(jù)礦井實(shí)際地質(zhì)條件，將一水平分成八個(gè)采區(qū)，由北向南依次命名為：北二上、北二下、北一上、北一下、南一上、南一下、南二上、南二下。其中南一上為達(dá)產(chǎn)采區(qū)，采區(qū)生產(chǎn)能力為，服務(wù)年限為。本設(shè)計(jì)采區(qū)的采煤方法為走向長(zhǎng)壁采煤法，采用綜合機(jī)械化采煤,全礦采用中央分列式通風(fēng)。采用“四·六”工作制，礦

2025-06-04 17:47

采煤畢業(yè)設(shè)計(jì)說(shuō)明書(shū)-資料下載頁(yè)

【總結(jié)】摘要本采區(qū)設(shè)計(jì)一水平在-150m，在一水平上根據(jù)礦井實(shí)際地質(zhì)條件，將一水平分成八個(gè)采區(qū)，由北向南依次命名為：北二上、北二下、北一上、北一下、南一上、南一下、南二上、南二下。其中南一上為達(dá)產(chǎn)采區(qū)，，。本設(shè)計(jì)采區(qū)的采煤方法為走向長(zhǎng)壁采煤法，采用綜合機(jī)械化采煤,全礦采用中央分列式通風(fēng)。采用“四·六”工作制，礦井的年工作日為330d，工作面長(zhǎng)為150m。采空區(qū)處理方法為全部垮落

2025-01-13 19:49

機(jī)械畢業(yè)設(shè)計(jì)說(shuō)明書(shū)-資料下載頁(yè)

【總結(jié)】四川職業(yè)技術(shù)學(xué)院SichuanVocationalandTechnicalCollege畢業(yè)設(shè)計(jì)題目YJ3150傳動(dòng)箱體的機(jī)械加工工藝規(guī)程及工裝設(shè)計(jì) 所屬系部機(jī)械系所屬專(zhuān)業(yè)機(jī)械設(shè)計(jì)與制造所屬班級(jí)10機(jī)制1班學(xué)　號(hào)10158010110128學(xué)生姓名羅金京指導(dǎo)教師夏寶林起訖日期

2025-05-14 01:24

泵站畢業(yè)設(shè)計(jì)說(shuō)明書(shū)-資料下載頁(yè)

【總結(jié)】揚(yáng)州大學(xué)本科生畢業(yè)設(shè)計(jì)摘要江蘇省白水蕩原屬排澇泵站裝機(jī)容量小，排澇能力低，遠(yuǎn)不能滿足整個(gè)排區(qū)的需要。本泵站的興建能確保該地區(qū)的排澇灌溉要求，有力地促進(jìn)該地區(qū)工農(nóng)業(yè)生產(chǎn)及經(jīng)濟(jì)發(fā)展。本泵站采用2臺(tái)套900ZLB-85型軸流泵，泵站設(shè)計(jì)排澇流量為，正向進(jìn)水，正向出水，具有抽排功能。本設(shè)計(jì)可概括為四個(gè)部分，第一部分：機(jī)組選型；第二部分：整體布置；第三

2024-08-28 09:48

選礦畢業(yè)設(shè)計(jì)說(shuō)明書(shū)-資料下載頁(yè)

【總結(jié)】（論文）題目：昆鋼羅茨鐵礦選礦廠50萬(wàn)t/a畢業(yè)設(shè)計(jì)學(xué)院：國(guó)土資源工程學(xué)院專(zhuān)業(yè)：

2024-12-01 16:17

齒輪畢業(yè)設(shè)計(jì)說(shuō)明書(shū)-資料下載頁(yè)

【總結(jié)】1畢業(yè)設(shè)計(jì)說(shuō)明書(shū)專(zhuān)業(yè)：機(jī)械制造及自動(dòng)化班級(jí)：姓名：學(xué)號(hào)：指導(dǎo)老師：劉永杰

2025-05-18 17:54

罩殼畢業(yè)設(shè)計(jì)說(shuō)明書(shū)-資料下載頁(yè)

【總結(jié)】I摘要本文主要通過(guò)罩殼沖壓件的設(shè)計(jì)計(jì)算，設(shè)計(jì)出該沖壓件的模具。在整個(gè)模具設(shè)計(jì)過(guò)程中，涉及到了沖壓件的結(jié)構(gòu)設(shè)計(jì)、壓力機(jī)和模架的選擇以及一些重要參數(shù)的校核，并詳細(xì)敘述了模具設(shè)計(jì)中的凸凹模設(shè)計(jì)、卸料裝置的設(shè)計(jì)和推件裝置設(shè)計(jì)。在整個(gè)模具設(shè)計(jì)過(guò)程中，采用了Pro/E、AutoCAD等著名的設(shè)計(jì)分析軟件，通過(guò)這些軟件進(jìn)行設(shè)計(jì)分析，優(yōu)化了設(shè)計(jì)參數(shù)，縮短了設(shè)計(jì)

2025-05-11 18:51

畢業(yè)設(shè)計(jì)說(shuō)明書(shū)--范例-資料下載頁(yè)

【總結(jié)】河北工程大學(xué)土木工程學(xué)院畢業(yè)設(shè)計(jì)說(shuō)明書(shū)2021年1畢業(yè)設(shè)計(jì)說(shuō)明書(shū)邯鄲縣機(jī)關(guān)事務(wù)管理局生活服務(wù)中心方案B專(zhuān)業(yè)土木工程學(xué)生楊景松指導(dǎo)老師申彥利

2025-06-01 21:46

畢業(yè)設(shè)計(jì)說(shuō)明書(shū)模版-資料下載頁(yè)

【總結(jié)】本科畢業(yè)設(shè)計(jì)說(shuō)明書(shū)第1頁(yè)共5頁(yè)1本科畢業(yè)設(shè)計(jì)說(shuō)明書(shū)的撰寫(xiě)要求畢業(yè)設(shè)計(jì)說(shuō)明書(shū)的內(nèi)容一本裝訂完成的畢業(yè)設(shè)計(jì)說(shuō)明書(shū)按順序由以下幾部分組成：1)封面2)指導(dǎo)教師評(píng)閱書(shū)3)評(píng)閱老師評(píng)閱書(shū)4)中文摘要5)英文摘要6)目錄7)正

2025-05-07 20:29

煤礦畢業(yè)設(shè)計(jì)說(shuō)明書(shū)-資料下載頁(yè)

【總結(jié)】1煤礦畢業(yè)設(shè)計(jì)說(shuō)明書(shū)2目錄目錄.......................................................................................................................2前言

2025-05-07 21:14

公路畢業(yè)設(shè)計(jì)說(shuō)明書(shū)-資料下載頁(yè)

【總結(jié)】┊┊┊┊┊┊┊┊┊┊┊┊┊裝┊┊┊┊┊訂┊┊┊┊┊線┊┊┊┊┊┊┊┊┊┊┊┊┊畢業(yè)設(shè)計(jì)（論文）報(bào)告紙二○一二屆畢業(yè)設(shè)計(jì)清鎮(zhèn)至貴陽(yáng)公路第四

2024-08-12 00:25

[工學(xué)]畢業(yè)設(shè)計(jì)說(shuō)明書(shū)-資料下載頁(yè)

【總結(jié)】目錄中文摘要…………………………………………………………………………………..…Ⅰ英文摘要………………………………………………………………………………..........Ⅱ第一章緒論………………………………………………………………………………....1SolidWorks系統(tǒng)簡(jiǎn)介……………………………………….………………………........1系統(tǒng)

2025-01-18 14:27