freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

——bp網(wǎng)絡的神經(jīng)網(wǎng)絡-資料下載頁

2024-12-07 10:26本頁面
  

【正文】 高識別率困難的根本原因。 畢業(yè)設計(論文) 30 圖 4- 3 各種各樣的手寫體數(shù)字 3.在實際的應用系統(tǒng)中 , 對數(shù)字的單字識別率的要求是很高的。這是因為 , 數(shù)字之間沒有上下文關系 , 每個單字的識別都至關重要。高正確率和極低的誤識率是對手寫數(shù)字識別系統(tǒng)的基本要求。 聯(lián)機字符識別原理 聯(lián)機字符識別的原理框圖見圖 4- 4 畢業(yè)設計(論文) 31 圖 4- 4 聯(lián)機字符識別原理框圖 由圖 4- 4 可見輸入的字符形成了一個點坐標序列(按時間先后順序),如果是使用了手寫板的系統(tǒng)中有時還 包括壓力大小的序列。前處理過程可能包括規(guī)范化、去噪、去除毛刺等。在特征提取出來后,需要將它與存儲在字典中已知的字符特征集比對,以識別出是哪個字符。系統(tǒng)的后處理部分是將單字識別結(jié)果變?yōu)槲谋据敵?,這里面包括利用語言知識對識別結(jié)果進行加工,自動糾錯和發(fā)現(xiàn)錯誤,以不斷提高系統(tǒng)的識別率。 字符的模式表達形式和相應的字典形式有多種,每 一種形式可以選擇不同的特征(或基元),每種特征(或基元)又有不同的抽取方法。這些就使得判別方法和準則以及所用的數(shù)學工具不同,形成了種類繁多、形式各異的識別方法(詳見 ) 預處理及模板的建立 聯(lián)機識別是一種實時識別方式 , 和脫機識別相比 ,預處理過程相對簡單。由于讀取的信號已經(jīng)二值化 , 預處理過程主要包括平滑去噪、字符分割。 干擾噪聲主要是人手抖動造成的飛點 , 以及點陣間隔引起的斷筆。對于單一筆劃數(shù)字 , 如果當前點和上一點的距離大于預定閾值 , 就判為噪聲 , 予以剔除。斷筆處理在特征提取時進行。 畢業(yè)設計(論文) 32 字符分割采用等待時間方式和外切矩形方式。光筆書寫時 , 根據(jù)左上角和右下角頂點坐標 , 即時計算字符的實時外切矩形。如果兩個筆劃之間的等待時間超過設定閾值 , 或者一段等待時間之后的下 一筆劃超出當前外切矩形 , 則認為是新字符的開始。為提高識別率 , 每個數(shù)字書寫區(qū)域一般不小于 8 8 點陣。 程序中通過模擬手寫板來輸入數(shù)字,為了量化特征,規(guī)定了如下 4 個方向:向右,向下,向左,向上,在程序中用數(shù)字或相應的比特位表示。各方向包含的范圍如圖 4- 5: 圖 4- 5 穩(wěn)定的方向范圍 之所以每個方向都包含 3 個范圍,是為了不使得一些小的擾動改變方向。從上面 4 個圖中我們可以看到,在斜線的 4 個方向,每一個都包含在兩個方向中,對于方向的確定,我們有如下的規(guī)則: ( 1)對于每一個起 點,選擇方向的優(yōu)先順序依次是向右,向下,向左,向上,這里是考慮了手寫數(shù)字的特點和人的書寫習慣; ( 2)如果已經(jīng)處在一個方向,那么對于接著的一個方向,應盡量保持和原來的方向一致,這樣方向在一個小范圍內(nèi)波動,可以保持一致,除非已經(jīng)跳離了這個方向所在的范圍。 在得到了方向序列后,我們還需要計算 幾個特征,即節(jié)點的分支數(shù)、以及尾點距交點的距離、首點距交點的距離、首點和尾點的距離。這些計算相對比較容易。 得到了這些特征以后,我們可以建立一個結(jié)構,將這些特征保存在里面,可以輸入很多訓練樣本,如果發(fā) 現(xiàn)有新的特征結(jié)構,將之保存到模板文件里面畢業(yè)設計(論文) 33 即可,這樣避免了用神經(jīng)網(wǎng)絡或統(tǒng)計方法所帶來的運算量大以及每輸入新的訓練樣本即需要從頭進行新的訓練的麻煩。當我們輸入一個測試樣本時,我們先提取它的特征,然后從模板文件中查詢相同的特征,如果有,給出判斷結(jié)果;如果沒有,則提示無法判斷。 樣本集對識別結(jié)果的影響 除了網(wǎng)絡結(jié)構對識別率有一定影響外 , 影響識別效果的一個重要因素是訓練樣本集 . 神經(jīng)網(wǎng)絡的最大特點之一是學習功能 , 網(wǎng)絡的構造是固定的 , 對于不同的應用問題 , 只能通過學習把某方面的信息存儲起來 , 完成某些特定任務 . 對于本文研究對象也不例外 , 同樣是通過學習訓練樣本來達到識別的目的 . 因此 , 從這種意義上看 , 訓練集決定了識別的效果。所以 , 如果訓練集樣本非常多 , 能夠較全面反映識別所需要的信息 , 經(jīng)過學習后 , 識別效果肯定較好 . 但由于微機資源有限 , 所選的樣本集數(shù)量不能太大 , 樣本的覆蓋面不是很寬 ,對樣本集識別率不高也是可以想象的 . 由此可以看出 , 擴大訓練樣本集 , 選擇具有代表性的樣本是很重要的一點。通過實驗數(shù)據(jù)對比也證明了這一點 , 不管是對隱層結(jié)點較少的的網(wǎng)絡 , 還是對隱層結(jié)點較多的網(wǎng)絡來說 , 隨著訓練樣本集的擴大 , 網(wǎng)絡的識別率都 有較明顯的提高 . 1.系統(tǒng)知識的表示與組織 基于知識的手寫數(shù)字識別系統(tǒng)中知識以規(guī)則形式表示 , 一個規(guī)則由前項和后項兩部分組成 , 前項表示前提條件 , 后項表示前提為真時所得的結(jié)論。 ( 1)規(guī)則前提條件的描述 系統(tǒng)以細化后字符的骨架作為特征抽取的對象 , 將抽取所得的某一特征或某些特征的組合 , 合取或析取 , 作為規(guī)則的前提條件。特征的類型有 3 種。 A.點的特征 特征點串 骨架上端點 E、三叉點 F、四叉點 X 形成的字符串 點的相對位置 字符圖形分成左上、右上、左下、右下四個區(qū) , 用 0、 3 分別表示在這些區(qū)內(nèi)的點的位 置。 兩點間的距離 特征點間的直線距離 畢業(yè)設計(論文) 34 B.直線特征 : 直線分水平、 45 176。、垂直、 45 176。四個方向 . C.弧線特征 : 弧線分向左、向右、向上、向下四種朝向 . 除了上述特征外 , 在不同層次 , 根據(jù)需要可抽取不同的特征 , 作為規(guī)則的前提條件。 ( 2)規(guī)則結(jié)論的表示 規(guī)則的結(jié)論以滿足規(guī)則前提條件的樣本數(shù)或概率分布表示。該概率分布通過示例學習獲得。 手寫數(shù)字識別系統(tǒng)采用一系列前提條件對某一模式類應該具備的特征進行描述。當未知樣本與這些前提條件匹配時 , 就被識別為該模式類。由于手寫數(shù)字形狀的多變性 , 因此很難對某一模式 類的所有樣本統(tǒng)一給出一個最小的前提條件描述 , 系統(tǒng)中的每條規(guī)則只是對模式類的部分特征進行描述 , 這樣就可能有不止一個模式類的樣本滿足該規(guī)則的前提條件 , 也就是滿足某規(guī)則前提條件的樣本 , 結(jié)論中包含的模式類可能不是唯一的。 ( 3)知識庫的組織 知識庫中規(guī)則以分層樹形結(jié)構組織。頂層是以字符骨架的特征點串作為前提條件的規(guī)則 , 訓練集中樣本有 M 種特征點串 , 因此共有 M 條頂層規(guī)則 ,該 M 條規(guī)則將訓練集樣本分成 M 個子集。一般來說 , 每個子集會有不只一個模式類 , 因此 , 頂層規(guī)則只對訓練樣本進行粗分類。 為了對頂層規(guī)則匹配后得到的粗 分類樣本進一步進行識別 , 在每條頂層規(guī)則下面 , 歸納形成數(shù)目不等的二層規(guī)則 . 經(jīng)二層規(guī)則匹配后 , 有的樣本可能還不能識別。對于尚不能識別的樣本 , 在二層規(guī)則下 , 再歸納形成三層規(guī)則 , 甚至四層、五層規(guī)則 , 直到所有訓練樣本均被識別為止。 采用這種分層樹形結(jié)構的規(guī)則集組織方法 , 識別時所需匹配及推理的只是規(guī)則集的一個子集 , 有利于提高識別速度。 2.知識的示例學習 示例學習作為知識自動獲取的工具 , 其目的是從兩類或多類例子的集合中找出描述其中一類而排除另一類的一般規(guī)則 , 亦即對這些事例刻劃的共同屬性進行描述。 系統(tǒng)將訓練集中的 樣本作為示例進行學習 , 觀察不同模式類樣本間的本質(zhì)畢業(yè)設計(論文) 35 差別 , 結(jié)合人的知識 , 歸納得到規(guī)則前提條件的描述 , 使得其中一類或幾類的樣本滿足此前提條件 , 而排除其它模式類的樣本 , 達到粗分類或識別的目的 . 規(guī)則的結(jié)論則由機器通過示例學習得到。學習時 , 統(tǒng)計樣本集中滿足規(guī)則前提條件的 0~ 9 十個數(shù)字模式類的樣本數(shù) , 得到 10 個數(shù)的集合 {a0, a1, ?, a9}作為規(guī)則的結(jié)論 , 稱為結(jié)論集。集合中每個數(shù) ai 表示訓練集中模式類 i 滿足該前提條件的樣本個數(shù)。 ai 也可以看作是模式類 i 滿足此前提條件的概率。 在手寫數(shù)字識別系統(tǒng)中 , 如果模式類的識 別規(guī)則預先由人工制定 , 那么這種規(guī)則很難覆蓋手寫數(shù)字的多種變形 , 識別的抗形變能力較差。采用示例學習的方法從大量樣本中歸納形成比較符合客觀實際的規(guī)則。當示例學習的樣本集足夠充分時 , 可以保證規(guī)則的完備性 , 從而使該系統(tǒng)具有較好的識別性能。示例學習的過程 , 是使規(guī)則不斷完善的過程。 3.漸進學習與知識的不斷完善 規(guī)則集的分層樹形結(jié)構 , 不僅可以提高識別速度 , 而且有利于各層次規(guī)則的歸納形成。訓練樣本數(shù)目龐大 , 而每個子集的樣本數(shù)目明顯減少 , 這樣觀察每個子集 , 歸納形成識別這些子集的規(guī)則也就較容易。 ( 1)源規(guī)則的生成 系統(tǒng)學 習是一個順序漸進的過程 , 訓練樣本是逐步增加的。對第一次采集的 n 個樣本 , 進行有導師的學習 , 生成 m 條頂層規(guī)則 , 將這 n 個樣本分成 m 個子集 , 每個子集在頂層規(guī)則下歸納二層規(guī)則、三層規(guī)則、?。將所得的這一分層樹形結(jié)構的規(guī)則集稱為源規(guī)則樹。由于開始時訓練樣本數(shù)有限 , 生成的源規(guī)則樹往往不夠完善 , 需要不斷調(diào)整。 ( 2)漸進學習與知識的不斷完善 當增加新的樣本時 , 利用已建立好的源規(guī)則樹對這些新增加的樣本進行識別 , 這時可能識別 , 也可能拒識或誤識。對拒識或誤識的樣本 , 就需要調(diào)整源規(guī)則樹上的相應部分規(guī)則。其方法有: A.在某 一層上增加一條規(guī)則或修改某條規(guī)則的前提條件 , 使誤識或拒識樣本能正確識別; B.有時在某條頂層規(guī)則下的下層規(guī)則數(shù)目已經(jīng)很多 , 新增一條規(guī)則對提高識別率并不十分有效 , 則應刪除某條或某些規(guī)則 , 重新設計新的更能反映字畢業(yè)設計(論文) 36 符本質(zhì)特征的規(guī)則 , 使其能識別新增加的樣本。 采取上述方法 , 使新增的樣本均能被正確識別 , 這樣得到新的規(guī)則樹。這種學習是個循序漸進的過程 , 不斷增加訓練樣本 , 不斷學習 , 不斷完善規(guī)則樹 , 直到系統(tǒng)具有較滿意的識別結(jié)果為止。 程序?qū)崿F(xiàn) 1.程序流程 2.數(shù)據(jù)結(jié)構 2.實現(xiàn)文件 見附件。 3.使用說明 4.軟件界面 畢業(yè)設計(論文) 37 第五章 軟件開發(fā)環(huán)境 軟件開發(fā)平臺 本軟件采用 Microsoft Windows XP Professional Edition 作為開發(fā)環(huán)境的操作系統(tǒng)平臺,采用 Microsoft Visual C++ 作為系統(tǒng)前端開發(fā)工具。 Visual C++是美國 Microsoft 公司推出的 4GL 軟件開發(fā)工具,目前已經(jīng)成為了國內(nèi)應用最廣泛的高級程序設計語言之一,最新版本為 版。 Visual C++的核心是 MFC, MFC 是個 C++類庫,就像結(jié)構化程序設計時代的 C 語言函數(shù)庫一樣,給程序員提供了豐富的編程接口,簡化了程序的設計,而 MFC 就是直接把 WINDOWS 地 C 語言編程接口 API 函數(shù)用 C++的類封裝而成。 C++的編程方法能夠以多型( polymorphism)、虛擬( virtual)、模板( template)、泛型( generalization)等種種形式,與傳統(tǒng)循序語言如 C 的函數(shù)調(diào)用不盡相同。 Visual C++的組成 資源編輯器 —— Workspace Resource View 當單擊 Visual C++的 Workspace 窗口中的 Resource View 標簽時,我們就可以選擇一個資源進行編輯,主窗口會自動為該類型的資源選擇適當?shù)馁Y源編輯器( resource editor)。該窗口會為菜單選擇一個所見即所得的編輯器,并有一些工具可用于編輯圖標,位圖和字符串。它可編輯 RC(文本格式的資源描述)文件,處理 EXE 和 DLL 文件。 C/C++編譯器 Visual C++的編譯器可以處理 C 和 C++源代碼,它通過源代碼文件名的后綴來識別代碼本身所示用的語言。 C 后綴代表 C 源代碼, CPP 或 CXX 代表 C++源代碼。該編輯 器與所有的 ANSI 標準兼容,包括 C++庫工作組的最新建議,還增加了一些 Microsoft 擴充內(nèi)容。 畢業(yè)設計(論文) 38 資源編譯器 Visual C++資源編譯器從資源編輯器讀取一個 ASCII 資源描述( RC)文件,并生成一個二進制 RES 文件提供給連接器。 連接器 連接器讀入由 C/C++編譯器產(chǎn)生的 OBJ 文件和由資源編譯器產(chǎn)生的RES 文件,同時處理 MFC 的 LIB 庫文件、運行時庫代碼及 Windows 代碼,然后產(chǎn)生項目的 EXE 文件。 調(diào)試器 Visual C++調(diào)試器的穩(wěn)定性有了很大的提高,但是仍不可能 修正所有的錯誤。調(diào)試器和 Developer Studio 緊密配合以保證斷點可以被保存在磁盤上。 Visual C++的特點 同其它軟件開發(fā)工具相比, Visual C++具有一下一些優(yōu)點: 面向?qū)ο?,可視化開發(fā)
點擊復制文檔內(nèi)容
研究報告相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1