freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

研究生畢業(yè)論文基于結構特征的自由手寫數字識別(編輯修改稿)

2024-09-28 19:13 本頁面
 

【文章內容簡介】 用的識別算法。 首先,該系統(tǒng)基于 MNIST 手寫數字庫,學習該庫中樣本文件格式,正確讀取其中的四個文件,包括兩個字符文件,還有字符文件所對應是實際值,也就是另外兩個文件,了解了文件的格式,并正確的讀取完成對任意字符的讀取、操作、顯示、寫入等操作。雖然樣本進行了初步的大小歸一化,但 字符還存在很多噪聲,筆道存在斷裂,沒有進行閾值分割,而且沒有進行細化,這 樣前期處理就是進行平滑去噪、閾值分割、閉合、細化操作,然后將處理的結果存入文件,以備后期處理。第二步,進行特征提取、特征甄選,結合,形成一個有效的特征集。第三步,分兩步識別,對于各數字分類,在特征集中選擇相關特征綜合,確定合適參數直接完成對數字的識別,這個過程是建立在特征的統(tǒng)計和識別結果的統(tǒng)計基礎上的,保證了識別規(guī)則的準確性,對于不滿足識別規(guī)則的數字樣本,將該樣本的特征結合統(tǒng)計的特征集計算隸屬度,通過各特征的截斷參數進行投票,得票最多的分類 確定為最終識別結果,這個識別過程也是基于對特征的統(tǒng)計,識別結果也是有 效的。 利用形成的識別系統(tǒng)對 10000 個樣本進行測試表明正確識別率達到 90%以上。表明該識別算法有效。 組織結構 本系統(tǒng)處理過程如圖 所示: 圖 本文中其他各章節(jié)展開如下: 預處理 特征提取 分類器設計 南京郵電大學碩士研究生學位論文 第一章 緒論 4 第二章 說明 樣本的格式,如何讀取樣本,對樣本進行預處理,將樣本按原有格式進行轉儲,顯示。 第三章 說明如何在預處理過的樣本上,進行特征的提取,對特征進行提取,最終形成有效的特征集,為接下來的分類 器設計打下基礎。 第四章 對最終確定的特征集進行分析,比較各分類在特征集上與其它分類的差別,以確定分類規(guī)則,以及隸屬關系。分兩層進行識別 ,首先對每一分類都在特征集中提取某一特征組合,直接輸出到該分類,這一過程是基于對特征的統(tǒng)計,以及在訓練樣本集進行測試,確定該識別規(guī)則對于該分類的有效性 。 接著 ,第二 步 ,對于每一分類中不滿足分類規(guī)則的 ,進入到下一步的識別 , 對每一樣本都在特征集上都進行隸屬度的計算 , 取隸屬最大的分類。以上兩步完成了對樣本的分類識別。 第五章 列出識別結果,對上述識別過程進行總 結。 南京郵電大學碩士研究生學位論文 第二章 DoS/DDoS 防御技術概述 5 第二章 樣本的預處理 2 樣本 預處理 樣本格式 手寫體數字識別是光學字符識別 (OCR)中一個非常重要的一個分支 , 有著廣泛的應用前景 。 人工圖像識別的眾多理論 , 總是用它 作為 評判的依據 。 在長期的研究過程中 ,出現了幾個比較標準的圖 像 數據庫 , 這些數據庫中的圖像已經過相似的預處理 , 這樣使用者就可以觀察不同原理產生的結果哪個更好 ,而不用擔心由于預處理的不同而對結果產生影響 。 MNIST數據庫是一個免費的標準數字識別庫 ,來自于 ATamp。T實驗室的 . MNIST 數據庫分成兩個部分 , 一部分是有 60000 個手寫數字樣本的 訓練庫 , 一部分是有 10000 個手寫數字樣本的測試庫 , 訓練庫和測試庫的手寫體變化分布是相同的 。 所有的圖像都已經被規(guī)范成 28*28 點陣的相同尺寸 .MNIST 可以從網絡上免費下載 。 許多知名的算法都曾經使用 MNIST 數據庫進行測試 , 包括反饋網絡 , 支持向量機等 。 MNIST 數據庫文件的存儲格式采用了大多數非 intel 處理器所采用的 MSB first 格式,也就式對于一個 WORD 型變量,首先讀取的八位組是 WORD 變量的部八位,這樣在取一個WORD 型,或 DWORD 型變量的值時要對變量的大小進行一個轉換。 庫中包 含四個文件: ( 1) trainimagesidx3ubyte: 訓練集的圖像數據文件 ( 2) trainlabelsidx1ubyte: 訓練集的每個圖像數據所對應的真實值文件 ( 3) t10kimagesidx3ubyte: 測試集的圖像數據文件 ( 4) t10klabelsidx1ubyte: 測試集的每個圖像數據所對應的真實值文件 文件( 1) 包含 60000 個 訓練 樣本,所采用的格式為: [offset] [type] [value] [description] 0000 32 bit integer 0x00000803(2051) magic number 0004 32 bit integer 60000 number of images 0008 32 bit integer 28 number of rows 0012 32 bit integer 28 number of columns 0016 unsigned byte ?? pixel 0017 unsigned byte ?? pixel 南京郵電大學碩士研究生學位論文 第二章 DoS/DDoS 防御技術概述 6 ........ xxxx unsigned byte ?? pixel Pixels are anized rowwise. Pixel values are 0 to 255. 0 means background (white), 255 means foreground (black). 文件( 2) 內容為文件( 1)中各樣本所對應的真實值, [offset] [type] [value] [description] 0000 32 bit integer 0x00000801(2049) magic number (MSB first) 0004 32 bit integer 60000 number of items 0008 unsigned byte ?? label 0009 unsigned byte ?? label ........ xxxx unsigned byte ?? label The labels values are 0 to 9. 文件( 3) 包含 10000 個測試樣本,所采用的格式為: [offset] [type] [value] [description] 0000 32 bit integer 0x00000803(2051) magic number 0004 32 bit integer 10000 number of images 0008 32 bit integer 28 number of rows 0012 32 bit integer 28 number of columns 0016 unsigned byte ?? pixel 0017 unsigned byte ?? pixel ........ xxxx unsigned byte ?? pixel 文件( 4)內容為文件( 2)中各樣本所對應的真實值, [offset] [type] [value] [description] 0000 32 bit integer 0x00000801(2049) magic number (MSB first) 0004 32 bit integer 10000 number of items 0008 unsigned byte ?? label 0009 unsigned byte ?? label ........ xxxx unsigned byte ?? label The labels values are 0 to 9. 每個樣本文件都是一個 28*28 的點陣,將文件( 1)的前 100 個樣本顯示如圖 南京郵電大學碩士研究生學位論文 第二章 DoS/DDoS 防御技術概述 7 圖 樣本的顯示 圖 可以看出每個數字樣本都進行了大小的歸一化,且位置居中, 但每個樣本都沒有進行細化,有些樣本還有明顯的噪聲,這樣在前期的操作就要對樣本進行 二值化、 平滑去噪 、細化等操作。 樣本文件的預處理 各種預處理操作是否要進行,如何來做具體由樣本本身的情況,以及特征提取的要求 來確定。 原有樣本并沒有進行二值化,且存在噪聲點,這樣就需要對樣本進行二值化,及平滑去噪的處理,對樣本數據的分析發(fā)現對于筆道上的白色數據點取值集中于 255,而只有筆道邊緣,及孤立點才存在介于 0 到 255 之間的“灰”色點,而比背景部分的點值則一律取 0 ,這樣,二值化的操作將變得簡單, f(i, j) 表 示原有樣本文件中點 p(i , j )的取值,則二值化后的取值 F(i , j )為: ? 255 ( , ) 1000 ( , ) 100( , ) f i jf i jF i j ??? ( ) 經過二值化后,在樣本中噪聲點是以孤立的飛白點的形式出現的,去除孤立點要參照其周圍點的分布情況來判斷,在系統(tǒng)中采用了 3 3 窗口(見圖 )來檢測的。 南京郵電大學碩士研究生學位論文 第二章 DoS/DDoS 防御技術概述 8 圖 P 的 8 – 鄰域 去除孤立白點的條件 為 : P = 255 且 71 iv P??≥ WP ( ) WP 為閾值,系統(tǒng)中其 WP = 8。當 WP = 8 時,周圍 8– 鄰域無連接,表明該點為孤立 點,去除該孤立點,令 P = 0 。 接下來對二值化后的樣本進行細化操作 ,對于樣本而言,為修復筆道不必要的斷裂,可以進行閉合操作,但從效果上來看由于樣本較小,筆劃間隔很小,所以即使采用 3 3 窗口 進行閉合仍然會使原樣本丟失很多細節(jié)特征,尤其是小的閉合區(qū)域,所以這里只做細化操作。 事實上很多數字處理算法中都用到了,筆道寬度這一特征,尤其是對印刷體數字的識別中,而在本系統(tǒng)中沒有用到這一特征,認為自由體手寫數字,筆道寬度有著隨意性,對于本識別系統(tǒng)屬于冗余信息,且不利于其它有用信息的提取,因此首先就對樣本進行細化操作。通過細化可以消除目標的很多冗余信息,僅留下進行拓撲分析和現狀分類所需要的有用信息。二值圖象細化后的結果稱為骨架。細化算法根據對象、場合的不同而迥異,對骨架沒有一個明確的數學定義,一般而言,細化的原則就是連續(xù)的擦除圖象的邊緣像素,直至成為一個象素寬的骨架為止。實現細化的算法很多,所得到的骨架也各異,但圖象的骨架應滿足下列要求: 骨架應保持圖象的連續(xù)性,不應使筆道發(fā)生斷裂; 骨架為 8 連通的, 不應存在多余的象素點; 骨架的端點 應基本上是原象素的端點; 骨架應基本上位于圖象的中軸位置; 應有一定的抗噪 能力,不應發(fā)生嚴重的畸變; 細化算法可分為串行算法、并行算法、混合算法,各種細化算法的不同點主要在于使用P3 P2 P1 P4 P P0 P5 P5 P7 南京郵電大學碩士研究生學位論文 第二章 DoS/DDoS 防御技術概述 9 模板進行檢測的順序和模板形狀的差別上,總體上來說,串行算法速度較快,并行算法容易實現。 本系統(tǒng) 考慮過兩種 并行算法, 兩種方法的具體實現如下: 方法 1: bool temp = false。 bool Condition1 = false。 bool Condition2 = false。 bool Condition3 = false。 bool Con
點擊復制文檔內容
公司管理相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1