freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于bp神經(jīng)網(wǎng)絡(luò)的字母識別系統(tǒng)設(shè)計與實現(xiàn)(專業(yè)版)

2025-10-08 21:34上一頁面

下一頁面
  

【正文】 本文采用了式( ) 來確 定隱含層的節(jié)點數(shù)為 40(其中 c取 7) ,并加以訓(xùn)練結(jié)果識別率達到期望的結(jié)果 , 因此最終確定為 40. 各層節(jié)點確定之后就確定了本文采用的 BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如 圖 所示: 濟南大學(xué)泉城學(xué)院畢業(yè)論文 25 圖 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖 BP 神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)計和訓(xùn)練過程 [17] BP 神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置直接影響到最后的識別結(jié)果決定著網(wǎng)絡(luò)設(shè)計的好壞,有著重要的意思。保證輸出結(jié)果的可靠性,指定位置輸出為 1 其余位置為 0,我們期望的輸出形式見附錄。 一般情況下,網(wǎng)絡(luò)中所含的神經(jīng)元的個數(shù)與其能記憶、識別 的模式是成正比的。 BP神經(jīng)網(wǎng)絡(luò)由三層節(jié)點集合組成:輸入層、輸出層、隱含層。樹突是作為引入輸入信號的突起,而軸突是作為輸出端的突起。 外輪廓特征提取 英文字母的外輪廓特征能夠很好的反映出字符的整體結(jié)構(gòu)和特征,提取輪廓特征時。 粗網(wǎng)格特征反映的是字符的局部特征,是個百分比相對值,對于本文圖像局部的形變或噪聲對應(yīng)二值化的數(shù)字點陣就是局部元素的 1 的值,如果圖像帶有局部的形變或著噪音,與沒有形變和噪聲的平滑圖像相比來說,因為要除一個比較大的分母,計算出來的百分比相對值變化不是不大。本文用到了像素百分比的全局特征和粗網(wǎng)格的局部特征提取。 (2)細化算法不應(yīng)該去除重要點例如拐點。將每個數(shù)字圖像統(tǒng)一到同一的高度和寬度,這就是圖像的歸一化。如果是用在要求識別速度快但對正確率要求必是很高的場合我們可以選擇運用均值濾波的方式,如果使用在要求高正確率的場合,比如銀行、金融業(yè),我們就必須運用中值濾波來實現(xiàn)。因此預(yù)處理過程的效果會對特征的提取、數(shù)字識別產(chǎn)生重要的影響。由于與很多因素有關(guān),比如作者的書寫習(xí)慣、掃描的質(zhì)量、識別運用的 算法、學(xué)習(xí)與訓(xùn)練的樣本等,都可能影響識別正確率,所以 BP 神經(jīng)網(wǎng)絡(luò)產(chǎn)品不但需要一個核心技術(shù),產(chǎn)品的操作使用方便性、所提供的除錯功能及方法,也是決定產(chǎn)品好壞的重要因素 [9]。 [31] 對模式的統(tǒng)計分類方法,即把模式類看成是用某個隨機向量實現(xiàn)的集合,又稱為決策理論識別方 法。 1984 年,他又提出了連續(xù)時間 Hopfield神經(jīng)網(wǎng)絡(luò)模型,為神經(jīng)計算機的研究做了開拓性的貢獻,開創(chuàng)了神經(jīng)網(wǎng)絡(luò)用于聯(lián)想記憶和優(yōu)化計算的全新的途徑,有力地推動了神經(jīng)網(wǎng)絡(luò)的研究發(fā)展, 1985 年,又有學(xué)者提出了波耳茲曼模型,在學(xué)習(xí)中采用統(tǒng)計熱力學(xué)模擬退火技術(shù),保證整個系統(tǒng)趨于全局的穩(wěn)定點在日本的“真實世界計算”項目中,人工智 能的研究成了一個重要的組成部分??焖俑咝У貙⒆帜篙斎擞嬎銠C,是信息處理的一個關(guān)鍵問題。第二,具有聯(lián)想存儲功能 。 用人工神經(jīng)網(wǎng)絡(luò)的反饋網(wǎng)絡(luò) 在字母識別時 可以實現(xiàn)這種聯(lián)想 。人工鍵入速度慢而且勞動強度大,對于大量已有的文檔資料,英文自動識別輸人就成為了最佳的選擇。 [1] 我國在識別領(lǐng)域的研究起步較晚,在 20 世紀 70 年代才開始對符號、字母、數(shù)字進行識別 研究,對漢字的識別研究開始于 70 年代末期,到 86 年我國漢字的識別研究進人一個跨越性的時期,并取得了豐碩成果,并相繼推出了許多中文識別的實用產(chǎn)品。屬于同一類別的各個模式之間的差異,部分是由環(huán)境噪聲和傳感器的性質(zhì)所引起的,部分是模式本身所具有的隨機性質(zhì)。 論文組織結(jié)構(gòu) 手寫字母識別是指利用 BP 神經(jīng)網(wǎng)絡(luò)辨認手寫英文字母的一種技術(shù),它屬于OCR 范疇。 本文采用的的字母圖像的預(yù)處理過程:去噪、二值化、歸一化和細化 。本文要求較高的識別率選用了中值濾波來實現(xiàn)英文字母的識別。 基本上歸一化思想是利用圖像的不變矩尋找一組參數(shù)使其能夠消除其他變換函數(shù)對圖像變換的影響。 (3)算法不應(yīng)該對噪聲敏感,即當(dāng)待識字符邊界上出現(xiàn)噪聲時,對細化結(jié)果不產(chǎn)生影響。 一個 好的識別系統(tǒng) ,應(yīng)該符合以下條件 : (1) 具有較好的平移不變性、旋轉(zhuǎn)不變性和尺度不變性; (2) 穩(wěn)定性好,具有較好的抗噪能力; (3)具有較好的類內(nèi)一致性和類間區(qū)分度。換句話說,這個 百分比相對值對于二值化圖片局部筆劃的變形或孤立的噪聲點帶來的影響不是很大。從歸一化的字符中直導(dǎo)出字符的邊緣輪廓。 圖 神經(jīng)元 每個神經(jīng)元的突觸數(shù)目正常,最高可達 10 個。每一層節(jié)點的輸出結(jié)果送到下一層節(jié)點。但是神經(jīng)元的個數(shù)也不可以太多否則影響其是別的速度過多的神經(jīng)元也容易出錯,所以神經(jīng)元也不可以太多。 隱含層節(jié)點數(shù)的優(yōu)化確定 隱含層的節(jié)點數(shù)的確定目前為止在世界 上還沒有一個固定的算法。下面是一些參數(shù)的設(shè)計: 每迭代 50 步顯示一次訓(xùn)練結(jié)果 . trainParam. show=5 0: 學(xué)習(xí)速率決定著每一 次循環(huán)訓(xùn)練中所產(chǎn)生的權(quán)值的變化量地大小。 隱含層節(jié)點的選擇不僅僅是一種方法來決定,我們可以結(jié)合多種方法進行選擇,在通過 BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練來最終確定隱含層的節(jié)點 [25]。本文的設(shè)計思想是希望 26 個輸出節(jié)點對應(yīng)位置上的輸出是 1,而其他位 置上的輸出為 0,一次對應(yīng)著 AZ26 個英文字母,輸入特征的影響或是訓(xùn)練次數(shù)較低以及訓(xùn)練過程中的噪聲影響可能會導(dǎo)致輸出結(jié)果不是 1 或 0 而出現(xiàn)其他的值,入 、 、 、 等一系列的值不符合設(shè)計的要求 為了使網(wǎng)絡(luò)具有一定的適應(yīng)環(huán)境的能力將其輸出結(jié)果用網(wǎng)絡(luò)函數(shù) 處理,相當(dāng)于曾加一個閥值比如說是 ,則大于 輸出為 1,小于 輸出為0。當(dāng)網(wǎng)絡(luò)再次遇到其中任何一個 A 或 B 模式時,能夠作出迅速、準確的判斷進行識別 [22]。自學(xué)習(xí)模型為: )()1( nan wwijiij ????? ?? ( ) 濟南大學(xué)泉城學(xué)院畢業(yè)論文 21 h 為學(xué)習(xí)因子; Фi為輸出節(jié)點 i 的計算誤差; Oj為輸出節(jié)點 j 的計算輸出; a為動量因子 知道了 BP神經(jīng)網(wǎng)絡(luò)的各結(jié)構(gòu)模型我們進一步建立本文所用到的 BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu), 如 圖 所示。突起的作用就是用其來傳遞信息。對 32*32 灰度圖在水平方向上從上至下每 4 行掃描一次,提取 8 個特征, 900方向每隔 4 行掃描一次,形成 8+8=16濟南大學(xué)泉城學(xué)院畢業(yè)論文 18 個的特征值。針對 32 32 的點陣,我 劃分成大小為 4 4 的 16 個小區(qū)域(如 圖 ),因此,共得出一個十六維的粗網(wǎng)格特征值 ( 如表 ) 。統(tǒng)計征可以分為全局特征和局部特整。 對字符進行細化的過程當(dāng)中我們選取算法是要有一定的準則: (1)細化算法不應(yīng)該改變待識字符的連續(xù)性。 我們用這種方法確定了閾值是 ,如圖 : 二值化前 二值化后 圖 值化前后圖像 對于我們要鑒定的字 母二值化前后 的字母矩陣 是什么變化呢? 以 125為閾 值舉例, 運行程序后字母矩陣得到如下表結(jié)果 濟南大學(xué)泉城學(xué)院畢業(yè)論文 10 表 字母二值化前后的矩陣 ( a)二值化前 (b)二值化后 45 78 221 78 90 47 217 85 234 0 48 128 178 127 29 128 26 4 90 179 94 124 93 87 1 歸一化 我們所要鑒定的字符的大小規(guī)格不盡相同, 這對后續(xù)英文字母的特征提取,識別操作環(huán)節(jié)會造成一定的障礙。所以均值濾波和中值濾波都有各自的利與弊,選用哪一種濾波方式這要看我們對識別的要求。 圖 系 統(tǒng)的識別框架圖 預(yù)處理概述 在進行手寫英文字母識別時需要對所得到的手寫英文字母圖像提前進行預(yù)處理,不同地域的人在書寫英文字母的過程中的書寫風(fēng)格不盡相同即使是同一地域的人由于山谷寫的任意性也會造成手寫字母的形式千變?nèi)f化,令外數(shù)字圖像在采集過程中,受圖像質(zhì)量、掃描性能的影響,數(shù)字圖像會帶有形變和噪聲,這些變化都會影響英文字母的識別效果,預(yù)處理的目的是消除原始圖像中的噪聲,將原來的圖像轉(zhuǎn)化為清晰的二值化圖像,便于對手寫字母的微觀結(jié)構(gòu)特征的提取。對神經(jīng)網(wǎng)絡(luò)的研究目前許多技術(shù)不能確定,正確率永遠達不到 100%,只能靠近,它們之間進行著拉鋸戰(zhàn)。而“模式識別”則是在某些一定量度或觀測基礎(chǔ)上把待識模式劃分到各自的模式類中去。 1982 年,美國加州工物理學(xué)院 提出了 Hopfield 神經(jīng)網(wǎng)格模型,引入了“計算能量”的概念,給出了網(wǎng)絡(luò)穩(wěn)定性判斷。 英語 是 世界上使用人數(shù)最多的文字之一。 字 母識別時 ,只在先把許多不同的圖像樣板和對應(yīng)的應(yīng)識別的結(jié)果輸入人工神經(jīng)網(wǎng)絡(luò), 然后在 識別之前 對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練形成穩(wěn)定的權(quán)值 這樣 網(wǎng)絡(luò) 通過自學(xué)習(xí)功能,慢慢學(xué)會識別類似的圖像。 第三,具有高速尋找優(yōu)化解的能力。它在英文信息處理、辦公室自動化、機器翻譯、人工智能等高技術(shù)領(lǐng)域,都有著重要的實用價值和理論意義。我國的許多研究部門在 80 年代初期就開始對字符識別進行研究,從 80 年代開始,神經(jīng)網(wǎng)絡(luò)的識別研究開發(fā)就一直受到國家“ 863”計劃的資助與支持,并已經(jīng)有了初步的回報。前者如紙的質(zhì)量、墨水、污點對書寫字符的影響;后者表現(xiàn)為同一個人書寫同一字符時,雖形狀相似,但不可能完全一樣?;?BP 網(wǎng)絡(luò)的手寫英文字母識別包括兩個階段:一個是訓(xùn)練階段和一個是識別階段,這兩個階段包含輸入、預(yù)處理、特征提取、分類及輸出五個部分。 本文預(yù)處理設(shè)計 本章的預(yù)處理過程的設(shè)計 如 圖 : 樣本字母 預(yù)處理 特征提取 訓(xùn)練模式 待識字母 預(yù)處理 特征提取 分類 結(jié)果輸出 學(xué)習(xí)階段 識別階段 濟南大學(xué)泉城學(xué)院畢業(yè)論文 7 圖 預(yù)處理過程 去噪 我們得到的原始圖像應(yīng)書寫風(fēng)格的不同,外部環(huán)境的影響往往存在個別的孤立點,這就是我們說的噪音。 對 C 進行濾波前后的對比如下圖: 濾波前 濾 波后 圖 手寫字符濾波前后比對圖 二值化 在數(shù)字圖像的處理當(dāng)中,二值圖像有著非常重要的地位。也就是轉(zhuǎn)換成唯一的標準形式以抵抗仿射變換。 (4)細化后的圖像要有效地保留原圖像的核心骨架結(jié)構(gòu),比如保留細化前圖像的拓撲結(jié)構(gòu)等。本文為了對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練以后提高字符的識別率。因此,以粗網(wǎng)格為特征進行數(shù)字識別,具有較好的正確識別率。規(guī)整化的字符以 N N 的點陣表示,在這里 N 為 32。各神經(jīng)元之間的連接強度和極性有所不同,并且都可調(diào)整、基于這一特性,人腦具有存儲信息 的功能。各個輸出值由于其連接權(quán)值的不同而被放大或縮小。 如圖 所示拓撲結(jié)構(gòu)的單隱層(隱含層只有一層)前饋網(wǎng)絡(luò),通常稱為三層前向反饋神經(jīng)網(wǎng)絡(luò),即:輸入層、中間層、隱含層及輸出層。如果隱含層節(jié)點數(shù)過少的話,可能導(dǎo)致網(wǎng)絡(luò)不能進行訓(xùn)練或?qū)е戮W(wǎng)絡(luò)性能變差;如果隱層節(jié)點數(shù)過多,雖然能夠使的神經(jīng)網(wǎng)絡(luò)的整體系統(tǒng)誤差降低,但它不僅延長了神經(jīng)網(wǎng)絡(luò)訓(xùn)練時間,且容易在訓(xùn)練過程中陷入局部極小值點而無法得到最優(yōu)點, 甚至不能收斂,網(wǎng)絡(luò)的容錯能力差, 往往使得其反,這也是訓(xùn)練時網(wǎng)絡(luò)出現(xiàn)“過擬合的原因。學(xué)習(xí)速率太大會導(dǎo)致系統(tǒng)不穩(wěn)定,學(xué)習(xí)速率太小將導(dǎo)致訓(xùn)練時間延長使的收斂很慢,但是可以保證網(wǎng)絡(luò)的誤差值跳不出誤差范圍,使的訓(xùn)練結(jié)果趨于最小誤差值。 ( ) m:輸入節(jié)點數(shù); n:輸出節(jié)點數(shù); c:介于 1~ 10 的常數(shù)。本文是對 26 個英文字母進行識別所以確定輸出層的節(jié)點數(shù)就是 26 個。這說明網(wǎng)絡(luò)對這兩個模式的學(xué)習(xí)是成功的自學(xué)習(xí)后 BP 神經(jīng)網(wǎng)絡(luò)自身已將這兩個模式分布地記憶在網(wǎng)絡(luò)的各個連接權(quán)值上。 BP 網(wǎng)絡(luò)有師學(xué)習(xí)方式需要設(shè)定期望值和無師學(xué)習(xí)方式只需輸入模式之分。但是對于神經(jīng)細胞的來說比較特殊,具有許 多的個性突起,所以把神經(jīng)元細胞為細胞體、樹突、軸突三個部分(如 圖 )。 圖 八個掃描方向 本文采用筆劃 密度的方式訓(xùn)練特征;從水平和垂直方向掃描數(shù)字,計算掃描線和字符相交的次數(shù),即筆劃密度特征向量。 本文采取的粗網(wǎng)格特征提取 的核心思想是,把字符的 二值像素矩陣分成 16個局部區(qū)域, 把每個 區(qū)域上的點陣密度作為一個特征,統(tǒng)計每個區(qū)域字符象素占的百分比作為特征向量 [18]。這里提到的統(tǒng)計特征應(yīng)對同一類字符的形變最大化的保持不變。 細化就是就是在保留原始圖像的拓撲結(jié)構(gòu)的基礎(chǔ)上盡可能的消去二值圖像邊緣的像素將待識別字符的寬度減少為 1,即為單像素寬度,這個過程就是字符的細化。把圖像中的像素按灰度級閥值 T分成兩大類 C0和 C1C0=( 0、 1……T ) C1=(T、 T+1……255) 若用 σ 2w 、σ 2B、σ 2T表示 示類內(nèi)、類間和總體建立三個函數(shù)式 [11]: ???22WB? ??? 22TB? ??? 22WT? ( ) 則最優(yōu)值 ?2max rg BAT ? ( ) TE{ 0,1,L?1} 運用這種方法計算簡單,穩(wěn)定且有效,是實際應(yīng)用中經(jīng)常采用的方法之一。它在平滑去除噪聲方面十分有效 ,并且 它能夠保護圖像尖銳的邊緣。 濟南大學(xué)泉城學(xué)院畢
點擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1