freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于bp神經(jīng)網(wǎng)絡(luò)的字母識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)(專業(yè)版)

2024-10-03 21:34上一頁面

下一頁面
  

【正文】 本文采用了式( ) 來確 定隱含層的節(jié)點(diǎn)數(shù)為 40(其中 c取 7) ,并加以訓(xùn)練結(jié)果識(shí)別率達(dá)到期望的結(jié)果 , 因此最終確定為 40. 各層節(jié)點(diǎn)確定之后就確定了本文采用的 BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如 圖 所示: 濟(jì)南大學(xué)泉城學(xué)院畢業(yè)論文 25 圖 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖 BP 神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)計(jì)和訓(xùn)練過程 [17] BP 神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置直接影響到最后的識(shí)別結(jié)果決定著網(wǎng)絡(luò)設(shè)計(jì)的好壞,有著重要的意思。保證輸出結(jié)果的可靠性,指定位置輸出為 1 其余位置為 0,我們期望的輸出形式見附錄。 一般情況下,網(wǎng)絡(luò)中所含的神經(jīng)元的個(gè)數(shù)與其能記憶、識(shí)別 的模式是成正比的。 BP神經(jīng)網(wǎng)絡(luò)由三層節(jié)點(diǎn)集合組成:輸入層、輸出層、隱含層。樹突是作為引入輸入信號(hào)的突起,而軸突是作為輸出端的突起。 外輪廓特征提取 英文字母的外輪廓特征能夠很好的反映出字符的整體結(jié)構(gòu)和特征,提取輪廓特征時(shí)。 粗網(wǎng)格特征反映的是字符的局部特征,是個(gè)百分比相對(duì)值,對(duì)于本文圖像局部的形變或噪聲對(duì)應(yīng)二值化的數(shù)字點(diǎn)陣就是局部元素的 1 的值,如果圖像帶有局部的形變或著噪音,與沒有形變和噪聲的平滑圖像相比來說,因?yàn)橐粋€(gè)比較大的分母,計(jì)算出來的百分比相對(duì)值變化不是不大。本文用到了像素百分比的全局特征和粗網(wǎng)格的局部特征提取。 (2)細(xì)化算法不應(yīng)該去除重要點(diǎn)例如拐點(diǎn)。將每個(gè)數(shù)字圖像統(tǒng)一到同一的高度和寬度,這就是圖像的歸一化。如果是用在要求識(shí)別速度快但對(duì)正確率要求必是很高的場(chǎng)合我們可以選擇運(yùn)用均值濾波的方式,如果使用在要求高正確率的場(chǎng)合,比如銀行、金融業(yè),我們就必須運(yùn)用中值濾波來實(shí)現(xiàn)。因此預(yù)處理過程的效果會(huì)對(duì)特征的提取、數(shù)字識(shí)別產(chǎn)生重要的影響。由于與很多因素有關(guān),比如作者的書寫習(xí)慣、掃描的質(zhì)量、識(shí)別運(yùn)用的 算法、學(xué)習(xí)與訓(xùn)練的樣本等,都可能影響識(shí)別正確率,所以 BP 神經(jīng)網(wǎng)絡(luò)產(chǎn)品不但需要一個(gè)核心技術(shù),產(chǎn)品的操作使用方便性、所提供的除錯(cuò)功能及方法,也是決定產(chǎn)品好壞的重要因素 [9]。 [31] 對(duì)模式的統(tǒng)計(jì)分類方法,即把模式類看成是用某個(gè)隨機(jī)向量實(shí)現(xiàn)的集合,又稱為決策理論識(shí)別方 法。 1984 年,他又提出了連續(xù)時(shí)間 Hopfield神經(jīng)網(wǎng)絡(luò)模型,為神經(jīng)計(jì)算機(jī)的研究做了開拓性的貢獻(xiàn),開創(chuàng)了神經(jīng)網(wǎng)絡(luò)用于聯(lián)想記憶和優(yōu)化計(jì)算的全新的途徑,有力地推動(dòng)了神經(jīng)網(wǎng)絡(luò)的研究發(fā)展, 1985 年,又有學(xué)者提出了波耳茲曼模型,在學(xué)習(xí)中采用統(tǒng)計(jì)熱力學(xué)模擬退火技術(shù),保證整個(gè)系統(tǒng)趨于全局的穩(wěn)定點(diǎn)在日本的“真實(shí)世界計(jì)算”項(xiàng)目中,人工智 能的研究成了一個(gè)重要的組成部分??焖俑咝У貙⒆帜篙斎擞?jì)算機(jī),是信息處理的一個(gè)關(guān)鍵問題。第二,具有聯(lián)想存儲(chǔ)功能 。 用人工神經(jīng)網(wǎng)絡(luò)的反饋網(wǎng)絡(luò) 在字母識(shí)別時(shí) 可以實(shí)現(xiàn)這種聯(lián)想 。人工鍵入速度慢而且勞動(dòng)強(qiáng)度大,對(duì)于大量已有的文檔資料,英文自動(dòng)識(shí)別輸人就成為了最佳的選擇。 [1] 我國(guó)在識(shí)別領(lǐng)域的研究起步較晚,在 20 世紀(jì) 70 年代才開始對(duì)符號(hào)、字母、數(shù)字進(jìn)行識(shí)別 研究,對(duì)漢字的識(shí)別研究開始于 70 年代末期,到 86 年我國(guó)漢字的識(shí)別研究進(jìn)人一個(gè)跨越性的時(shí)期,并取得了豐碩成果,并相繼推出了許多中文識(shí)別的實(shí)用產(chǎn)品。屬于同一類別的各個(gè)模式之間的差異,部分是由環(huán)境噪聲和傳感器的性質(zhì)所引起的,部分是模式本身所具有的隨機(jī)性質(zhì)。 論文組織結(jié)構(gòu) 手寫字母識(shí)別是指利用 BP 神經(jīng)網(wǎng)絡(luò)辨認(rèn)手寫英文字母的一種技術(shù),它屬于OCR 范疇。 本文采用的的字母圖像的預(yù)處理過程:去噪、二值化、歸一化和細(xì)化 。本文要求較高的識(shí)別率選用了中值濾波來實(shí)現(xiàn)英文字母的識(shí)別。 基本上歸一化思想是利用圖像的不變矩尋找一組參數(shù)使其能夠消除其他變換函數(shù)對(duì)圖像變換的影響。 (3)算法不應(yīng)該對(duì)噪聲敏感,即當(dāng)待識(shí)字符邊界上出現(xiàn)噪聲時(shí),對(duì)細(xì)化結(jié)果不產(chǎn)生影響。 一個(gè) 好的識(shí)別系統(tǒng) ,應(yīng)該符合以下條件 : (1) 具有較好的平移不變性、旋轉(zhuǎn)不變性和尺度不變性; (2) 穩(wěn)定性好,具有較好的抗噪能力; (3)具有較好的類內(nèi)一致性和類間區(qū)分度。換句話說,這個(gè) 百分比相對(duì)值對(duì)于二值化圖片局部筆劃的變形或孤立的噪聲點(diǎn)帶來的影響不是很大。從歸一化的字符中直導(dǎo)出字符的邊緣輪廓。 圖 神經(jīng)元 每個(gè)神經(jīng)元的突觸數(shù)目正常,最高可達(dá) 10 個(gè)。每一層節(jié)點(diǎn)的輸出結(jié)果送到下一層節(jié)點(diǎn)。但是神經(jīng)元的個(gè)數(shù)也不可以太多否則影響其是別的速度過多的神經(jīng)元也容易出錯(cuò),所以神經(jīng)元也不可以太多。 隱含層節(jié)點(diǎn)數(shù)的優(yōu)化確定 隱含層的節(jié)點(diǎn)數(shù)的確定目前為止在世界 上還沒有一個(gè)固定的算法。下面是一些參數(shù)的設(shè)計(jì): 每迭代 50 步顯示一次訓(xùn)練結(jié)果 . trainParam. show=5 0: 學(xué)習(xí)速率決定著每一 次循環(huán)訓(xùn)練中所產(chǎn)生的權(quán)值的變化量地大小。 隱含層節(jié)點(diǎn)的選擇不僅僅是一種方法來決定,我們可以結(jié)合多種方法進(jìn)行選擇,在通過 BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練來最終確定隱含層的節(jié)點(diǎn) [25]。本文的設(shè)計(jì)思想是希望 26 個(gè)輸出節(jié)點(diǎn)對(duì)應(yīng)位置上的輸出是 1,而其他位 置上的輸出為 0,一次對(duì)應(yīng)著 AZ26 個(gè)英文字母,輸入特征的影響或是訓(xùn)練次數(shù)較低以及訓(xùn)練過程中的噪聲影響可能會(huì)導(dǎo)致輸出結(jié)果不是 1 或 0 而出現(xiàn)其他的值,入 、 、 、 等一系列的值不符合設(shè)計(jì)的要求 為了使網(wǎng)絡(luò)具有一定的適應(yīng)環(huán)境的能力將其輸出結(jié)果用網(wǎng)絡(luò)函數(shù) 處理,相當(dāng)于曾加一個(gè)閥值比如說是 ,則大于 輸出為 1,小于 輸出為0。當(dāng)網(wǎng)絡(luò)再次遇到其中任何一個(gè) A 或 B 模式時(shí),能夠作出迅速、準(zhǔn)確的判斷進(jìn)行識(shí)別 [22]。自學(xué)習(xí)模型為: )()1( nan wwijiij ????? ?? ( ) 濟(jì)南大學(xué)泉城學(xué)院畢業(yè)論文 21 h 為學(xué)習(xí)因子; Фi為輸出節(jié)點(diǎn) i 的計(jì)算誤差; Oj為輸出節(jié)點(diǎn) j 的計(jì)算輸出; a為動(dòng)量因子 知道了 BP神經(jīng)網(wǎng)絡(luò)的各結(jié)構(gòu)模型我們進(jìn)一步建立本文所用到的 BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu), 如 圖 所示。突起的作用就是用其來傳遞信息。對(duì) 32*32 灰度圖在水平方向上從上至下每 4 行掃描一次,提取 8 個(gè)特征, 900方向每隔 4 行掃描一次,形成 8+8=16濟(jì)南大學(xué)泉城學(xué)院畢業(yè)論文 18 個(gè)的特征值。針對(duì) 32 32 的點(diǎn)陣,我 劃分成大小為 4 4 的 16 個(gè)小區(qū)域(如 圖 ),因此,共得出一個(gè)十六維的粗網(wǎng)格特征值 ( 如表 ) 。統(tǒng)計(jì)征可以分為全局特征和局部特整。 對(duì)字符進(jìn)行細(xì)化的過程當(dāng)中我們選取算法是要有一定的準(zhǔn)則: (1)細(xì)化算法不應(yīng)該改變待識(shí)字符的連續(xù)性。 我們用這種方法確定了閾值是 ,如圖 : 二值化前 二值化后 圖 值化前后圖像 對(duì)于我們要鑒定的字 母二值化前后 的字母矩陣 是什么變化呢? 以 125為閾 值舉例, 運(yùn)行程序后字母矩陣得到如下表結(jié)果 濟(jì)南大學(xué)泉城學(xué)院畢業(yè)論文 10 表 字母二值化前后的矩陣 ( a)二值化前 (b)二值化后 45 78 221 78 90 47 217 85 234 0 48 128 178 127 29 128 26 4 90 179 94 124 93 87 1 歸一化 我們所要鑒定的字符的大小規(guī)格不盡相同, 這對(duì)后續(xù)英文字母的特征提取,識(shí)別操作環(huán)節(jié)會(huì)造成一定的障礙。所以均值濾波和中值濾波都有各自的利與弊,選用哪一種濾波方式這要看我們對(duì)識(shí)別的要求。 圖 系 統(tǒng)的識(shí)別框架圖 預(yù)處理概述 在進(jìn)行手寫英文字母識(shí)別時(shí)需要對(duì)所得到的手寫英文字母圖像提前進(jìn)行預(yù)處理,不同地域的人在書寫英文字母的過程中的書寫風(fēng)格不盡相同即使是同一地域的人由于山谷寫的任意性也會(huì)造成手寫字母的形式千變?nèi)f化,令外數(shù)字圖像在采集過程中,受圖像質(zhì)量、掃描性能的影響,數(shù)字圖像會(huì)帶有形變和噪聲,這些變化都會(huì)影響英文字母的識(shí)別效果,預(yù)處理的目的是消除原始圖像中的噪聲,將原來的圖像轉(zhuǎn)化為清晰的二值化圖像,便于對(duì)手寫字母的微觀結(jié)構(gòu)特征的提取。對(duì)神經(jīng)網(wǎng)絡(luò)的研究目前許多技術(shù)不能確定,正確率永遠(yuǎn)達(dá)不到 100%,只能靠近,它們之間進(jìn)行著拉鋸戰(zhàn)。而“模式識(shí)別”則是在某些一定量度或觀測(cè)基礎(chǔ)上把待識(shí)模式劃分到各自的模式類中去。 1982 年,美國(guó)加州工物理學(xué)院 提出了 Hopfield 神經(jīng)網(wǎng)格模型,引入了“計(jì)算能量”的概念,給出了網(wǎng)絡(luò)穩(wěn)定性判斷。 英語 是 世界上使用人數(shù)最多的文字之一。 字 母識(shí)別時(shí) ,只在先把許多不同的圖像樣板和對(duì)應(yīng)的應(yīng)識(shí)別的結(jié)果輸入人工神經(jīng)網(wǎng)絡(luò), 然后在 識(shí)別之前 對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練形成穩(wěn)定的權(quán)值 這樣 網(wǎng)絡(luò) 通過自學(xué)習(xí)功能,慢慢學(xué)會(huì)識(shí)別類似的圖像。 第三,具有高速尋找優(yōu)化解的能力。它在英文信息處理、辦公室自動(dòng)化、機(jī)器翻譯、人工智能等高技術(shù)領(lǐng)域,都有著重要的實(shí)用價(jià)值和理論意義。我國(guó)的許多研究部門在 80 年代初期就開始對(duì)字符識(shí)別進(jìn)行研究,從 80 年代開始,神經(jīng)網(wǎng)絡(luò)的識(shí)別研究開發(fā)就一直受到國(guó)家“ 863”計(jì)劃的資助與支持,并已經(jīng)有了初步的回報(bào)。前者如紙的質(zhì)量、墨水、污點(diǎn)對(duì)書寫字符的影響;后者表現(xiàn)為同一個(gè)人書寫同一字符時(shí),雖形狀相似,但不可能完全一樣?;?BP 網(wǎng)絡(luò)的手寫英文字母識(shí)別包括兩個(gè)階段:一個(gè)是訓(xùn)練階段和一個(gè)是識(shí)別階段,這兩個(gè)階段包含輸入、預(yù)處理、特征提取、分類及輸出五個(gè)部分。 本文預(yù)處理設(shè)計(jì) 本章的預(yù)處理過程的設(shè)計(jì) 如 圖 : 樣本字母 預(yù)處理 特征提取 訓(xùn)練模式 待識(shí)字母 預(yù)處理 特征提取 分類 結(jié)果輸出 學(xué)習(xí)階段 識(shí)別階段 濟(jì)南大學(xué)泉城學(xué)院畢業(yè)論文 7 圖 預(yù)處理過程 去噪 我們得到的原始圖像應(yīng)書寫風(fēng)格的不同,外部環(huán)境的影響往往存在個(gè)別的孤立點(diǎn),這就是我們說的噪音。 對(duì) C 進(jìn)行濾波前后的對(duì)比如下圖: 濾波前 濾 波后 圖 手寫字符濾波前后比對(duì)圖 二值化 在數(shù)字圖像的處理當(dāng)中,二值圖像有著非常重要的地位。也就是轉(zhuǎn)換成唯一的標(biāo)準(zhǔn)形式以抵抗仿射變換。 (4)細(xì)化后的圖像要有效地保留原圖像的核心骨架結(jié)構(gòu),比如保留細(xì)化前圖像的拓?fù)浣Y(jié)構(gòu)等。本文為了對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練以后提高字符的識(shí)別率。因此,以粗網(wǎng)格為特征進(jìn)行數(shù)字識(shí)別,具有較好的正確識(shí)別率。規(guī)整化的字符以 N N 的點(diǎn)陣表示,在這里 N 為 32。各神經(jīng)元之間的連接強(qiáng)度和極性有所不同,并且都可調(diào)整、基于這一特性,人腦具有存儲(chǔ)信息 的功能。各個(gè)輸出值由于其連接權(quán)值的不同而被放大或縮小。 如圖 所示拓?fù)浣Y(jié)構(gòu)的單隱層(隱含層只有一層)前饋網(wǎng)絡(luò),通常稱為三層前向反饋神經(jīng)網(wǎng)絡(luò),即:輸入層、中間層、隱含層及輸出層。如果隱含層節(jié)點(diǎn)數(shù)過少的話,可能導(dǎo)致網(wǎng)絡(luò)不能進(jìn)行訓(xùn)練或?qū)е戮W(wǎng)絡(luò)性能變差;如果隱層節(jié)點(diǎn)數(shù)過多,雖然能夠使的神經(jīng)網(wǎng)絡(luò)的整體系統(tǒng)誤差降低,但它不僅延長(zhǎng)了神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間,且容易在訓(xùn)練過程中陷入局部極小值點(diǎn)而無法得到最優(yōu)點(diǎn), 甚至不能收斂,網(wǎng)絡(luò)的容錯(cuò)能力差, 往往使得其反,這也是訓(xùn)練時(shí)網(wǎng)絡(luò)出現(xiàn)“過擬合的原因。學(xué)習(xí)速率太大會(huì)導(dǎo)致系統(tǒng)不穩(wěn)定,學(xué)習(xí)速率太小將導(dǎo)致訓(xùn)練時(shí)間延長(zhǎng)使的收斂很慢,但是可以保證網(wǎng)絡(luò)的誤差值跳不出誤差范圍,使的訓(xùn)練結(jié)果趨于最小誤差值。 ( ) m:輸入節(jié)點(diǎn)數(shù); n:輸出節(jié)點(diǎn)數(shù); c:介于 1~ 10 的常數(shù)。本文是對(duì) 26 個(gè)英文字母進(jìn)行識(shí)別所以確定輸出層的節(jié)點(diǎn)數(shù)就是 26 個(gè)。這說明網(wǎng)絡(luò)對(duì)這兩個(gè)模式的學(xué)習(xí)是成功的自學(xué)習(xí)后 BP 神經(jīng)網(wǎng)絡(luò)自身已將這兩個(gè)模式分布地記憶在網(wǎng)絡(luò)的各個(gè)連接權(quán)值上。 BP 網(wǎng)絡(luò)有師學(xué)習(xí)方式需要設(shè)定期望值和無師學(xué)習(xí)方式只需輸入模式之分。但是對(duì)于神經(jīng)細(xì)胞的來說比較特殊,具有許 多的個(gè)性突起,所以把神經(jīng)元細(xì)胞為細(xì)胞體、樹突、軸突三個(gè)部分(如 圖 )。 圖 八個(gè)掃描方向 本文采用筆劃 密度的方式訓(xùn)練特征;從水平和垂直方向掃描數(shù)字,計(jì)算掃描線和字符相交的次數(shù),即筆劃密度特征向量。 本文采取的粗網(wǎng)格特征提取 的核心思想是,把字符的 二值像素矩陣分成 16個(gè)局部區(qū)域, 把每個(gè) 區(qū)域上的點(diǎn)陣密度作為一個(gè)特征,統(tǒng)計(jì)每個(gè)區(qū)域字符象素占的百分比作為特征向量 [18]。這里提到的統(tǒng)計(jì)特征應(yīng)對(duì)同一類字符的形變最大化的保持不變。 細(xì)化就是就是在保留原始圖像的拓?fù)浣Y(jié)構(gòu)的基礎(chǔ)上盡可能的消去二值圖像邊緣的像素將待識(shí)別字符的寬度減少為 1,即為單像素寬度,這個(gè)過程就是字符的細(xì)化。把圖像中的像素按灰度級(jí)閥值 T分成兩大類 C0和 C1C0=( 0、 1……T ) C1=(T、 T+1……255) 若用 σ 2w 、σ 2B、σ 2T表示 示類內(nèi)、類間和總體建立三個(gè)函數(shù)式 [11]: ???22WB? ??? 22TB? ??? 22WT? ( ) 則最優(yōu)值 ?2max rg BAT ? ( ) TE{ 0,1,L?1} 運(yùn)用這種方法計(jì)算簡(jiǎn)單,穩(wěn)定且有效,是實(shí)際應(yīng)用中經(jīng)常采用的方法之一。它在平滑去除噪聲方面十分有效 ,并且 它能夠保護(hù)圖像尖銳的邊緣。 濟(jì)南大學(xué)泉城學(xué)院畢
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1