freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于vc的數(shù)字識別系統(tǒng)的論文-資料下載頁

2025-06-27 19:09本頁面
  

【正文】 元輸出求實際輸出與目標值的偏差ee滿足要求?計算隱層誤差單元求梯度誤差權(quán)值調(diào)整全部e滿足?結(jié)束Y NN Y 圖44 BP算法流程圖BP算法在數(shù)字識別中的應(yīng)用流程圖: 采樣數(shù)據(jù)輸入判斷語句映射關(guān)系初步的神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)結(jié)束?學(xué)習(xí)樣本穩(wěn)態(tài)時的神經(jīng)網(wǎng)絡(luò)模型輸出判斷語句輸入屬于給定設(shè)計空間的新的輸入變量集 圖45 BP算法在數(shù)字識別中的應(yīng)用 BP神經(jīng)網(wǎng)絡(luò)的設(shè)計將要識別的目標是從0到9的10個數(shù)字字符。每個字符被分成8*8的小塊進行數(shù)字化,分別用一個向量來表示。10個含64個元素的輸入向量被定義為一個輸入向量矩陣,向量代表某個數(shù)字,其相應(yīng)有數(shù)的位置值為1,而其他位置值為0。共有兩類這樣的數(shù)據(jù)作為輸入:一類是在理想的狀態(tài)下的信號。另一類是隨機方式生成含有噪聲的信號。如圖46所示。圖46 理想信號(上) 含有噪音的信號(下)網(wǎng)絡(luò)通過輸出一個具有10個元素的輸出向量來區(qū)分這些數(shù)字字符,例如字符1對應(yīng)的向量,其第一個位置的元素值為1,而隨后位置的元素值都是0。確定好輸入輸出后可進行網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計。第1層為輸入層,根據(jù)以待識別的數(shù)據(jù)分析可確定神經(jīng)網(wǎng)絡(luò)輸入層有64個節(jié)點。第2層為隱含層,一般依靠經(jīng)驗和嘗試的方法來確定節(jié)點數(shù)目,第3層為輸出層,由目標輸出為含有10個數(shù)據(jù)的向量可知該層有10個節(jié)點。選擇了開發(fā)環(huán)境就要設(shè)計網(wǎng)絡(luò)。設(shè)計訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)能夠識別10個數(shù)字字母的網(wǎng)絡(luò),意味著每當給訓(xùn)練過的網(wǎng)絡(luò)一個表示某一數(shù)字的輸入時,網(wǎng)絡(luò)能夠正確地在輸出指出該數(shù)字,那么很顯然,該網(wǎng)絡(luò)記憶住了所有10個數(shù)字。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練應(yīng)當是有監(jiān)督地訓(xùn)練出輸入端的10組分別表示數(shù)字0到9的數(shù)組,能夠?qū)?yīng)出輸出端0到9的具體的位置。首先必須將每個數(shù)字進行數(shù)字化處理,以便構(gòu)造輸入樣本。,但經(jīng)過大量的試驗表明,這兩種編碼方式的抗干擾性能不佳。,對于數(shù)字0,可以編碼為:0011111000100010001000100010001000100010001000100010001000111110這樣很容易確定該BP網(wǎng)絡(luò)的輸入為64維.當數(shù)字數(shù)據(jù)混入噪聲時,可以看作是對0,,要加入7%的噪聲,那就可以對4個0或者1進行反轉(zhuǎn),翻轉(zhuǎn)哪一個這里是隨即的.經(jīng)過干擾后0的編碼為:0011111000100010001000100010011000100010001000100011101100111110圖中,斜體部分就是噪聲.另外一個很重要的需要考慮的因素是:所要設(shè)計的網(wǎng)絡(luò)應(yīng)當具有抗干擾能力,即設(shè)計出的網(wǎng)絡(luò)應(yīng)當能夠處理嗓聲。具有在由一定不規(guī)范的輸入情況下辨識出正確的數(shù)字輸入的能力。 之間變化的隨機值。,因為09共10個數(shù)字, 個神經(jīng)元。遵循一般的,這里不在贅述。 BP神經(jīng)網(wǎng)絡(luò)的實現(xiàn)設(shè)計了BP神經(jīng)網(wǎng)絡(luò),有64個輸入層,10個輸出層,激活函數(shù)使用Sigmoid函數(shù)。接下來就要確定網(wǎng)絡(luò)的具體參數(shù)以實現(xiàn)最終的結(jié)果。隱層神經(jīng)元數(shù)目的確定,是BP算法設(shè)計的關(guān)鍵, 一般來說,在做類似于函數(shù)逼近的課題時,隱層的神經(jīng)元越多,,隱層神經(jīng)元的數(shù)目必須要適當?shù)倪x取,即不能過多也不能過少,如果隱層的神經(jīng)元過多,一來會大大的加大訓(xùn)練時間,二來,雖然神經(jīng)元的增多可以更加精確的描述分類判別的空間的界限,但同時,也造成網(wǎng)絡(luò)的容錯能力下降。,神經(jīng)元數(shù)目過少的時候,當隱層神經(jīng)元數(shù)目超過25的時候,網(wǎng)絡(luò)的訓(xùn)練時間將無法忍受,同時抗噪聲能力大大降低。當神經(jīng)元數(shù)目低于5時,系統(tǒng)誤差無法收斂到滿意的值,又造成識別率過低。 經(jīng)過反復(fù)的試驗測定,對比,我認為隱層的神經(jīng)元的數(shù)目為815為佳。小于8個神經(jīng)元的時候,網(wǎng)絡(luò)輸出誤差就太大了,大于15個神經(jīng)元的時候,識別率又過低。系統(tǒng)誤差是系統(tǒng)進行訓(xùn)練的目標。當系統(tǒng)的輸出誤差小于這個允許的誤差的時候即停止訓(xùn)練。誤差選擇過大,將造成系統(tǒng)識別率過低。誤差選擇過小,會大大延長訓(xùn)練時間,是一種浪費。這里,也要通過多次的比較分析得到最佳的允許誤差。訓(xùn)練步長的選擇也是BP網(wǎng)絡(luò)設(shè)計的關(guān)鍵所在. 訓(xùn)練步長過長,則可能造成算法無法收斂。步長過短,一來加大了訓(xùn)練時間,二來很容易陷入所謂的局部極小值。 識別系統(tǒng)運行的結(jié)果本系統(tǒng)軟件是基于VC++,便于將數(shù)據(jù)的管理和顯示隔離開來,其界面如下圖47。能完成圖像預(yù)處理、訓(xùn)練網(wǎng)絡(luò)、字符識別等等。識別前先要確定歸一化的長度和寬度,還要設(shè)定BP訓(xùn)練網(wǎng)絡(luò)的參數(shù),界面如圖449所示。圖46 識別的界面 圖47 歸一化界面 圖48 網(wǎng)絡(luò)參數(shù)設(shè)置框 系統(tǒng)設(shè)計中遇到的問題與結(jié)果分析數(shù)字圖像規(guī)格化中如何確定規(guī)格化后數(shù)字的長寬取值是一個重要的問題。若長寬取得過小,規(guī)則化后的字符圖像容易變形;相反取得過大,則使得后期的模板匹配和神經(jīng)網(wǎng)絡(luò)的特征提取量增加,另外長寬還要滿足一定的比例。在設(shè)計中我選擇的長寬比例為2:1。數(shù)字圖像識別網(wǎng)絡(luò)中如何確定網(wǎng)絡(luò)隱層個數(shù)也是一個重要的問題。隱層個數(shù)取的不對就可能訓(xùn)練不出來,導(dǎo)致識別結(jié)果也不正確。在設(shè)計中我選擇10個隱層不變。圖像的去噪濾波問題。噪聲在圖像中不可避免,整個系統(tǒng)中有幾次需要對圖像進行降噪處理,例如二值化處理后,字符圖像切分之前的降噪處理等。針對不同的情況采用了不同降噪的方法,如二值化后為了消除大量的斑點噪聲而采用數(shù)學(xué)形態(tài)學(xué)的運算一方面完成降噪處理另一方面有利于后期定位分割處理。參數(shù)的設(shè)置問題。識別結(jié)果總是不盡理想,由于參數(shù)設(shè)置的不同,結(jié)果總是有差異,經(jīng)總結(jié)設(shè)置的誤差越小,相關(guān)系數(shù)越小,訓(xùn)練樣本的次數(shù)越多,當識別數(shù)字時的結(jié)果就越正確。當系數(shù)設(shè)置不好時,如誤差過小,或相關(guān)系數(shù)過小,會導(dǎo)致訓(xùn)練時間過長或者網(wǎng)絡(luò)訓(xùn)練陷入死循環(huán),訓(xùn)練不出來。由于這是一個10類數(shù)字區(qū)分問題,最終決定使用十個隱層,.訓(xùn)練網(wǎng)絡(luò)的問題。在數(shù)字識別時,要先訓(xùn)練網(wǎng)絡(luò),但系統(tǒng)中網(wǎng)絡(luò)的訓(xùn)練不能一次到位,基本上訓(xùn)練一次網(wǎng)絡(luò)之后最進的幾次識別精度比較高,當識別幾次之后,精度就在不斷下降。這是一個未解決的問題??傊?,這個系統(tǒng)的識別結(jié)果有的時候不是很穩(wěn)定,如不同的數(shù)字設(shè)置的參數(shù)就要不同,不能用同一個參數(shù)對所有的數(shù)字都達到很高的識別精度。但系統(tǒng)總的識別正確率在90%左右。這個系統(tǒng)還有很多不完善的地方,還有待于利用更好的算法進行改進。 系統(tǒng)設(shè)計的調(diào)試與心得這是我第一次采用面向?qū)ο缶幊蹋睦锔杏|頗多,也第一次真正體會到VC++功能的強大,用戶界面設(shè)計簡單高效,強大的類庫支持,調(diào)試功能的強大,它采用斷點技術(shù)動態(tài)跟蹤程序的運行,極大地方便了程序員及時了解內(nèi)存變化情況、變量值現(xiàn)況及每個語句對變量所產(chǎn)生的影響,其單步運行方式便于程序員及時準確的發(fā)現(xiàn)某些潛伏性的錯誤并現(xiàn)場更正。提高程序效率。程序的效率包括兩個方面一是時間效率,另一個是空間效率。程序的時間效率是指運行速度,空間效率是指程序占用內(nèi)存或者外存的狀況。提高程序效率先要優(yōu)化數(shù)據(jù)結(jié)構(gòu)和算法,在優(yōu)化執(zhí)行代碼,在本程序中構(gòu)造CDib類封裝數(shù)據(jù)成員和成員函數(shù)使得操作DIB位圖簡捷明了。有時候時間效率和空間效率可能對立,此時應(yīng)當分析哪個更為重要,做出適當?shù)恼壑?。如有時需要多花費些內(nèi)存來提高性能,同時不要一味地追求程序的效率,應(yīng)當在滿足正確性、可靠性、健壯性、可讀性等質(zhì)量因素的前提下,設(shè)法提高程序的效率。編程的規(guī)范化。這包括命名和程序書寫的規(guī)范。命名規(guī)范是由于Windows的程序一般很長,容易忘記所有變量的含義,為了幫助記憶,Windows中有個約定叫做匈牙利表示法(Hungarian notation).該命名規(guī)則的主要思想是“在變量和函數(shù)名中加入前綴以增進人們對程序的理解”。例如所有字符變量前均加ch前綴,若是整型變量則追加i的前綴。程序中不要出現(xiàn)標識符完全相同的局部變量和全局變量,容易使人誤解等,也要盡量避免名字中出現(xiàn)數(shù)字編號。程序書寫版式雖然不會影響程序的功能,但會影響可讀性,程序的版式追求清晰、美觀,是程序風(fēng)格的重要構(gòu)成因素。面向?qū)ο蟪绦蛟O(shè)計的優(yōu)勢。C++是一種面向?qū)ο蟪绦蛘Z言主要有封裝性(Encapsulation)、繼承性(Inheritance)、多態(tài)性(Polymorphism)等特點。封裝把數(shù)據(jù)與操作結(jié)合成一體,使程序結(jié)構(gòu)更加緊湊,同時避免了數(shù)據(jù)紊亂帶來的調(diào)試與維護的困難。繼承增強了軟件的可擴充性,并為代碼重用提供了強有力的手段。多態(tài)性使程序員在設(shè)計程序時可以對問題進行更好的抽象,以設(shè)計出實用性和維護性俱佳的程序,這些都顯示了強大的優(yōu)越性。敢于嘗試。沒有任何一個程序員從剛開始設(shè)計程序時就萬事精通,程序完美無缺,都是在不斷修改錯誤的基礎(chǔ)上不斷進步的。剛開始按照流程圖系統(tǒng)設(shè)計時,設(shè)計的切入點都找不到,將所有的東西都羅列起來,一團亂麻,一切都由摸索開始的。先從小的程序做起,一點點的做大,思維就會越來越開闊。有時候一個錯誤會困擾我很長時間,只有不斷的想新方法去嘗試最終都會得到解決,經(jīng)驗就在一次次克服錯誤中不斷豐富。第5章數(shù)字識別的發(fā)展與應(yīng)用數(shù)字識別有著極為廣泛的應(yīng)用前景,這也正是它受到世界各國的研究工作者重視的一個主要原因。下面我將介紹基于數(shù)字識別的應(yīng)用系統(tǒng)的特殊要求,以及一些以數(shù)字識別技術(shù)為基礎(chǔ)的典型應(yīng)用。 基于數(shù)字識別的應(yīng)用系統(tǒng)的特殊要求盡管數(shù)字識別與一般的文本(如:漢字,英文等)識別同屬于光學(xué)識別(OCR)的大范疇,從應(yīng)用的角度出發(fā),數(shù)字識別系統(tǒng)有很多特殊的要求:識別精度要達到較高的水平在一般的文本識別中,信息的冗余較大,有充分的上下文信息,因而對識別的精度要求不是十分高9699%就足夠了。而在數(shù)字識別中,由于沒有上下文關(guān)系,數(shù)據(jù)中的每一位數(shù)字都至關(guān)重要(試想:在財務(wù)報表中,把40,000元認成90,000元,從字符的角度僅認錯了一個數(shù)字,但對用戶而言,這是一個絕對不能容許的錯誤)。%以上。前面己經(jīng)提到,高性能的自由數(shù)字識別是一個很困難的問題,至今為止還沒有什么方法能與人的辨識能力相比,那么在目前的技術(shù)水平下,為了達到高精度,必須滿足如下要求:(1)要求書寫者用規(guī)定的字型認真填寫,避免使用某些容易造成混淆的變體。這個限制對用戶可能是很不方便的,因為這意味著書寫速度的降低和書寫習(xí)慣的改變,但從整體上,系統(tǒng)識別水平將有大幅度的提高,能很大程度上提高系統(tǒng)的運行效率。(2)提高拒識率。通過提高拒識率就可以減低誤識率,直到達到指定的精度要求。當然,拒識的增多意味著操作人員的介入的增加,這對用戶是極為不利的。(3)加入邏輯校驗。在通信系統(tǒng)中,人們常通過加校驗碼來保證數(shù)據(jù)的高質(zhì)量傳輸,常見的校驗碼有:奇偶校驗,漢明碼等。在基于數(shù)字的應(yīng)用系統(tǒng)中,我們也可以采用類似的方法。不過,這時校驗方式應(yīng)盡量簡單,直觀,利于填寫人快速算出。對處理速度也有很高的要求數(shù)字識別面對的都是極其大量的數(shù)據(jù)報表,一般都要求達到每分鐘幾頁到幾十頁的處理能力(包括掃描到完成識別的全過程)。而眾所周知,處理速度與處理精度是一對矛盾,現(xiàn)在既要達到前面提到的高識別精度,又要有如此之高的速度,無疑增加了系統(tǒng)的設(shè)計難度,不過近年來,硬件水平提高很快,目前市場上己有較低價格,每分鐘可掃描1020頁的高性能掃描儀,微機的運算速度飛快提高,這些都為高的處理速度定了堅實的基礎(chǔ)。要能批量自動作業(yè)在一般的文本識別中,多是操作者一頁頁地送入文本,手工幫助機器進行版面分割(機器的自動分割能力往往是十分有限的)后再開始識別,很難準保證高質(zhì)量的批量自動識別,而在數(shù)字識別系統(tǒng)中這是一個必須做到而且應(yīng)能做到基本要求、原因如下:(1)如果每頁的處理都要人手工幫助完成,系統(tǒng)的綜合處理速度無法達到要求。(2)掃描儀的自動進紙技術(shù)已經(jīng)十分成熟。(3)處理對象在很多情況下是版面完全相同的大批格,很容易作到欄目的自動提取。 數(shù)字識別的典型應(yīng)用數(shù)字識別在大規(guī)模數(shù)據(jù)統(tǒng)計中的應(yīng)用在大規(guī)模的數(shù)據(jù)統(tǒng)計(如:行業(yè)年檢、人口普查等)中,需要輸入大量的數(shù)據(jù),以前完全要手工輸入,則需要耗費大量的人力和物力。近年來在這類工作中采用OCR技術(shù)己成為一種趨勢。因為在這種應(yīng)用中,數(shù)據(jù)的錄入是集中組織的,所以往往可以通過專門設(shè)計表格和對書寫施加限制以便于機器的自動識別。目前國內(nèi)的大多數(shù)實用系統(tǒng)都要求用戶按指定規(guī)范在方格內(nèi)填寫。另外,這些系統(tǒng)往往采用合適的用戶界面對識別的結(jié)果作全面的檢查,最終保證結(jié)果正確無誤??梢钥闯?,這是一類相對容易的應(yīng)用,對識別核心算法的要求比較低,是目前國內(nèi)很多單位應(yīng)用開發(fā)的熱點。數(shù)字識別在財務(wù)、稅金、金融領(lǐng)域中的應(yīng)用財務(wù)、稅務(wù)、金融是數(shù)字識別大有可為的又一領(lǐng)域。隨著我國經(jīng)濟的迅速發(fā)展,每天等待處理的財務(wù)、稅務(wù)報表、支票、付款單等越來越多。、金錢和勞力。與上面提到的統(tǒng)計報表處理相比,在這個領(lǐng)域的應(yīng)用難度更大。原因有:1)識別的精度要求更高。2)處理的表格往往不止一種,一個系統(tǒng)應(yīng)能智能地同時處理若干種表格。3)由于處理貫穿于整個日常工作之中。書寫應(yīng)盡量按一般習(xí)慣(如:不對書寫者的寫法做限定,書寫時允許寫連續(xù)的字串,而不是在固定的方格內(nèi)書寫),這樣對識別及預(yù)處理的核心算法要求也提高了。數(shù)字識別在郵件分揀中的應(yīng)用隨著人們生活水平的提高,經(jīng)濟活動的發(fā)展,通信聯(lián)系的需求使信函的互換量大幅度增加,雖然電子郵件被現(xiàn)代人廣泛使用,但我國函件業(yè)務(wù)量也還在不斷增長,一些大城市的中心郵局每天處理量將高達幾百萬件,業(yè)務(wù)量的急劇上升使得郵件的分揀自動化成為大勢所趨,在郵件的自動分揀中,數(shù)字識別往往與光學(xué)條碼識別,人工輔助識別等手段相結(jié)合,完成郵政編碼的閱讀。總結(jié)這次長達三個
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1