freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

手寫數(shù)字特征提取與分析-wenkub

2023-07-08 08:26:36 本頁面
 

【正文】 bution under the minimum error rate of Bayes method and Bayes method to achieve the minimum risk, handwritten digits from 0 to9 of the identification. The system first is to realize the simulation of handwritten numeral。這些手段分兩大類:全局分析和結(jié)構(gòu)分析。與這些結(jié)構(gòu)特征配合使用的往往是句]1[法的分類方法。作者認(rèn)為,在手寫數(shù)字識別的研究中,Bayes 和多種方法的綜合是值得重視的方向。的研究,并已取得了很多成果,但到目前為止機(jī)器的識別本領(lǐng)還無法與人的認(rèn)知能力相比,這仍是一個有難度的開放問題。一般分為上下兩部分。 手寫特征的典型應(yīng)用 手寫數(shù)字識別有著極為廣泛的應(yīng)用前景,這也正是它受到世界各國的研究工作者重視的一個主要原因。 因?yàn)樵谶@種應(yīng)用中,數(shù)據(jù)的錄入是集中組織的,所以往往可以通過專門設(shè)計(jì)表格和對書寫施加限制以便于機(jī)器的自動識別。 手寫數(shù)字識別在財(cái)務(wù)、稅務(wù)、金融領(lǐng)域中的應(yīng)用: 財(cái)務(wù)、稅務(wù)、金融是手寫數(shù)字識別大有可為的又一領(lǐng)域。2)處理的表格往往不止一種,一個系統(tǒng)應(yīng)能智能地同時處理若干種表格。目前使用]4[量最大的 OVCS 分揀機(jī)的性能指標(biāo):OCR 拒分率 30%, OCR 分揀差錯率 %。第五章寫了 Bayes 分類器的仿真實(shí)驗(yàn)及截圖說明。讓機(jī)器判別事物的最基本方法就是計(jì)算,原則上講是對計(jì)算機(jī)要分析的事物與標(biāo)準(zhǔn)模板的相似程度進(jìn)行計(jì)算。上部分完成未知類別的模式分類;下般部分屬于設(shè)計(jì)分類器的訓(xùn)練過程,利用樣品進(jìn)行訓(xùn)練,確定分類器的具體參數(shù),完成分類器的設(shè)計(jì)。212)(??Njijii xS?3)協(xié)方差與協(xié)方差矩陣在 N 個樣品中,第 i 個特征和第 j 個特征之間的協(xié)方差定義為: [23]????Nkjjkiiij xxS1))(對同一批樣品來說, = 。ni,21?? 軟件的介紹MATLAB 是 Math works 公司于推出的一套高性能的數(shù)值計(jì)算和可視化軟件,其全稱是Matrix Laboratory,亦即矩陣實(shí)驗(yàn)室,經(jīng)過多年的逐步發(fā)展與不斷完善,現(xiàn)已成為國際公認(rèn)的最6優(yōu)秀的科學(xué)計(jì)算與數(shù)學(xué)應(yīng)用軟件之一,是近幾年來在國內(nèi)外廣泛流行的一種可視化科學(xué)計(jì)算軟件。工具箱內(nèi)的函數(shù)源程序也是開放性的,多為 M 文件,用戶可以查看這些文件的代碼并進(jìn)行更改,MATLAB 支持用戶對其函數(shù)進(jìn)行二次開發(fā),用戶的應(yīng)用程序也可以作為新的函數(shù)添加到相應(yīng)的工具箱中 ]。可以說,Matlab在科學(xué)計(jì)算與工程應(yīng)用方面的編程效率都遠(yuǎn)遠(yuǎn)高于其他高級語言 。Matlab支持用戶對其函數(shù)進(jìn)行二次開發(fā),用戶的應(yīng)用程序可以作為新的函數(shù)添加到相應(yīng)的工具箱中。據(jù)Math works公司聲稱,Matlab軟件中所包含 Matlab源代碼相當(dāng)于70萬條c代碼。(2) Matlab程序不能脫離其環(huán)境運(yùn)行,因此它不能被用于開發(fā)商用軟件。]7[1.索引圖像索引圖像包括一個數(shù)據(jù)矩陣A ,一個顏色映射矩陣B。像素顏色由數(shù)據(jù)矩陣A 作為索引指向矩陣B進(jìn)行索引。矩陣中的元素可以是雙精度的浮點(diǎn)數(shù)類型、8位或16位無符號的整數(shù)類型。二值圖像可以采用uint8和double類型存儲,工具箱中以二值圖像作為返回結(jié)果的函數(shù)都使用uint8 類型。像素的顏色保存在像素位置上的紅、綠、藍(lán)的強(qiáng)度值的組合來確定。圖像序列是一個四維的數(shù)組,圖像幀的序號在圖像的長、寬、顏色深度之后構(gòu)成第四維。從密度特征的提取方法容易看到,筆劃密度特征對字形畸變的抗干擾能力較強(qiáng),但抗噪聲能力較弱. 傅立葉變換特征關(guān)于在頻域里提取形狀特征的問題,一般來說,區(qū)域的別界是一條封閉的曲線。]9[傅立葉變換是在圖像處理中應(yīng)用廣泛的一種二維正交變換,傅立葉變換后平均值即直流項(xiàng)正比于圖像灰度值的平均值,低頻分量則表明了圖像中目標(biāo)邊緣的強(qiáng)度和方向。]10[圖像經(jīng)數(shù)字化處理后,可以用二維的離散信號 I(m,)來表示。換句話說,傅立葉變換的物理意義是將圖像的灰度分布函數(shù)變換為頻率分布函數(shù),傅立葉逆變換是將圖像的頻率分布函數(shù)變換為灰度分布函數(shù)。式(35)中方括號中的項(xiàng)表示在圖像的行上計(jì)算的離散傅立葉變換,方括號外面的求和則實(shí)現(xiàn)結(jié)果數(shù)組在列上的離散傅立葉變換。 將 F(u,v)用矩陣表示如下 :11 [36]??)1,()0,(,0, ??NFNF? ???? F(u,v)的大幅值系數(shù)集中在低頻區(qū)域內(nèi),即矩陣的左上、右上、左下、右下四角的周圍。從規(guī)整化的輪廓中直接可以導(dǎo)出字符的邊緣輪廓。? (2)比率定義為: 比率=N/Wmax [38] W 二是字符有效寬度,W_=max(W(k)),k [0,N1]? 利用比率特征可以有效識別字符“1,對于字符“1來說,比率特征總是大于 ,而對于其他字符來說,比率特征并非總是大于 (3)字符有效高度 Hamx 定義為: Hmax=max(H(k)) [39] K 屬于[O,N1],H(k) 為第 k 列的字符高度。13圖 投影特征 投影算法的基本描述如下: 對于字符點(diǎn)陣中的每一個點(diǎn),投影到離它最近的四條邊線上,具體投影方法如圖 所示, 圖 水平、豎直方向上的投影當(dāng)一點(diǎn)被投影到某一個邊線上時,激活該邊線上的某一個 bit 或者某些 bit,這些被激活的 bit取值為“1,其他沒有被激活的取值為“0 ,當(dāng)一個字符所有的點(diǎn)都投影完時,計(jì)算某一個邊線上“1”的個數(shù),即為字符在這一個邊線上的投影數(shù)值。令 fIm。 j=1,2.這樣可以得到四個重心矩特征:中的象素偏離重心位置的整體特征。 首個黑點(diǎn)位置特征按上文中定義的八個方向,沿逆時針方向,即 0 度方向一45 度方向一90 度方向一135度方向一 180 度方向一 135 度方向一90 度方向一45 度方向,統(tǒng)計(jì)各個方向上由外至內(nèi)首個黑點(diǎn)出現(xiàn)的位置,共計(jì) 8 個二維特征。本文進(jìn)行的粗網(wǎng)格特征提取,其提取方法的主要思想是,把數(shù)字點(diǎn)陣分成幾個局部小區(qū)域,并把每個小區(qū)域上的點(diǎn)陣密度作為描述特征,即統(tǒng)計(jì)每個小區(qū)域中圖像象素所占的百分比作為特征數(shù)據(jù)。同時,根據(jù)文獻(xiàn)的實(shí)驗(yàn)結(jié)果,以粗網(wǎng)格作為特征提取進(jìn)行數(shù)字識別,有很好的識別率 。]14[ 結(jié)構(gòu)特征提取方法采用結(jié)構(gòu)特征提取對字符進(jìn)行結(jié)構(gòu)分析從而達(dá)到識別的目的,是一種非常直觀的方法,其思想與人認(rèn)字的原理有點(diǎn)相象,但又有所不同。所以,基于筆劃來自動識別字符一直是手寫體字符識別研究的一類主要研究方法.雖然字符的筆劃特征受字體、字形大小等影響較小,是識別字符的良好特征,但可惜筆劃特征對實(shí)際的書寫文本來說較難穩(wěn)定的提取。單純建立在圖象處理方法上的筆段機(jī)器分析只能十分機(jī)械地按圖象就事論事,結(jié)果提取到的筆段難免與人的判別不完全一致。 統(tǒng)計(jì)特征提取方法從統(tǒng)計(jì)模式識別的觀點(diǎn)來看,字符識別實(shí)際上是一個模式分類問題,人對自然物體的識別,是建立在對該物體進(jìn)行學(xué)習(xí)、特征分析的基礎(chǔ)上的,計(jì)算機(jī)模式識別的過程與人的識別過程有著相識的地方。第二步,計(jì)算機(jī)執(zhí)行某種運(yùn)算完成由 f (xi)→c(x)=X 的映像。然而,對于特征的選擇和提取,卻沒有可遵循的理論來指導(dǎo),我們很難比較一個物體中哪些特征是實(shí)質(zhì)性,那些特征是有代表性的,那些特征可能是不重要的或與識別無關(guān)的,這需要大量的實(shí)驗(yàn)和理論指導(dǎo)。 完成圖像進(jìn)行裁剪以后,把每個數(shù)字圖形定義成一個 N*N(5*5)的模板,將每個樣品的長度和寬度 N 等分,平均有 N*N 個等分,對每一等分進(jìn)行像素個數(shù)統(tǒng)計(jì),除以每一份的面積總數(shù)即得特征值。 3) 計(jì)算 5*5 的每個小區(qū)域中黑像素所占比例,第一行的 5 個比例值保存到特征的前 5 個,第二行對應(yīng)著特征的 610,如此保存樣本的特征值。194 Bayes 分類器在手寫特征中應(yīng)用 Bayes 分類器貝葉斯(Bayes)分類器的分類原理是通過某對象的先驗(yàn)概率,利用貝葉斯公式計(jì)算出其后驗(yàn)概率,即該對象屬于某一類的概率,選擇具有最大后驗(yàn)概率的類作為該對象所屬的類。該網(wǎng)絡(luò)中應(yīng)包含類結(jié)點(diǎn) C,其中 C 的取值來自于類集合( c1 , c2 , ... , cm),還包含一組結(jié)點(diǎn) X = ( X1 , X2 , ... , Xn),表示用于分類的特征。例如表示某個待查細(xì)胞的特征向量 x 屬于正常細(xì)胞類的概率是 ,屬于癌變細(xì)胞類的概率是 ,就把它歸類為癌變細(xì)胞。對于被測樣品,Bayes 公式可以計(jì)算出該樣品分屬)(??P)(??XP個類別的概率,叫后驗(yàn)概率 ,看 X 屬于哪個類的可能性最大,就把 X 歸于可能性最大的那個]6[類,后驗(yàn)概率作為識別對象歸屬的依據(jù)。我們以藥品為例,如圖 ,正常藥品“+” ,]19[異常藥品“” 。]20[ A B x2 A x2 + + + + + + + + + + + + + + +o x1 o x1圖 線性可分示意圖 圖 線性不可分示意圖問題在于出現(xiàn)摸棱兩可的情況,如圖 所示。但是如果將一個“ ”樣品錯分成“+ ”類所造成的損失要比將“+”分成“ ”類嚴(yán)重,這是由于將異常藥品誤判為正常藥品,則會使病人因失去及早治療的機(jī)會而遭受極大的損失;把正常藥品誤判為異常藥品會給企業(yè)帶來一點(diǎn)損失,則偏向使對“ ”類樣品的錯分類進(jìn)一步減少,可以使總的損失為最小,那么 B 直21線就可能比 A 直線更適合作為分界線。其中最有代表性的是基于最小錯誤率的 Bayes 決策與基于最小風(fēng)險(xiǎn)的 Bayes決策 。]23[圖 基于最小錯誤分類和基于最小風(fēng)險(xiǎn)分類比較 基于最小錯誤率 Bayes 的手寫數(shù)字字符分類 樣品均值求出每一類手寫數(shù)字樣品的均值 [42]9,10,),(121?? ???ixXNTinijijiii代表 類的樣品個數(shù), n 代表特征數(shù)目。ljxil代表 類的 個樣品第 j 個特征的平均值。高斯消元法的實(shí)質(zhì)就是將 n 階方陣 A 通過一系列變化,變換成一個上三角陣稱為“消元”的過程。 (2)得到主元素,并且知道其下標(biāo)的值,通過行交換和列交換將它交換到主元素的位置上。令 , [47]kikikaa? 1,??nki?(4)消元。步驟:24(1)“全選主元” ,主元素的選取和初等變換與求矩陣的行列式等同。 [410]9,210,),(121?? ???ixXNTinijijiii代表 類的樣品個數(shù),n 代表特征數(shù)目。jiiN代表 類的第 個樣品,第 個特征值。)(iwPi 后驗(yàn)概率后驗(yàn)概率 :][iP ㏑ ㏑ [414]????)()(21][1iiTiXSXi 21)(?iwP9,0,??iS 損失函數(shù)損失函數(shù)數(shù)組為 ,設(shè)初值為]10[los [415]?????jijil,計(jì)算每一類的損失 [416]??90][][j jpilosirsk 265 分類實(shí)驗(yàn)與信息 特征提取方法的軟件實(shí)現(xiàn)本次論文需要程序的運(yùn)行,而這次選擇的運(yùn)行載體是 MATLAB 7。例:當(dāng)輸入“7”時顯示1:在寫字板輸入一個手寫數(shù)字2:選擇決策方法即本論文的這兩種方法圖 決策方法3:即可出現(xiàn)對話框27圖 識別對話框4:選擇類別圖 ,輸入實(shí)際的樣品類型5 保存樣本點(diǎn)擊“ ”保存樣本。 打開 Matlab 軟件程序,將當(dāng)前工作目錄設(shè)為“手寫數(shù)字分類”的安裝目錄,在命令行中輸入“classification ”命令,即可打開手寫數(shù)字分類軟件。ii25類的協(xié)方差矩陣 為iw]27[ [412]????iniissS121?2??? ???ininss?213 計(jì)算出每一類的協(xié)方差矩陣的逆矩陣 以及協(xié)方差矩陣的行列式 。liwiN代表 類的第 個樣品,第 個特征值。 判別函數(shù)
點(diǎn)擊復(fù)制文檔內(nèi)容
數(shù)學(xué)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1