freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

應用漢字識別ppt課件-資料下載頁

2025-01-14 16:30本頁面
  

【正文】 通常都采用 層次化的分類 結構 , 即對漢字字庫做多級分類,然后再細分判別,從而大大提高識別效率。 一般把最后一級分類稱為 細分類 ,而前面的分類稱為 粗分類 。一般來說,對漢字的粗分類有如下要求。 4)分類策略:多級分類 在漢字識別中,一般是采用在一個線性表逐一 匹配的方法 ,由于漢字數(shù)量大,如果不對漢字字庫分類而直接識別,一方面識別效果不會好,另一方面計算量往往會很大。 ( 2)粗分類的速度要快 。這要求分類的算法簡單,同時要求分在各個類別中的漢字的數(shù)目比較平均,從而提高分類的效率。 ( 3) 粗分類的 特征要簡單 , 分類字典小 ,節(jié)約存儲空間。 ( 4)粗分類方法要和細分類方法相協(xié)調(diào)。 4)分類策略:多級分類 ( 1) 粗分類的正確分類率和分類穩(wěn)定性要高 。文字識別是先粗分類,然后再細分類。粗分類的正確與否會影響到后面的識別。這里的分類率是在噪聲干擾下能夠正確分類。 樹分類具有效率高的特點,近年來在漢字識別中得到運用。但是漢字字數(shù)多造成分類樹結構龐大,錯分率累加,使得分類不夠穩(wěn)定。 右圖給出的是一個樹形粗分類示意圖。該圖中“ 3” 所代表的文字不僅在類別 A 中,在噪聲情況下,也可能出現(xiàn)在 C 中。因此這是一種考慮了噪聲干擾等因素的特殊的分類方法。 A B C 1 2 3 4 5 3 6 7 所以要求細分判別 C 類中的文字時考慮到“ 3” 所代表的文字的存在。 粗分類方法: 包含配選法 許多漢字具有相同的偏旁部首,包含配選法就是利用這一特點對漢字分類。分類用的摸板是漢字偏旁部首的骨架圖形。分類時,將輸入文字和各標準模板做 “ 與 ” 運算 。顯然,只有和輸入未知文字的偏旁。 部首相同的標準模板相 “ 與 ” 的結果才和標準模板本身的圖形一致。所以,根據(jù)未知輸入文字圖像和分類用標準模板圖像 “ 與 ” 的結果是否相同于該標準圖像,可以判別出未知文字屬于哪一類。 在沒有和標準圖像相“與”匹配前,先把未知文字圖像橫線加粗成大于等于 3個像素寬,以利于包含相匹配的模板,但是也加大了包含其他標準模板的概率,因而誤識率會增加。為避免文字筆劃絕對位置移動帶來的干擾,需要把圖像沿上下左右四個方向平移一個像素,然后分別與標準模板相匹配。只要有一次匹配成功,就判斷該文字屬于標準模板圖像的類別。由此可見,包含匹配法實際上就是 模板匹配法 。 當識別字數(shù)增多時,由于偏旁部首的標準模板增加很少,其分類速度比粗外圍和粗網(wǎng)絡法容易提高,而存儲量要求較少。 細分類方法: 基于小筆段特征的層次結構 漢字的筆劃特征受字體、字號等影響較小,是識別 漢字的很好的特征。但是漢字筆劃特征對實際文本 來說很難提取。用基于小筆段特征的漢字層次結構, 能較好地解決以上問題。 若干小筆段首尾相連構成了 漢字筆劃,如右圖所示。用 小筆段作為基元一方面易于 提取;另一方面它又保留了 漢字基本的筆劃結構信息, 且在字體變化或噪聲干擾條 件下,仍能保持筆劃結構的 絕大部分信息。 n10 n1 n2 n3 n4 n5 n6 n7 n8 n9 n11 n12 小筆段組成了 部件 ,部件又組成了漢字。由小筆段到部件,再到漢字的層次結構描述,反映了漢字結構不同層次的約束關系。 漢字字體改變和干擾影響會使得小筆段特征向量有變化。因此,用層次結構法對未知漢字匹配判別時,采用 精確匹配方法往往不能奏效 。較好的辦法時采用由漢字小筆段相關系數(shù)(相關系數(shù)反映了相互約束關系)約束的 松弛匹配算法 。這種算法能有效地吸收同一漢字不同字體的變化,而所能容許的變化范圍由小筆段間的相關系數(shù)所制約。實驗證明,這種特征和算法可以有效地解決多體印刷漢字識別的問題。 細分類方法: 差筆劃 粗分類后,通常每類中含有許多形狀相似的文字,采用差筆劃方法,可以較好地區(qū)分這些形狀相似的文字。差筆劃細分的算法如下:設粗分類后, 類中只有兩個文字 A和 B。 ( 1)預先根據(jù)文字 A、 B特征點(如端點、折點等)坐標作成 A、B的骨架圖形 SA, SB,如下圖。 ( 3)把 SA, SB在 3 3網(wǎng)格區(qū)域內(nèi)移動位置,作成 如上圖所示的筆劃寬度為 3個像素的粗圖形 WA,WB。 ( 3)對 SA第 i號筆劃 SAi 在 5 5網(wǎng)格中挪動,和 WB匹 配,通過下式求出最大一致度 σmax。 m a xm a x55SWBAiSAi???????????求出 σmax≤θ(θ為常數(shù) )的筆劃,作為差筆劃 gA。 ( 4)同樣由 SB, WA求出差筆劃 gB。 gA , gB可能 同時存在,也可能僅有一個。( 例 ?) ( 5)若差筆劃僅有一個(如 gA )時,把輸入文字 x 圖形在 3 3網(wǎng)格中同存在的差筆劃 gA進行位置匹配, 由下式求出最大一致度 σA (越大越好 ) ? ?33.m a x AAAxgg? ??當 σA≥θ0(θ0為常數(shù) ),則該文字屬于 A,否則屬于 B。 王 玉 SB SA 、 gA 差筆劃僅有一個 玉 待識別文字 x 計算 σA 判別 x∈ A 若粗分類后,式中文字 大于兩個 時,則先取兩 個來進行上述算法的判別,以后反復取兩個作判別, 來決定輸入文字屬于的類別。 ( 6)若兩個差筆劃 gA 和 gB都存在,在 3 3網(wǎng)格中 把輸入文字 x圖形和 gA , gB進行位置匹配,求出各自的最 大一致度 σA , σB 。若 σA- σB ≥θ2, 且 σA≥θ1 則 x∈ A;若 σB- σA ≥θ2, 且 σB≥θ1 則 x∈ B。 其中 θ1和 θ2為常數(shù)。 選用 N種具有 互補特性 特征作為類特征。在學習階段,對訓練樣本進行 N次互不相關的分類,然后組合 N次分類結果,完成特征空間的劃分。分類時,根據(jù)待分字的特征進行 N次分類,組合分類結果求得子類。組合的形式有兩種: 1) 12S S S S N?2) 12S S S S N?其中 SN表示第 N次分類的子類。 因為 N次分類不相關,所以可以平行進行。但是字數(shù)多時,每種特征要在字數(shù)多的情況下分類,這顯然是不太合適的。 4)分類策略:多特征融合 其他策略:多分類器融合、 ?
點擊復制文檔內(nèi)容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1