結(jié)構(gòu)模式識(shí)別是早期漢字識(shí)別研究的主要方法。其主要出發(fā)點(diǎn)是漢字的組成結(jié)構(gòu)。從漢字的構(gòu)成上講,漢字是由筆劃(點(diǎn)橫豎撇捺等)、偏旁部首構(gòu)成的;還可以認(rèn)為漢字是由更小的結(jié)構(gòu)基元構(gòu)成的。由這些結(jié)構(gòu)基元及其相互關(guān)系完全可以精確地對(duì)漢字加以描述,就像一篇文章由單字、詞、短語(yǔ)和句子按語(yǔ)法規(guī)律所組成一樣。所以這種方法也叫句法模式識(shí)別。識(shí)別時(shí),利用上述結(jié)構(gòu)信息及句法分析的方法進(jìn)行識(shí)別,類似一個(gè)邏輯推理器。
漢字的統(tǒng)計(jì)模式識(shí)別是將字符點(diǎn)陣看作一個(gè)整體,其所用的特征是從這個(gè)整體上經(jīng)過(guò)大量的統(tǒng)計(jì)而得到的。統(tǒng)計(jì)特征的特點(diǎn)是抗干擾性強(qiáng),匹配與分類的算法簡(jiǎn)單,易于實(shí)現(xiàn)。不足之處在于細(xì)分能力較弱,區(qū)分相似字的能力差一些。常見的統(tǒng)計(jì)模式識(shí)別方法有:
(1)利用變換特征的方法。對(duì)字符圖象進(jìn)行二進(jìn)制變換(如Walsh, Hardama變換)或更復(fù)雜的變換(如Karhunen-Loeve, Fourier,Cosine,Slant變換等),變換后的特征的維數(shù)大大降低。但是這些變換不是旋轉(zhuǎn)不變的,因此對(duì)于傾斜變形的字符的識(shí)別會(huì)有較大的偏差。二進(jìn)制變換的計(jì)算雖然簡(jiǎn)單,但變換后的特征沒(méi)有明顯的物理意義。K-L變換雖然從最小均方誤差角度來(lái)說(shuō)是最佳的,但是運(yùn)算量太大,難以實(shí)用?傊,變換特征的運(yùn)算復(fù)雜度較高,且有一定弱點(diǎn)。
(2) 模板匹配。模板匹配并不需要特征提取過(guò)程。字符的圖象直接作為特征,與字典中的模板相比,相似度最高的模板類即為識(shí)別結(jié)果。這種方法簡(jiǎn)單易行,可以并行處理;但是一個(gè)模板只能識(shí)別同樣大小、同種字體的字符,對(duì)于傾斜、筆劃變粗變細(xì)均無(wú)良好的適應(yīng)能力。
010-69584232