OCR文字識(shí)別的解碼主要難點(diǎn)在于如何進(jìn)行輸入輸出的對(duì)齊。 如上圖所示,如果每個(gè)1xn預(yù)測(cè)一個(gè)字符,那么可能會(huì)出現(xiàn)多個(gè)1xn預(yù)測(cè)同一個(gè)字符,這樣子得到的最終結(jié)果會(huì)產(chǎn)生重復(fù)字符。 所以需要設(shè)計(jì)針對(duì)文字識(shí)別的解碼算法來解決輸入輸出的對(duì)齊問題。