
文本檢測和識別技術(shù)處于一個學科交叉點,其技術(shù)演進不斷受益于計算機視覺處理和自然語言處理兩個領(lǐng)域的技術(shù)進步。 它既需要使用視覺處理技術(shù)來提取圖像中文字區(qū)域的圖像特征向量,又需要借助自然語言處理技術(shù)來解碼圖像特征向量為文字結(jié)果。 從公開論文中可以看到,起源于圖像分類、檢測、語義分割等視覺處理任務(wù)的各個基礎(chǔ)網(wǎng)絡(luò)(backbone network),紛紛被征用來提取圖像中文字區(qū)域的特征向量。