機器視覺之OCR文字識別技術介紹

2021/05/05

編寫:adminBOSS

什麼是OCR文字識別技術

OCR英文全稱是Optical Character Recognition，中文叫做光學字符識別。它是利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來，並轉換成一種計算機能夠接受、人又可以理解的格式。

OCR字符識別技術的應用場景

OCR字符識別技術廣泛應用於銀行票據、文獻資料錄入和處理領域。適合於銀行、稅務等行業大量票據表格的自動掃描識別及長期存儲。在機器視覺領域，OCR同樣具有多方面的應用，通過工業相機、工業鏡頭拍攝文字圖像，運用機器視覺軟件進行相應處理以獲取我們需要的信息，常見的應用有：

1、儀器儀表上的數據讀取，如居民生活中得到水錶、氣表、電錶的數值讀取；

2、產品的日期、批號讀取，獲得產品的過期信息及可追溯信息；

3、智能交通的車牌識別，獲取違章車輛的信息。

機器視覺方面的OCR應用

1、檢測條碼/字符印刷缺陷、完整度；

2、檢測條碼/字符的對錯、是否漏印；

3、檢測物體的方向是否正確；

4、靜態或動態檢測；

5、OK/NG產品系統輸出相應控制信號。

對印刷表面字符的漏印、對錯、缺陷、有無、偏移度等進行識別檢測，判定被檢產品是否合格，並輸出檢測結果和相應信號。

OCR文字識別常見應用

文字識別一些目前的應用已經是比較成熟了：比如漢王OCR，百度OCR，阿里OCR等等。其實我們自己也能感受到，OCR技術確實也在改變著我們的生活：比如一個手機APP就能幫忙掃描名片、身份證，並識別出裡面的信息；汽車進入停車場、收費站都不需要人工登記了，都是用車牌識別技術；我們看書時看到不懂的題，拿個手機一掃，APP就能在網上幫你找到這題的答案。這都是於基於OCR技術的應用。

OCR技術的發展

在一些簡單環境下OCR的準確度已經比較高了（比如電子文檔），但是在一些複雜環境下的字符識別，在當今還沒有人敢說自己能做的很好。現在大家都很少會把目光還放在如何對電子文檔的文字識別該怎麼進一步提高準確率了，因為他們把目光放在更有挑戰性的領域。 OCR傳統方法在應對複雜圖文場景的文字識別顯得力不從心，越來越多人把精力都放在研究如何把文字在復雜場景讀出來，並且讀得準確作為研究課題，用學界術語來說，就是場景文本識別（文字檢測+文字識別）。

從上圖可以看出，自然場景下的文字識別比簡單場景的文字識別實在困難太多了，現在雖然出了很多成果，但是離理想結果還是差很遠。

上一篇:CCD圖像傳感器相關知識介紹

下一篇:機器視覺檢測系統不穩定因素的分析與解決方案