行業(yè)資訊
看看行業(yè)內(nèi)又發(fā)生了什么
OCR(Optical Character Recognition)即光學(xué)字符識別,是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機(jī)文字的過程,簡單來講就是將紙質(zhì)文檔中的文字轉(zhuǎn)化成為黑白點(diǎn)陣的圖像文件,并通過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。
典型的OCR技術(shù)路線分為5大步驟,分別是輸入、圖像與處理、文字檢測、文本識別、輸出,每個過程都需要算法的深度配合,并以拒識率、誤識率、識別速度、用戶界面的友好性、產(chǎn)品的穩(wěn)定性等為指標(biāo)衡量一個OCR系統(tǒng)性能的好壞。OCR技術(shù)應(yīng)用廣泛,為人們的生活帶來了較大的便利,主要覆蓋場景包括以下幾個方面。
一、交通場景。在交通場景下的應(yīng)用主要是“車牌識別”,主要用于識別車牌號碼、車牌顏色、車牌類型、車標(biāo)、車身顏色等車輛特征信息,用于移動警務(wù)、占道停車、停車場管理等領(lǐng)域。支持識別普通藍(lán)牌、軍牌、武警牌、農(nóng)用車牌、大使館車牌等各種常見規(guī)格的汽車牌。
二、票據(jù)場景。OCR技術(shù)在票據(jù)場景下的應(yīng)用有醫(yī)療票據(jù)識別、增值稅發(fā)票識別和財務(wù)票據(jù)識別等。主要是通過掃描儀或手機(jī)獲取票據(jù)圖像,并通過算法自動提取判別票據(jù)上的關(guān)鍵信息。
三、生活場景。在生活場景下,OCR技術(shù)主要應(yīng)用于證照識別方面,包括對身份證、銀行卡、護(hù)照、結(jié)婚證、戶口本、營業(yè)執(zhí)照等的識別。主要是利用掃描儀、數(shù)碼相機(jī)或手機(jī)拍攝各類證照圖像,再利用OCR技術(shù)讀取證件圖像上的文字信息以作使用。另外,OCR技術(shù)的應(yīng)用范圍還會在生活中不斷擴(kuò)展,例如對街景文字、路牌的提取識別。
四、教育辦公場景。主要是在學(xué)習(xí)、工作中一些需要進(jìn)行文檔處理的事項上的應(yīng)用,即利用OCR技術(shù)對書籍、表格、項目報告、簡歷、合同等各類紙質(zhì)文件進(jìn)行識別,并通過云端技術(shù)將識別后的內(nèi)容和圖像上傳到服務(wù)器備份存儲,將紙質(zhì)文檔電子化,更方便保存和查看。同時,也可以進(jìn)行遠(yuǎn)程身份認(rèn)證以及內(nèi)容審核與監(jiān)管。
近年來,借助人工智能等技術(shù),OCR性能的不斷提升為OCR應(yīng)用場景的擴(kuò)展,向社會生產(chǎn)生活更多領(lǐng)域的滲透,以及推進(jìn)產(chǎn)業(yè)數(shù)字化進(jìn)程提供了堅實的基礎(chǔ),未來將會持續(xù)優(yōu)化升級,為人們的便利生活提供更多助力。