每日最新頭條.有趣資訊

騰訊雲OCR評測研究報告獲AIIA批準並正式立項

1月13日,中國人工智能產業發展聯盟2019年第四次全體大會在北京召開,會上,騰訊雲AI視覺團隊組織撰寫的《OCR產業應用及評測需求研究報告》獲得與會專家的認可,並順利通過立項。該報告是騰訊公司聯合中國信息通信研究院、中國人工智能產業發展聯盟共同成立的“智能產品安全與評測聯合實驗室”的首個研究成果。

OCR(Optical Charater Recongnition)全稱“光學字元識別”,即利用光學技術和計算機技術將印製或書寫與紙張上的文字讀取出來,並轉換成計算機可讀取、人可以理解的格式。作為實現文字高速錄入的關鍵技術,OCR目前已廣泛應用於政府、金融、交通、教育、泛互聯網等多個領域。然而,不同應用場景中OCR數據類型差異化很大,每個應用場景都對OCR引擎有不同的要求。例如,金融和交通領域的OCR數據多是結構化的卡證類數據,如身份證、銀行卡、行車執照等,而卡證數據簡單、場景安全性要求高,因此對OCR引擎的識別準確率要求會比較高;在教育、泛互聯網領域中,多為算式、表格、廣告圖片、遊戲圖片等非結構化數據,對OCR引擎的識別準確率要求會相對較低。

目前,業界尚未有統一的、標準化的OCR引擎評測方法,導致OCR應用市場魚龍混雜,阻礙了OCR技術在不同領域的良性發展。

基於騰訊優圖提供的騰訊雲OCR文字識別技術,以及在多個行業裡的AI應用實踐經驗,騰訊雲AI視覺團隊啟動了《OCR產業應用及評測需求研究報告》(以下簡稱“研究報告”)的編纂工作,分析OCR在應用中的評測場景、樣本分類及評測的關鍵指標。

按照不同的應用場景,《研究報告》將OCR引擎劃分為“卡證類文字識別”、“票據單據識別”、“汽車相關識別”、“行業文檔識別”和“通用文字識別”,基本覆蓋主流的OCR應用場景。針對不同的OCR引擎,《研究報告》也建立了不同的標準評測樣本集。

對於評測的關鍵指標,《研究報告》將其劃分為“效果指標”和“性能指標”兩類。例如,針對身份證、行駛證等資料欄準確率要求高的場景,主要看資料欄級的效果指標,針對通用文字、行業文檔等場景,主要看字元級的效果指標。

與會專家認為,基於OCR應用領域的廣泛性,無法用單一的標準和評測樣本集來衡量OCR在不同領域的表現,因此,分場景建立權威的評測標準,將有助於更快速地推進OCR技術的產業化落地。

獲得更多的PTT最新消息
按讚加入粉絲團