每日最新頭條.有趣資訊

百度大腦開放24種全新能力,可識別生病或未絕育的流浪貓

記者 | 肖芳

在百度大腦首場開放日活動上,百度大腦宣布開放24種新的AI能力,在市政、物流、教育等行業有了更多落地方案。截至目前,百度大腦開放了158項AI能力,24小時快速集成,開發者數量超過100萬。

百度大腦開源深度學習平台PaddlePaddle以及通用AI能力都進行了更新。其中,PaddlePaddle核心框架Paddle Fluid v1.3新增發布視頻分類模型庫,新增支持NLP語義表示BERT模型,提升分布式訓練性能。目前,百度PaddlePaddle已對外開放超過50種經過工業場景驗證的官方模型。比如,領邦利用PaddlePaddle,通過ICNet語義分割模型識別精密零件瑕疵,實現了零件自動分揀。

此外,百度大腦通用AI能力還在語音、視覺、自然語言處理、知識圖譜等方面進行了更新。

語音方面,百度大腦推出了語音識別極速版,搭載注意力(attention)模型的語音能力,百度方面稱實現了更快的響應速度,相對識別準確度可提升15%。語音識別預置語義解析的預置場景由35個升級為51個。百度大腦即將推出幾款新產品,包括語音識別自訓練平台、遠場語音開發套件和語音離線合成等產品。

視覺方向上,OCR、車輛分析、人臉人體、圖像識別都有升級。比如,卡證OCR新增了戶口本、出生醫學證明、港澳通行證和台灣通行證四類新能力,可識別卡證總數達到9種。當用戶對著戶口本拍一張照片,系統就能根據資料欄進行結構化識別,然後反饋出信息頁的出生地、出生日期、姓名、民族、與戶主關係、性別、身份證號碼。

票據OCR和汽車場景OCR也分別新增了行程單、保單、通用機打發票、定額發票、車輛VIN碼、機動車銷售發票、車輛合格證等識別能力。目前,百度大腦OCR產品全系列可以識別類型多達34款。

人臉人體識別方向上,百度大腦此次發布了新能力人臉情緒識別,人臉檢測關鍵點由72個增至150個,常見手勢能識別種數也達到了24種。圖像識別方向,百度大腦更新了紅酒和地標識別兩個新能力。車輛分析方面上線了車輛檢測和車流統計。百度大腦還會陸續上線車輛屬性識別、車輛外觀損傷識別、人臉融合、手部關鍵點識別、更高精度的人像分割以及錢幣識別等有趣有用的應用場景。

同時,百度大腦語言及知識技術也進一步開放。在語言處理應用技術方面,百度大腦新增文本糾錯、新聞摘要、智能寫詩、智能春聯和對話情緒識別等能力,在知識理解方面,百度大腦推出了作文檢索和知識問答兩個新能力。智能寫作平台將在4月全面上線,從素材上可為創作者提供工具、幫助找到靈感,從而提升創作者的寫作效率和產出質量,降低寫作成本。

在市政、物流、教育等領域,百度大腦加持的產品有了更多落地的案例。比如,百度EasyDL與分形科技打造的智能垃圾桶已成功地落地海澱公園,可以對7種常見垃圾自動分類;在和德邦物流的合作中,百度EasyDL使用定製詞法分析快遞申請,一秒拆分姓名、電話、住址等信息;百度EasyDL還與中科院在珍稀鳥類識別項目上展開的合作。百度EasyDL利用圖像識別技術協助專家們對動植物標本、照片進行快速鑒定,目前在700多種鳥類模top5上的識別準確率達到93.89%,非雀形目鳥類模型top5準確率達到95.79%。

值得一提的是,工程師用百度大腦動物識別技術和百度EasyDL設計出了智能貓窩,擁有“貓臉門禁”、“病貓識別”、“絕育識別”三大功能,能夠幫助救助志願者發現生病和未絕育的流浪貓。

百度AI技術生態部總經理喻友平表示,百度大腦開放能力不斷加速,希望幫助企業、開發者、合作夥伴們快速地實現各自領域的業務解決方案,創造全新商業模式,帶來更多機遇。

獲得更多的PTT最新消息
按讚加入粉絲團