每日最新頭條.有趣資訊

百度王海峰AICC 2019演講:人工智能加速產業智能化升級

算力是AI發展的重要基礎。8月27-28日,由中國工程院信息與電子工程學部主辦的AICC 2019人工智能計算大會上,與會嘉賓就AI計算和AI創新展開了探討。百度首席技術官王海峰發表題為《人工智能加速產業智能化升級》的演講,分享了百度對於AI計算發展的洞察,並介紹百度AI在算力、算法等層面的最新進展和助力產業智能化的成果。

王海峰表示,迄今為止人類經歷的三次工業革命,分別以機械技術、電氣技術和信息技術為核心驅動力,而這些技術都表現出很強的通用性。當前,我們身處以人工智能為核心驅動力量的新一輪科技革命和產業變革大潮,人工智能正在將人類社會帶入智能時代。

百度是國內投入最早、技術最強、布局最完整的AI領軍企業,在AI技術領域保持領先優勢,並積極建設人工智能開源開放平台,推動應用落地,促進產業智能化的發展。百度人工智能技術多年積累和業務實踐的集大成——百度大腦布局完整,核心技術領先,既有基礎的算法、數據和算力,也有語音、視覺、AR/VR 等感知技術,自然語言處理、知識圖譜等語言與知識技術,還包括開源開放、支持產業應用的AI平台與生態,並打造了完整的AI安全防護體系。

近年來,在數據、算法和算力三要素的共同作用下,人工智能技術取得巨大進步,尤其是深度學習領域突破顯著。

語音識別的準確率不斷提升,在很多場景中已經超過人類。百度今年實現了注意力模型在大規模線上語音識別系統中的應用,同時準確率進一步提升。該技術應用於智能音箱和語音輸入法等產品,實現高精準的中英文混合語音識別。

語音合成也取得巨大進展。百度前不久上線的並行WaveRNN模型,解決了WaveNet模型需要大量計算資源的問題,合成效果大幅提升,同時能夠滿足在線的實時需求。

通過結合端側的算力,百度領先的語音技術正在發揮越來越大的價值。百度打造了一款針對遠場語音互動的芯片“鴻鵠”,按照車規級打造,採用HiFi4自定義指令集,雙核DSP核心,平均功耗僅100mW,可實現遠場陣列信號的實時處理和高精度低誤報語音喚醒,並集成離線語音識別功能,適配車載語音互動、智能家居等各種場景。

計算機視覺技術也越來越實用化,形成適用於不同應用場景的技術矩陣,如文字識別(OCR)、圖像處理、人臉/人體識別、圖像生成、人機互動等。綜合應用語音和視覺技術,機器可以自動合成虛擬形象。百度大腦的虛擬形象自動生成技術,可以對語音信號和視頻信號進行識別與理解,再通過唇動生成,以及語音、面部和肢體的合成,自動生成一個虛擬形象。

在認知技術上,百度建立了完整的、包含知識圖譜、語言理解、語言生成等在內的語言和知識技術體系,構建了世界上最大的多源異構知識圖譜,在包含數億實體、千億級事實,能夠滿足90%用戶需求的實體圖譜的基礎上,針對不同的應用場景和知識形態建立起關注點圖譜、行業知識圖譜、POI圖譜、事件圖譜等多種知識圖譜。例如視頻理解知識圖譜,百度大腦結合視覺、語音和自然語言處理技術解析多模態信息,並與知識圖譜的相關實體建立關聯,通過計算和推理,得到視頻內容的結構化語義表示,從而精確解析一部視頻中出現的人物及其關係、音頻、事件、主題等信息。

在自然語言處理方面,百度發布了基於知識增強的ERNIE 模型,通過建模海量數據中的實體概念等先驗語義知識,學習真實世界的語義關係。這種融合知識的語義建模大幅增強了模型的語義表示能力,在共計16個中英文自然語言處理任務上超越了谷歌BERT和XLNet, 取得了SOTA效果。百度的語言與知識技術已經廣泛應用於機器同傳、智能寫作等產品中。在機器同傳領域,百度綜合聯合詞向量解碼、語篇翻譯模型等新技術,實現高準確、低時延的機器同傳,並發布了語音到語音的機器同傳系統:DuTongChuan(度同傳),翻譯效果極具競爭力。

人工智能技術快速發展,離不開算力的支撐。算法持續突破,算力缺口巨大,王海峰認為,這需要算法、計算架構等多方面努力來解決。

百度大腦的AI計算架構,實現了芯片、互聯、系統和調度的協同設計和技術創新,並緊密結合百度飛槳(PaddlePaddle)訓練與推理框架,提供面向算法優化的極致效率,並做到異構、無感的使用。

王海峰指出,在智能時代,深度學習框架起到承上啟下的作用,下接芯片,上承各種應用,是“智能時代的作業系統”。百度打造了中國首個也是目前國內唯一開源開放、功能完備的深度學習平台——百度飛槳。飛槳的核心框架,包括開發、訓練和預測,以及涵蓋推薦、視覺、自然語言處理、語音等在內的豐富模型庫。同時,飛槳提供包括遷移學習、強化學習、自動化網絡結構設計、訓練可視化工具、彈性深度學習計算、圖神經網絡等在內的工具組件,以及零基礎定製化訓練和服務平台EasyDL、一站式實訓開發平台AI Studio和端計算模型生成平台EasyEdge等服務平台。飛槳也與浪潮在算力層面進行合作,進一步降低深度學習應用門檻,加速推動產業智能化變革。

基於對中國產業的深度洞察和對中國開發者的理解,飛槳具備五大核心優勢:同時支持動態圖和靜態圖的編程,能夠兼顧易用性和效率;開源70多個經過真實業務場景驗證的官方模型,涵蓋視覺、NLP、推薦等 AI核心技術領域;具備適用大規模數據場景的分布式訓練能力,從優化算力的角度為深度學習的應用提供支撐;提供包括底層硬體、推理引擎、多種程序設計語言、方案與服務工具在內的端到端全流程部署方案,助力產業開發者實現應用的快速落地。同時,針對沒有深度學習技術基礎的開發者,百度飛槳提供定製化訓練和服務平台EasyDL,讓他們可以基於自身業務需求和數據,快速訓練定製化AI模型。

以百度飛槳深度學習平台為核心基礎,百度大腦實現了AI算法、計算架構和應用場景融合創新,成為“軟硬一體AI大生產平台”。在數據和算力的基礎上,打通了人工智能產業化應用落地的全部流程,實現了AI技術的標準化、自動化、模塊化,助力開發者快速實現應用,帶來價值。

基於百度大腦AI平台,百度的AI技術已經應用於各行各業,帶來了巨大的產業價值。王海峰以百度地圖AI化數據生產、水培蔬菜智能種植,以及不同行業的應用為例,介紹了人工智能助力產業智能化的效果。例如,百度飛槳基於遙感影像數據,研究高精度、高自動化的目標地物檢測、土地覆蓋和土地利用分類方法,可以輔助國家進行重大工程用地擴張與變化情況的監測工作,並對土地資源的利用進行有效管理與控制;基於視覺技術及深度學習算法構建的智能無土栽培解決方案,將原來農業專家的個人經驗進行了數字化、產品化,使無土栽培作物生產具備了規模化生產的可能性。

據麥肯錫預測,人工智能將顯著驅動經濟增長,更快應用AI 的領跑者將獲得更大的經濟收益。現階段,百度人工智能技術度持續發展突破和深度學習技術及平台的開源開放,將加速人工智能技術與產業融合,加速產業智能化,讓AI時代更快到來!

獲得更多的PTT最新消息
按讚加入粉絲團