每日最新頭條.有趣資訊

知識圖譜,AI不能不說的技術

人工智能重新火起來之後,談到AI技術,人們首先會聯想到深度學習、機器學習技術;談到AI應用,人們很可能會馬上想起語音助理、自動駕駛等等,但是如果你一直關注AI的話,會發現,知識圖譜在不知不覺中被越來越多的談起。筆者認為,這也的確是AI不能不提的依托技術。我們在進行人工智能探索的路線上,需要了解其本質,在其基礎上衍生出各種上層的智能應用。在筆者看來,知識圖譜正是起到了這樣一個作用。

知識圖譜不難理解,就是通過不同知識的關聯性形成一個網狀的知識結構,形成知識圖譜的過程本質是在建立認知。知識圖譜最能體現人工智能的特色——像人類大腦一樣思考!因為人類最擅長的思考方式就是將點和線關聯起來並由點及面,然後抽絲剝繭,慢慢理清其中的邏輯推理關係。

知識圖譜,AI不能不說的技術

在國外,谷歌最早提出知識圖譜這個詞,作為谷歌的兩大重要技術儲備,一個是深度學習,另一個就是知識圖譜,用來支撐下一代搜索和在線廣告業務。在國內,百度最近明顯加大了對知識圖譜的宣傳,其實力我們不得而知,但其應用方式和谷歌有類似之處。從現在來看,將知識圖譜實現行業垂直應用的鳳毛麟角。

既然知識圖譜如此重要,如此具有價值,那為什麽應用案例幾乎沒有呢?我想被譽為AI領域宗師的加州大學伯克利分校電腦教授、美國國家科學院院士 Michael I. Jordan的一句話多少能說明一些問題。他說:“如果有10億美金的話,自然語言的理解是我最想研究的問題”。自然語言理解,這一知識圖譜的依托技術之一是非常重要,但同時也是非常難做的一件事。

除了NLP技術本身存在難度外,還在於建立行業知識圖譜,要對行業建立起深厚的認知,需要長時間的行業積澱,這是知識圖譜垂直應用少的另外一個原因。因為只有理解了行業和場景,才能真正智能化。比如我們可能認為很簡單的零售行業,如果真要實現個性化的商品推薦,機器必須理解不同商品的特性,以及商品與銷售場景(如季節、地區、時段)、與促銷行為、與用戶需求之間的關係,才能推薦滿足用戶需求的產品。這也是一個優秀的推銷員或商場導購的思考邏輯。針對不同的零售細分領域,可能又要建立完全不同的知識圖譜。

這兩年,筆者作為谘詢顧問的身份接觸了一些資訊化走在前面的公司,其中有一家大型能源集團公司,他們目前正在做這件事情,他們把自己做的叫“知識管理、知識工程”,但背後的支撐就是知識圖譜。

這家公司通過知識管理項目建成了專業知識網。業務人員可以通過基於知識圖譜的一站式搜索,快速查找到所需資料及專業知識,可以基於知識圖譜進一步對這些知識進行分析挖掘,支撐解決科研與生產中的問題。業務人員工作過程和交流過程中所產生的新知識又回歸到知識庫,進一步通過知識圖譜進行推送、共享和複用。

知識圖譜,AI不能不說的技術

這個項目的服務部門是一家叫北明智通的公司,筆者也略有接觸,研發團隊做NLP、知識圖譜相關的研究開發工作也有將近十年了,最早是在航空航天做行業化應用,從12、13年開始做包括石油在內的能源行業的知識圖譜垂直應用。

他們提出的企業知識網解決方案分三步:第一步,先把企業開展工作需要哪些關鍵知識識別出來,找到源頭,不管是企業內部的還是外部的,不管是數據庫、文檔庫還是網頁,都匯聚起來;第二步,是通過知識圖譜,讓系統能“認識理解”這些數字和文字代表的含義,把各個源頭的知識抽取出來,把知識和人都關聯起來,形成一張知識網;第三步,讓知識圍繞業務轉起來,實現智能化應用,包括語義搜索、個性化推薦、智能問答、協同研究、決策支持等等。

總之,筆者認為,知識圖譜是未來AI發展的必經之路,行業化知識圖譜的構建有難度,更有價值。AI的發展具備了天時、地利、人和,筆者作為AI技術與產品研發與推廣的參與者之一,對生逢這個時代倍感榮幸,也樂見更多的同仁共同鑄就更輝煌的未來。

獲得更多的PTT最新消息
按讚加入粉絲團