每日最新頭條.有趣資訊

謝天謝地,AI開發者的“吐槽大會”終於結束了

今天是個被AI圈刷屏的日子。

原因不是谷歌新手機和波士頓動力的機器人,而是華為發布了一款新的AI開發平台:ModelArts。

我粗略統計了一下,AI從業者與開發者們之所以瞬間被撩到嗨點,是因為國內看似熱鬧無比的AI行業,其實已經很久沒有AI開發相關的重要項目出來了。ModelArts一出來,有一種終於被重視了的“久旱逢甘霖”體驗。

這事其實非常吊詭:AI再怎麽巨集大敘事,不也要靠開發者一磚一瓦蓋起來嗎?可偏偏AI行業是PPT邏輯圖發了不少,用來乾活的家夥卻屈指可數。

而AI開發,在今天並不是一個多麽成熟的工作,其中問題與矛盾非常顯著。

在HC大會第三天,華為雲分析了今天AI開發的困境。今天限制AI開發的兩個主要因素,一個是快,一個是慢,兩者形成了相互依賴的矛盾體,解決一個要依賴另一個的大幅改善。

可以說,這是對AI開發現狀的精準判斷。

而ModelArts的價值也不僅是刷屏朋友圈,而是與其他AI開發工具一起,從全流程、普惠的角度針對性解決了今天AI開發中幾個最明顯的“槽點”。

想要明白ModelArts與AI開發生態的背後秘密,咱們要先從這些“槽點”說起。

寫到這,其實筆者心中的洪荒之力已經按耐不住了。因為長時間採訪AI開發者,筆者電腦和大腦裡都存儲了無數開發者的吐槽——要不是因為擔心收視率不高,我都能做好幾期AI吐槽大會了......

謝天謝地,好在這一切終於快結束了。

每一個都是戰士:夠開幾季“吐槽大會”的AI開發者們

好,大家嚴肅點,下面開始吐槽了。

經過長時間追蹤AI開發者,我們的記者團隊一致認為今天這個行業都是戰士。尤其是那些希望用AI開發來創業的,更是戰士中的斯巴達克斯。這裡咱們可以看幾種最有槽點,不對,是最典型的AI開發案例:

案例1:親朋好友一起上型AI開發者。我們知道,AI裡有個詞叫做AI民工,或者數據民工。就是說AI訓練之前,其實有大量時間沒乾別的,就是做數據標記。這個活其實非常簡單,但問題是極其枯燥大量重複,並且一旦某些數據標記錯,很可能帶給開發者後面訓練時以“無限驚喜”。

而我們了解到的情況是,雖然大家都在說所謂AI民工,但這個崗位由於非常新穎且上下不靠,即使在大公司也是稀缺資源。而對小團隊開發者來說,哪裡找AI民工來標記數據啊?所以很多人的解決方案,就是親戚群裡發紅包幫標點數據、老同學裡叫一聲幫我弄點數據,更有甚者我見過朋友圈眾籌標數據的——做AI,愣做出了拚多多購物的既視感。

案例2:“Boss求求你了”型AI開發者。這種開發者一般存在於科研機構和高校中,以在讀博士為主要人群。他們寫完模型,等著變成paper,於是想用學校買的架構驗證一下。那麽好,先登記排隊。輪到號了訓練一下一星期過去了,結果發現不太對?挑個參數又一星期,優化一下數據集又一星期。由於師兄師弟不少,還就經常輪不上你。

模型錯誤幾次,這類開發者和他們的導師都很容易抓狂。於是經常出現這樣一幕:某某AI博士哭訴“Boss大人求求你了再讓我算一次吧”。

案例3:創業焦慮型AI開發者。創業AI開發者,注重更多的是在部署和應用,而巧的是坑也在這裡。我們採訪過一個案例,開發者做了一個教育類的深度學習算法,但在部署時卻發現,TensorFlow上訓練的模型不支持大規模GPU並用,給後續帶來了無盡麻煩。

部署難,一部署就出錯,是很多AI開發者面臨的瓶頸。創業團隊辛辛苦苦訓練了個聰明的模型,一投入應用就變傻子,這感覺豈是一個酸爽了得。

案例4:理想豐滿型AI開發者。AI大潮襲來,也催生了很多非科班出身,尤其是IT工程師轉型AI。結果一入門發現,各種算法算力算子不計其數,調參配比極其複雜。而且AI的黑箱性還帶來一種“養蠱”的快感,入門級選手連錯都不知道哪錯了。最終只能是AI前景遠大,AI理想豐滿,AI讓我暫時撤退……

案例5:早知如此型AI開發者。 AI開發,經常要經過N個版本的優化和再訓練,當然這就跟做設計一樣,經常結果是第一版最好。於是經常出現老闆或者導師沉思了一下,說:我覺得三版之前那個蠻好的,找出來數據再優化一下吧。呵呵噠,三版之前是啥天知地知反正我不知——遇到這種情況,開發者經常只能捶地大喊:早知如此何必……

案例6:對不起有點狂,因為可吐槽的案例實在太多了,就說最後一個吧。還有一種“社區大神”人設的AI開發者,專注混社區五百年。貌似啥都會,就是不會賺錢。我們見過盜用大神分享的工具和數據拿到融資,但大神愣不知道的。AI開發人才如何實現IP保護和變現,其實也是個大問題。

AI開發,是個有多重要就有多少無奈的行當。

好在,以上這密密麻麻的槽點,已經被華為剛發布的ModelArts以及相關工具“一劍斬群寇了”。

讓“貝爺”們都進星級廚房:華為做了個什麽事?

假如說,開發者是一位位大廚,打算為我們端上美味的AI大餐。

那麽今天AI開發的問題,就是大廚們不是穿戴整齊走進廚房煎炒烹炸。而是上山找芯片調算力,下海找人標數據,進林子裡采工具,到亂世從中跑訓練。好端端的一位大廚,愣被割裂的開發場景和高企的費用給逼成了《荒野求生》的貝爺。

而假如一位廚師要從上山打獵開始做起,又怎麽能期望他燉肉效率高呢?

為什麽會這樣?

原因在於今天的深度學習訓練流程,是在一個個偶然、垂直條件下產生的。開發框架有的是最開始僅供少部分科研,有的是僅供企業內部調用;數據集和算子,是經過各種偶然因素,被不同人或組織開源的;AI算力,最早都是附加在IT算力上的“增值服務”。而一些自動機器學習項目,則噱頭價值遠大於實際部署價值——於是四面奔波,不斷解決兼容問題就成了開發者的常規操作。

而華為雲剛剛在HC大會上拿出來的ModelArts,特質就在於它把以上場景全都整合到了一套雲服務體系下。開發者可以不離開系統,完成從數據標記與訓練準備,到訓練、調試、推理、部署等所有工作。

這就好比打造了一整套星級廚房,裡面有水電燃氣,各種廚具食材,那麽開發者將省去前面無比漫長的準備工作,直接一展廚藝可矣。

具體來說,名為ModelArts的廚房,跟以前常規用的“野炊”模式相比,有四大直觀改變:

一、食材隨意購

AI開發者能夠快速完成數據標記,就像廚師能夠快速買到食材一樣重要。畢竟做廚師,沒有先從養殖場乾起的——知道的我是AI開發者,不知道還以為我是數據農家樂呢!

針對最耗時的數據標記環節,ModelArts內置了AI數據框架,以AI機制來治理數據,用迭代訓練來解決標注的數據量問題。也就是讓AI來完成數據標注本身,不斷優化數據集,從而讓數據標注與準備效率百倍提升。

當然,數據還是開發者來準備,只是準備體驗將獲得巨大躍升。

二、開灶有火

AI模型的訓練速度,關乎於AI算力的提供,也關乎於訓練平台的路徑優化。AI訓練過程就像點火做飯,火夠大當然炒菜更快。針對訓練效率問題,ModelArts通過各類優化技術,達成了在同樣的模型、數據集和同等硬體資源情況下,模型訓練耗時降低一半——換句話說,這意味著同樣算力可以供給多一倍的開發者使用。

三、廚具齊全

上面說過,AI最怕部署,有些AI模型甚至有“見光死”的特點。尤其面對部署在不同的軟硬體架構上,給人一種東家借口鍋,西家偷個鏟的感覺。而基於全棧AI解決能力,ModelArts實現了一鍵推送模型到所有邊緣、端的設備上的能力,並支持在線部署和批量推理,滿足大並發和分布式這些最困難的部署方式。可謂一應出具俱全,做出什麽菜式都不在話下。

四、還有廚房家電都能幫忙

AI開發者的最後問題,可能是機器學習訓練中的技術門檻。針對於此,ModelArts不僅給出了明確的教學演練,還創造性地引入了AI自動學習功能,包括模型的自動設計與自動調參等,可以給開發者智能化幫助。

此外,ModelArts還實現了全流程可視化管理,不管丟在哪裡的數據和模型都能準確找到,這也間接有利於AI黑想象的攻克。

這些蘊藏的“AI黑科技”,就像冰箱微波爐這些現代廚房神器,以AI開發AI,降低開發者技術門檻,或許是接下來新的潮流。

值得注意的是,華為雲這次不光發布了“廚房”,還帶來了“餐廳”。於是我們看到了機器視覺開發平台HiLens,以及離線開發套件Atlas 200 、量子計算模擬器與編程框架HiQ,讓開發者可以模擬重要環境的實際應用場景。

據華為雲介紹,ModelArts將在年底前上線,我們會第一時間帶來上線評測。

全棧AI的第一個紅利:為什麽ModelArts敢說“全生命周期”?

在採訪中,華為雲認為,目前業界的AI開發平台,問題是都相對場景單一,不夠全面。而ModelArts則率先做到了全生命周期開發,可以支撐和管理AI開發當中的每一個環節。上面我們也說過,將割裂場景整合到一起,構成全生命周期AI開發,是ModelArts倒逼解決慢與貴的核心優勢。

這裡有個問題值得注意,相信也是大家所關心的:顯然每個人都知道廚房更好用,不想去野地裡做飯,那麽為什麽只有華為的ModelArts,在今天敢說自己是“全生命周期”?

我們或許可以這樣理解:在華為全棧AI體系剛剛發布48小時,ModelArts與視覺AI應用開發平台HiLens、離線開發套件Atlas 200 、量子計算模擬器與編程框架HiQ四件套代表的AI開發平台已經變成了第一個紅利級產品。事實上,ModelArts本身就是華為全棧AI體系的組成部分。與芯片、架構、AI使能平台緊密相連,從而能夠一個場景跑通所有數據、訓練、推理的需要。可以說是剛剛發布的華為全棧AI,探出的第一根觸手。

其次,全生命周期的AI開發,算力是一切的基礎。在昇騰芯片到來後,華為獲得了能夠組織大規模AI並聯算池的機會,從而可以保證全場景AI開發運行無阻。這裡有一個環環相扣的AI推導邏輯。

再者,我們確實可以看到,今天無論是世界巨頭還是獨角獸公司。所推的AI開發平台都是基於自身的業務考量。不會有公司推出一個與自己業務不想關,甚至自身能力之外的AI開發平台。所以我們看到AI開發場景,依然是東一榔頭西一棒子的狀態。

而華為雲,則是圍繞用戶為中心打造了AI開發平台,以不讓開發者奔波為第一思路。並且確實認真看了哪些複雜可以留給自己,找到了很多關鍵矛盾的背後邏輯,並將之消解化。這歸因於華為的IT儲備優勢,但更歸因華為雲“複雜的歸自己”以及“解決實際問題”兩大核心理念。

對比之下,以往的AI開發平台,更多是以自身產業利益為視角構建產品,而不是以開發者為出發視角,或者說不具備以開發者為中心,清掃問題的產業條件。

當全生命周期的AI開發平台開始出現,本質上意味著某些AI產業的“黑歷史”將開始瓦解。無論是華為雲還是其他品牌,很快會讓AI開發變成一個拚創意與想象力的遊戲——而不是勞動力、資金成本與技術門檻相互競底的搞笑節目。

未來的某個時刻,我們會回想起那段AI開發能開“吐槽大會”的日子,後輩會覺得簡直不可思議,往事杯酒,幾成笑談。

但那時已經遍布AI的世界,卻並不會笑我們。因為從鑽木取火,到探索人工智能,歷史會記住每一位開發者都是偉大的。

獲得更多的PTT最新消息
按讚加入粉絲團