每日最新頭條.有趣資訊

華為想要乾掉的不止是AI民工

在10月10日啟動的華為全聯接2018大會上,華為輪值董事長表示雖然當前AI的發展令人感到興奮,但是仍舊存在較大的落差。華為認為,要讓人工智能真正改變人類的未來,當前人工智能必須做出10項改變。

而這些華為口中的改變,至少會影響到人工智能領域裡的兩類人:一類是人工智能領域目前暫不可少的數據標注AI民工;一類是具備高級技能的AI人士或專家。

1.為什麽說AI民工將會被快速取代?

對於當前人工智能來說,有了越精確的數據標注,才能夠獲得越好的算法模型。但是這些結構化的數據往往來自人工一點一點的標注。往往需要人工為文字、圖片、語音、影片進行數據標注,人工智能公司再將其用於模型訓練。

可以想象,如此繁重的工作是如何進行的。甚至,我們不妨以例子進行說明,在AI界大牛李飛飛參與建立的ImageNet數據集中,當時來自167個國家的48940名工作者,總共花費了2 年時間,共清理、分類、標記了近十億張通過互聯網搜集到的圖片,最終得到的才不過是擁有1500萬張標注圖片的數據集。繁複程度可以想象。

極客公園曾經在6月份對此進行報導,並稱其為“數字富士康”,這多少表明了數據標注是一種勞動密集型的行業。雖然數據標注是必不可少的一環,但這些標注者在AI產業鏈條中所處的生存環境也並不十分友好。造成這種問題的很大一部分原因是,“原來乾淘寶刷單的,現在也能搖身一變做 AI 數據標注。”甚至騰訊在微信建立了一個眾測平台,面向社會大眾進行數據標注,並提供一定金額獎勵。這多少也說明這個行業的需求以及門檻。

但值得注意的是,在標注過程中出現標注問題就勢必影響算法模型。而AI最終想要實現的卻是取代大量重複的工作。似乎是一個悖論,畢竟智能背後站著人工。甚至不妨得出“有多少智能就有多少人工”,甚至有人以貓教會老虎捕捉的故事表示,“即使是被替代,數據標注師也將是最後一批被替代的人。”

但在華為那裡,認為這種現狀是急需改變的。如此效率低下的重複標注,仍舊依賴於人,顯然只要依賴於人,就會是效率低下的。華為在10條改變中的第五條表示,未來這一過程將是自動化/半自動化的。尤其是在數據標注、特徵提取,模型設計和訓練等方面。似乎只有這樣才能實現AI的快速智能化,進而避免“沒有人工就沒有智能”的尷尬局面。但是到底如何實施,在華為的表述裡並沒有呈現。但可以想見,到了這個時候作為AI民工的數據標注人員或許真的沒有存在必要了。但那在目前來說,或許更多的是一種期望。

2.具備高級技能的AI人士會去哪裡?

但華為期望的改變並不單單局限於數據標注該領域。如果說數據標注僅僅牽涉到底層的AI民工的話,那些擁有高級技能的AI人士呢?

在去年這個時間,各大媒體紛紛表示當前AI人才的欠缺,並指出AI領域人才薪酬令人豔羨。甚至在年底期間,這種人才的緊缺與被看好,通過各大高校紛紛設立人工智能學院而凸顯得更為明顯。大量院校跟風似地設立人工智能學院,並沒有實際考量自身是否有著相應教學能力,這無疑讓人擔憂。但它確實成為了一種風氣,似乎人工智能馬上就會實現巨大的躍進。

然而,這個領域真的需要那麽多技術大牛去從無建立一切嗎?答案顯然不是。重複性的無意義的工作顯然是會被取代的。基於此,華為表示希望實現由一站式平台支持的基本技能。進而讓這些高技術人才、專家有其他用武之地。

華為是這樣說的,也是這樣做的。在10月10日的全聯接大會上,華為發布了全棧式全場景的解決方案。所以真正的技術大牛會進入到更為基礎的研究工作中去,而即將培養出來的AI人才可能將做的是成為當前程式員一般的角色。僅此而已。但那天何時到來,或許就看大廠的進度了。

獲得更多的PTT最新消息
按讚加入粉絲團