每日最新頭條.有趣資訊

商湯聯創林達華:AI產業化挑戰才剛開始

開放才能擁抱森林。

文 | Tech星球 周曉奇

“如果大家要找一棵大樹,都會想到去森林裡面找,人工智能也一樣,其中細分場景和細分應用非常多,我們要擁抱開放的生態,這是最關鍵的創新驅動力”,商湯科技聯合創始人、CEO徐立說。

7月10日,在全球人工智能大會商湯企業論壇上,徐立在演講中宣布OpenMMLab戰略升級,成立由商湯科技發起的“人工智能算法開放體系”。

戰略升級後,OpenMMLab人工智能算法開放體系將涉及超過10種研究方向,覆蓋超過100+算法和600個預訓練模型。

“OpenMMLab是由我發起的一個計劃,參與人員有我一部分的學生和商湯的研究員,後來逐漸演變成整個商湯人工智能開放的體系,目前我會統籌這個開源體系的未來發展規劃”,商湯聯合創始人、香港中文大學信息工程系教授林達華說。

2018年,香港中文大學與商湯科技聯合實驗室(MMLab,MM代表多媒體)啟動OpenMMLab計劃,過去兩年內,MMLab逐步開放了多個開源算法庫和工具箱,並獲得越來越多AI研究人員的使用和回饋。

“儘管我們的算法面向公眾、學術界和產業界,但開源算法不是針對一些特定的落地場景需求去開發的,任何一個具體的場景都有獨特的需求,企業需要懂得如何將產業需求與算法結合起來”,林達華說。

作為一家技術驅動型企業,商湯不但要解決技術上的難題,而且也需要接受產業落地的挑戰。為此,對商湯而言,成體系的算法框架平台,不僅能夠提高開發人員想法落實的效率,還能夠提升整體生產力。

如今,經過多年發展的人工智能,已經應用在安防、教育、旅遊、娛樂等領域,接下來AI模型應用到更多關鍵領域時,如何提高決策可靠性,也成為今後面臨的重要挑戰。

不可否認,目前人工智能在技術上已經達到非常高的水準,但背後仍舊需要海量數據與巨大的算力。

今後,AI如何更好地應用到產業?在此其中,商湯會重點布局哪些方面?在開源算法日益增多的情況下,AI企業如何提升自己的競爭力?近日,Tech星球專訪了林達華,以下為對話實錄:

開放:不要獨木要森林

Tech星球:OpenMMLab人工智能開放體系在商湯內部是一個什麽樣的地位?OpenMMLab有哪些價值?

林達華:OpenMMLab是商湯人工智能算法開放的一個體系,也是商湯擁抱開源開放非常重要的戰略性一步,其最重要的意義是與整個AI產學界開源體系的連接。

AI算法研發的過程是非常複雜的,從一個簡單的想法到最後落地,其中需要非常多的步驟,在算法開發層面需要很多工程化方面的實現,這些都需要花費大量實踐和工程資源。

OpenMMLab的價值在於,可以基於其提供的框架順勢形成落地技術,加快研發的流程。

Tech星球:在什麽時候決定將OpenMMLab定義為人工智能開放體系?當時做出這個決定的契機是什麽?

林達華:首先OpenMMLab在兩年前就逐步開源了一小部分代碼庫,當時我們知道學術界在實現一些算法的時候存在很大的困難,後來在算法實現過程中,我們發現缺乏統一的、具備良好結構的代碼庫 ,對目前產研界是一個非常巨大的痛點。為此從今年初,我們開始做準備,在當下將OpenMMLab定義為人工智能開放體系。

Tech星球:目前OpenMMLab聚焦在十個研究方向,選擇這十個研究方向是有經過怎樣的考量呢?

林達華:我們在方向上的選擇,主要還是看學術界和產業界最普遍需求的是哪些方向,以及商湯有比較多算法積累的方向。具體這十個方向有圖像分類、圖像檢測、語義分割、動作識別等,這些是計算機視覺領域最主要的方向,也是實際運用中最廣泛推動的一些方向。

Tech星球:你覺得OpenMMLab的開源,對開發者本身工作有什麽幫助?能給他們帶來什麽?

林達華:一句話總結,就是他們從想法到實現的路徑大大縮短了。以前沒有這些開源代碼庫支撐的時候,他們實現一個算法,需要經歷非常多工程上的支撐和實踐。現在有了這樣的代碼庫,有了很多架構的支持,對於一個有新想法的研發人員來說,他只需要把創新的部分實現出來,其他的部分可以依托開源代碼庫實現。

比如實現一個物體檢測的算法,從看到論文到實現算法,並且把精度調整到論文的水準,可能需要花上兩三個月的時間,現在從想法到落地,只需要幾天的時間。

從技術到落地,沒有那麽簡單

Tech星球:OpenMMLab對技術轉化為生產力的過程中,有哪些具體幫助?

林達華:我們之前接了一個項目,客戶要求在一兩個月時間內,交付60多個模型。當時我們有十幾人在這個項目上,要在短時間內要交付這麽多模型,而且性能等方面還需要達到一定的水準。

通過OpenMMLab的支持,以及商湯其他模型基礎,我們每天都可以交付幾個模型,而且能夠保持一定的水準,這種算法框架和平台對提升商湯整體生產力的作用很大。基本上有和沒有這個平台,相差非常大。

Tech星球:你覺得目前商湯在從技術到產業落地的過程中,商湯會遇到哪些挑戰?

林達華:兩個方面,一個是技術層面,一個是落地層面。我們發現技術向各個行業落地的時候,會有不同形態上的演變。比如以檢測為例,我們在街上檢測人臉、在工廠場景下檢測零組件、在醫療圖像中檢測病理特徵,本質上這些都是檢測,但同樣的算法在不同場景落地,會演化出非常多不太一樣的版本,這會給技術積累產生很大的挑戰。

其次,在落地層面,我們要深入地理解每個場景的需求和痛點。當我們沒深入某個行業的時候,會對這個行業有自己的想象,但深入之後會發現其實是另一番風景,這對從技術背景成長的同事是一大挑戰,這也就要求我們既需要懂技術,也需要懂行業。

Tech星球:從基礎研究到商業化落地,商湯如何協調這兩者之間的關係?

林達華:兩者並不是相互矛盾的事情,其實是相輔相成的。首先,商湯在研究過程中,也會從開源項目中吸取內容,因為裡面各種參數都調好了,這樣實現路徑就會變得非常短。

同時,商湯在研發過程中也會產生大量算法,我們會將這些成果貢獻到開源項目中,這樣一方面縮短我們研發的速度,也會加快商業化落地的步伐。

AI實現產業化,但挑戰才剛剛開始

Tech星球:現在有些看法表示,相對成熟的開源算法加上實踐過程中硬體條件、外部施工等方面的影響,最終大家體現的效果不會相差很多,這可能不利於擁有真正先進技術的AI企業,對此你怎麽看?

林達華:首先,如果一家企業的獨門算法或技術的效果與開源算法差不多,那這家企業需要問自己的主要價值在什麽地方,每個企業一定要尋求自身獨特的價值。

其次,做開源是面向社區、學術界和產業界,這些開源算法不是針對特定的落地場景需求去開發的,我們會發現任何一個具體的場景都有自己獨特的需求,這不是一個開源算法拿過去就能解決的。

企業要有捕捉獨特需求的能力,這也是核心競爭力的一部分,之後要懂得怎麽把產業需求和算法結合在一起,實際上開源算法能夠更快地將想法實現的過程縮短,讓企業發揮競爭力。

如果一個企業因為算法的開源發現自己的技術喪失了競爭力,那我覺得他應該要去好好思考自己工作的定位。

Tech星球:去年底,你提到CV(計算機視覺)才剛剛開始,你覺得今年CV廠商將處於一個怎樣的情況,在這個階段商湯會重點布局哪些方向?

林達華:如果類比一個人的成長,他是有百年的歷程,現在我們剛剛才做了幾年,所以也剛剛進入少年期。

原本在2010年之前更多是學術界的事情,後來商湯等公司出來後,CV(計算機視覺)處於產業化落地時期,今後隨著更多人的加入,CV會從某些重要領域的工業化,逐漸走向全社會普及化的階段。

不過,雖然我們看到CV行業的領域在不斷擴展,但同時也在面臨更大的挑戰。我們可以看到經過這些年的發展,在技術、工程上已經有了非常高的水準,但也會看到其依賴巨大的算力,依賴大量數據,這樣在場景落地上會面臨比較高的代價。

同時,AI與更多領域結合的時候,如何克服新的挑戰。比如AI應用到醫療、自動駕駛等關鍵領域,我們如何提高AI在決策時的可靠性,這些都是未來面臨的重要挑戰。

Tech星球:你如何看待現在整個人工智能開源的現狀?對未來有哪些看法?

林達華:目前人工智能領域的開源,還處在起步和百花齊放的階段。我們可以看到Facebook、Google等公司在開源開放方面的努力,但更多是單點、單一方面想的開源,未來整個領域會從單篇論文、單個方向的開源,逐步走向開源體系,最終形成非常蓬勃的體系,這樣會減少科研實現路徑與付出的代價,以及加快業界落地的速度。

獲得更多的PTT最新消息
按讚加入粉絲團