每日最新頭條.有趣資訊

技術出海序章:國際開源基金會的實踐與思考

作者介紹

文章大綱:

導言

1. LFAI基金會的組成

2. 我在LFAI的工作

2.1 重拾話語權

2.2 建立夥伴

2.3 出代碼,構建健康向善的AI生態

3. 我們到底需要怎樣的AI開源

3.1 給希望參與建設AI開源社區開發者的話

3.2 開源即創業

導 言

從2019年3月起,我開始代表騰訊在Linux Foundation Artificial Intelligence (LFAI) 開源基金會中兼任Board Member(董事)。Linux 基金會成立於2000年,目前是世界上最大的非營利性開源聯盟;而LFAI作為Linux基金會旗下專注於人工智能方向的子基金會,成立於2018年。其擁有來自騰訊、AT&T、諾基亞、華為、中興、百度、愛立信、IBM、滴滴、RedHat等13家公司會員。來自騰訊TEG數據平台部的開源項目Angel分布式機器學習框架和來自Uber的Horovod分布式訓練框架目前都在LFAI基金會中孵化,並即將畢業成為Linux基金會中的正式項目。

那麽在LFAI基金會的200多天裡,我都做了哪些工作?開源基金會的日常運作是怎麽樣的?我從中學到了什麽?在這篇文章裡我會向大家一一介紹。希望能讓大家對非盈利組織的日常運作有更多的了解,對國際開源聯盟有更多的興趣。

在AI技術日趨工程化的今天,開源社區需要什麽?我們又該如何構建一個有價值的AI開源項目?中國AI技術在出海時又會遇到哪些困難?我也希望與大家分享下我在這幾個問題上的個人理解。

在行文上,我盡量不涉及專業但又不失專業,希望讓更多擁有不同背景的讀者都能夠讀完全文,對中國AI技術開放和國際化上有些不同的認識

Linux FoundationArtificial Intelligence (LFAI) 開源基金會

LFAI基金會的組成

LFAI基金會內部組織架構分為管理(Governance)、技術協調(Project Coordination)和項目實踐(Technical Project)三個的方向的團隊。其中管理團隊決定了基金會的發展和運作方式,具體可細分為董事會(Governing Board),業務拓展子委會(Outreach),法務子委會(Legal),經費子委會(Budget),策略子委會(Strategy)和2019年9月新成立的AI倫理子委會(Trusted AI)。

由於LFAI基金會成立時間不到兩年,人員相對稀缺,所以來自會員公司的負責人往往會同時參與多個子委會。比如我自己除兼任董事成員外,也在業務拓展子委會中幫助LFAI在國際開源社區中上擴大影響力。每個子委會都有自己的主席(Chair):董事會的主席自然也就是LFAI的主席,由在開源領域15年實踐經驗的Ibrahim Haddad博士擔任;業務拓展子委會主席是由自華為SoftCOM AI的CTO Jessica Kim擔任;值得一提的是,來自於騰訊研究院的高級研究員曹建峰和來自IBM的Jim Spohrer和Animesh Singh共同在此擔任AI倫理子委會中擔任聯合主席。關於AI倫理子委會的故事,後面我會詳細的介紹。

LFAI內部組織架構及參與在LFAI基金會日常事務的諸位騰訊同事

技術谘委會(Technical AdvisoryCouncil)是LFAI技術策最重要的組成部分,其成員主要來自於各個公司的一線技術人員,用於把控開源項目的技術質量。Angel的核心開發者Fitz就是其中的一員。

技術谘委會也是一個開源項目進入基金會孵化和從基金會畢業時所需要面臨的第一關。這個過程有點類似於答辯:外部開源項目的負責人被邀請到技術谘委會的電話會議上進行一個40分鐘的演講,接受谘委會成員的提問。技術谘委會隨後會發起一個投票表決,通過項目的技術含量、開源生態、社區互動等幾個維度決定該項目是否可以進入基金會孵化。

當一個孵化的項目準備從基金會中畢業時,技術谘委會會再次通過答辯、投票表決的形式評價該項目的成熟度,報告給董事會,最終由董事會投票決定。成功畢業的開源項目會獲得Linux基金會資源和社區上的全力支持,每年也會獲得LFAI基金會的現金資助。除此之外,技術谘委會也會定期在線上跟蹤孵化項目的進度,從而保證LFAI下各個開源項目的健康。

我在LFAI的工作

從2018年LFAI成立起,騰訊就是該基金會頂級會員。不過由於行事過於低調,我司在基金會中的存在感比較低,尤其在基金會的一些決策上沒有能充分利用好頂級會員的權利。為此,Linux基金會的負責人在2019年3月來訪騰訊時,還特意友好的提醒了我們要增加與基金會的互動,積極行使創始成員的權利和責任。

2019年初,隨著我進入騰訊技術管理委員會下設的對外開源管理辦公室,我從上一任手中接過了LFAI負責和代表。在AI開源方向,我有些成功的經驗。我的Fashion-MNIST和bert-as-service開源項目分別被評為2017、2018年世界範圍內最為流行的AI開源項目之一,在社區內產生了不小的影響:Fashion-MNIST已經成為機器學習入門基準數據集之一,而bert-as-service開啟了預訓練模型服務化的先河。

除技術之外,我也比較熟悉非盈利組織的運作方式。我2017年在德國注冊成立的德中人工智能協會,從一開始的7個人一步步發展到如今德中兩國超過700名會員,14位國際化的管理團隊成員,還被Nature雜誌提及。因此對於非盈利組織的運營方式、國際化團隊的領導和文化互信上我都有較為清晰的理解和實踐經驗。在接過此棒時,我有著極大的信心和熱情去做好騰訊和LFAI基金會之間的工作,增進互信合作,擴大雙方在AI開源社區上的影響力。

2.1 重拾話語權

在接手LFAI的董事工作之後,我做的第一件事情就是仔細閱讀LFAI基金會的章程(Charter),了解基金會的條例、選舉投票規則和不同級別的會員權利。

對於非盈利組織(NPO)不太熟悉的朋友,可能不太清楚章程是什麽。我在這裡解釋一下,每一個非盈利組織都會有一個章程,這個章程規定了組織的目的、興趣範圍、運作方式、會員權益和選舉規則。章程之所以非常重要,是因為當地法院一般會對非盈利組織的章程進行備案,是有效的法律約束。如果出現糾紛,無論是內部糾紛還是NPO與外部的糾紛,章程都可以在必要時作為法律依據。而章程上的更新,需要會員表決通過後再到法院重新備案。

了解LFAI的規則和玩法之後,我要做的就是重拾騰訊在基金會中的話語權。具體來講包括,積極與主席和其他董事互通郵件,按時參加月度的董事會、各個子委會的工作同步,並且對征詢和投票提出意見。這些看似簡單瑣碎的小事,能夠堅持做到卻並不容易。在接管LFAI的工作後,我發現騰訊在技術谘委會(TAC)和業務拓展子委會(Outreach)中的代表席位都是空缺,於是我便把這兩個職位也都接了下來,積極參與到他們的日常討論中。等到我熟悉了各個職位的目的、使命和規則後,我再把職位分派出去。

身兼數職的我在忙時,一周連續三次不同主題的視頻會議,被安排在晚上11點、12點或是早上7點。我這樣做的意義,一方面讓自己去熟悉這些子委會的話題,明白每一個子委會到底是做什麽的,日後可以更有效的舉薦騰訊內部合適的同事參與討論;另一方面也是釋放一個積極的信號,讓其他的成員留下騰訊在基金會中積極參與的印象。

雖然基金會下中國會員公司不佔少數,不過以我幾個月來的觀察,國外公司在每次討論時話題的參與度往往較國內友商更為積極。這其中語言和文化上的差異是一部分原因:中國人在表達自己觀點時會比較害羞。另一個原因是對基金會章程和非盈利組織的玩法的陌生,也使得國內公司在討論時未能涉及重點,在行使權利時也不夠高效。

我這裡舉一個開會時的小細節。LFAI基金會每次開視頻會議的時候都會走一套固定的流程:

簽到(Roll Call) -> 表決上次會議紀要(Approval of Minutes)-> 處理具體事務 -> 表決 -> 最後5分鐘自由討論。

這一套看似八股文的固定流程,實際上每一個環節都不可或缺。比如簽到(Roll Call)的目的是確保法定人數(Quorum)足夠,此會議中的表決才有效。上次會議紀要的通過是確保所有參會人員對到現在為止的決議都達成了共識。值得一提的是,在會議中的每一次表決時,會議主席(Chairperson)可不是直接讓大家舉手進行Yes/No/Abstain(棄權)投票。而是首先需要得到至少兩個與會人讚成這個投票動議(to second this motion),然後才能向大家發起投票。如果沒有人表態讚成這項動議,那麽主持人只好放棄此動議。這一套流程看似多此一舉,卻能夠有效避免Chairperson發起無意義的投票,在參會人數較多時能夠保證會議高效進行。實際上,這套議事流程正是《羅伯特議事準則》(Robert’s Rules of Order)中的一部分。

一次技術谘委會的例會中會議主席如何發起動議促成某開源項目進入LFAI孵化

有人可能會問,知道這些形式主義的東西有什麽用呢?反正我又不是會議主席。

這一認識也是有誤的,會議主席(the Chairperson of themeeting)和LFAI的主席是兩碼事。會議主席可以是輪值的,也可以是被任命的。當你有一天做為會議輪值主席時,如何有效的組織大家表決動議,如何展示出中國公司對規則的尊重和在細節上的認真態度,就顯得尤為重要了。清楚規則,尊重規則並且熟練運用規則,是贏得國際友商的信任的重要一步。

隨著我在基金會中的互動增加,話語權逐漸回歸。國際友商看到騰訊在此展現出的積極態度,都釋放出了友好合作的信號。我的兩個提議:將LFAI的日常會議時間提前以方便亞太地區的會員公司參加,及將董事會面對面的地點從美國移到歐洲以減少國內AI人員赴美參會時遇到的簽證問題,都得到了其他成員的支持並已經落實。在基金會的一些重大決定上,包括年會舉辦、項目孵化流程和預算規劃上我也都積極參與決策,並提出建設性的意見。

2.2 建立夥伴

信任和友誼是所有合作的基石。而建立友誼最有效的方式就是一起去做事情。

2.2.1 與華為合辦上海LFAI開發者沙龍

2019年6月初,LFAI基金會為了擴大在中國社區中的影響力,籌備9月份在國內舉辦一次線下沙龍活動。但是基金會的人力資源遠在美國,所以活動的真正落地還是需要依靠幾家中國會員公司。我相信無論是AI的研究者或是開源代碼的貢獻者,大家都會享受站在台上被聚光燈環繞的那一刻。但是對於會議的預備、組織、物流等各種繁瑣前期工作,能夠自告奮勇站出來的人大概不多,尤其是非盈利組織的活動。對於第一次在國內舉辦活動的LFAI,國內會員公司更多的是持觀望態度。在這個時候,來自華為SoftCOM AI的CTO Jessica Kim站出來願意提供會議籌備上的支持。

在和騰訊開源辦公室的同事商榷後,我代表騰訊很快站了出來願意與華為合辦好這一次活動,此時國內的其它會員公司還在觀望或沉默。就這樣,由華為、騰訊以及Linux基金會亞太地區負責人組成的會議籌備小組成立。大家商定好每周的同步時間,從會場、宣傳、直播、物流、嘉賓等多個方向相互配合。在會議開始的前一天,我還與會議籌備組的朋友們一起在咖啡廳去編排會議流程,以確保各個環節順利進行。當你環顧四周,看到來自不同公司的朋友們努力做好同一件事情的時候,是會被開源的力量所感染的。

在這裡我要特別感謝騰訊TEG辦公室Xingjia和Barnett在直播上提供的技術支持,兩位同事專程從深圳來到上海確保了直播的順利進行。最終,第一屆LFAI開源沙龍活動上海站吸引了100餘人的現場參加和線上1500人次的直播觀看,來自華為、騰訊、阿里、百度、滴滴、微眾銀行等開源項目負責人在此沙龍中做了主題分享。Linux基金會亞太地區的幾位負責人和代表出席了會議,他們高度認可會議的質量。LFAI的主席Ibrahim和其他成員在之後的視頻會議中也對籌備組的執行力讚不絕口。對這個結果我還是很滿意和驕傲的,這件事的成功也讓我們在基金會中建立了友誼交到了夥伴,這比會議本身的成功更為重要。

LFAI基金會上海站開源沙龍活動

有人可能會問,你不是做開源社區麽,怎麽講著講著感覺做成會議接待服務了?

真正做開源社區就是這樣,不是每天站在聚光燈下講話宣布個某某軟體開源就是做社區了,開源不是開發布會,不是做個單方面的PR就完事了。做開源社區是需要接地氣的,是需要有人去做這些不起眼的瑣事去持續性的維護。你可以把會議組織的瑣事就像解決一個一個的線下」Issues/Tickets」,就如同線上的一樣,這些Issue同樣來自於社區而服務於社區。無論線上線下,只有對解決Issue抱有耐心,才能做好開源的社區化。如果開源作者想的全是如何在閃光燈下搞個大新聞,那就如同把項目放在Github上後不再去維護一樣,這一定不會是個成功的項目。

也有人會說,你費了那麽大勁兒,聯合騰訊華為兩家的資源力量,最後隻搞了個100人的小會,還有什麽可在這說的呢?

要知道,公司再大,真正落實做事的是個人。對於開源這盤新遊戲,它帶來的價值往往是不能通過短期KPI/OKR來量化的,它的打法也不是每一個人都熟悉的。就好比一個人下了很多年的圍棋,段位很高且樂此不疲,這時候你走過來突然說我們來打麻將吧,麻將好玩。你覺得他能和你一起玩麽?所以,如何去說服大家去認同開源價值,有效地整合資源,無論公司大小這都是真正做事的人需要解決的實際問題。

就我個人而言,我不太喜歡一次搞個大新聞,弄得好幾百人參會然後媒體爭相報導。前進的步子不需要一次邁的很大,只要一步步朝著正確的方向就可以了。

2.2.2 為IBM的入會背書

2019年8月,IBM決定加入LFAI成為會員公司,這無疑是對基金會的重大利好。從Deep Blue深藍到Jeopardy智力搶答,IBM在人工智能方向上的貢獻和成就是大家有目共睹的。此次IBM加入LFAI也帶來了它在AI倫理上的幾個重要開源成果:AI Explainability 360, AIFairness 360和Adversarial Robustness Toolkit,這將完善基金會在可信任及社會責任AI上的技術光譜。對於把科技向善作為公司使命的我司來說,也可以借此機會相互交流經驗方法,探尋合作的可能性。

在LFAI與IBM正式發布新聞稿之前,LFAI主席Ibrahim希望先向現有會員征集對IBM的引薦和背書(quote),表達對IBM加入的歡迎。這麽一個簡單的請求,很容易被遺忘在每天的繁忙工作中。但其實短短的一兩句話幾分鐘的時間,為國際友商幫個小忙,可以展現出我們在基金會中開放友好的形象和外交技巧。雖說小信未孚,但很多細枝末節的小事,一點一點夯實,這樣建立起來的信任往往更加牢固。

各個會員公司為IBM加入LFAI基金會的引薦

在今年4、5月時,中美貿易戰緊張,美國科技公司接連服從出口管制,再加上Github又封掉了幾個账號,一時間國內開源技術社區也弄得風聲鶴唳。

很多技術人員擔心平時依賴的開放平台是否有朝一日不可用,是不是需要在國內重造一批輪子。無論是開源基金會還是個人開發人員,心情上多多少少都會影響。

開源本是件帶有理想主義色彩的事情,而到這種時候理想主義者也難免被迫站隊。相對於重新造輪的Plan-B,我更想強調的是日常Lobby,即遊說,尤其是技術文化上的遊說。有些人可能管這個叫Advocacy或Evangelist。技術外交,簡而言之,就是要讓我們在國際上交到好朋友,形成聯盟。我認為,外交不該只在危機來臨時去突擊,而需要貫徹到每天的日常中。

具體如何做呢?比如在基金會中,積極參與日常討論和事務處理,與國際夥伴之間形成良好溝通,建立文化互信;與各個國外公司開源辦公室的負責人保持良好的關係,定期互訪;再往深了做,可以共同制定規範和標準。又比如:很多國際夥伴認為中國技術大多抄襲和跟風,中國企業對社會責任感缺乏理解,這就需要有人站出來去演講、去回答、去在圓桌會議中開誠布公的談論。借助國際開源平台、內外會議、民間meetup等實現技術人對技術人的遊說,從技術文化層面建立互信。公司之間相互利益固然重要,但對於一個技術公司,技術文化上的互信是合作的基調,畢竟具體做事情的是個人

我在德國、奧地利科技公司與其開源項目團隊交流

無論是Linux基金會還是Apache基金會,在國際開源基金會的每一位公司代表都應該是一個好的Lobbyist,他/她能在國際社區中展示出一定的個人魅力、感染力和外交能力,擴大技術「朋友圈」,樹立友好形象。

對於一些剛入行的工程師來說,做Lobby的意義短時間內不好理解。畢竟從「talk is cheap, show methe code」的不talk,到用於「talk openly」需要一定的時間和經驗積累。技術遊說讓我們能跳出日常的二進製思維,一方面布道技術影響力,另一方面也在國際舞台上展示中國企業的開放友好姿態。如果某一天形勢所迫真的需要大家去站隊時,即便是理想主義者的我也不會期待每一個公司都能頂住壓力挺中國,但我希望這些夥伴心裡能夠明白真實的中國是值得互信和合作的。

在去全球化、單邊和民族主義盛行的今天,我聽到不少關於開源協同的悲觀言論。我希望用Jimmy Wales(維基百科創始人)的一句話和大家共勉,重拾信心:

「Rabit nationalism and rabit racist areeternal human theme, they rise and fall. They will fall when we realize ashuman we aren’t so difference at all.」

2.3 走出代碼,構建健康向善的AI生態

2019年9月,LFAI基金會下的Trusted AI子委會正式成立,旨在解決開源項目中的AI倫理衝突以及可信任、可解釋性等諸多新問題。而子委會所探求的解決方案,既可以是具體的技術方案,比如前文中所提到的IBM AI Fairness 360;也可以是宏觀的框架。AI到底向不向善,這個問題不應該是AI工程師們在辦公室裡敲代碼敲出來的,而應該集思廣益,尊重並整合社會科學以及其他領域的多邊意見。實際上,對社會科學正確的理解往往比解決那些所謂的AI挑戰性問題更為重要。

我這裡舉一個例子,最近EMNLP 2019(一個國際一流的自然語言處理會議)接收了一篇擴展Attention注意力機制的深度學習模型」read-attend-comment」論文。該論文提出了一個端到端的深度學習方案根據新聞內容去自動撰寫評論。拋開模型的技術實現,這個研究是否會造成倫理上的問題論文中沒有進行任何的提及和討論。實際上,這種構建假新聞(disinformation)、假評論(trolling)的AI一旦被廣泛使用是會對社會的信任感造成潛在危害的。研究人員往往過分沉迷於技術本身,而忘掉了自己也始終是社會的一員;無論你專業領域多麽聰明,聰明永遠不是逃避社會責任的借口。

有人可能會說,你可別在這給我扣大帽子了,我在EMNLP發個學術論文怎麽就扯到社會責任感上了呢?如果你是AI從業人員,那你一定知道,當今的AI已經高度工程化,從你的論文到代碼實現再到app上線,這其中的門檻已經比10年前降低太多,或許一兩周的時間,你所提出的技術就可以被部署投入實用。在明知可能造成社會負面影響的情況下,不去在論文中主動提及,如果這不算是逃避,那就是說明AI方向上倫理(Ethics)和合規(Compliances)的普及還不夠深入人心。

縱觀人類史,無論是火藥、炸彈、還是核能,歷史一遍又一遍的告訴我們:只要科技上的進步能被用來傷害人類,它就一定會。即便這樣,為什麽我們仍對科技進步報以極大的信心?因為科技本身的價值不應該被它的使用方式去衡量,尤其是那些為社會和人類帶來危害的方式。一項技術上的革新,如果沒有合規框架和倫理上的約束,那是非常危險的。

LFAI基金會下的這個Trusted AI倫理委員會需要專業的人才去有理有據的發聲。平時我也會經常翻閱一些公眾號,關注國內對倫理科技社會責任的討論。我發現在AI倫理方向,其實騰訊有豐富的理論儲備和完整的倫理框架。

在2019年1月4日,騰訊研究院參加了由Elon Musk資助的未來生命研究所(Future of Life Institute,FLI),在波多黎各(Puerto Rico)組織舉辦為期兩天半的「向善的通用人工智能2019(Beneficial AGI 2019)」國際研討會。

該會議邀請了150多位來自全球各地的各領域頂級人工智能專家,從跨學科、跨領域的角度共同探討通用人工智能的社會責任、實現路徑及可能的後果、治理及對策、國際合作等話題。DeepMind等AI企業也受邀參加。騰訊研究院院長司曉在會上展示並闡釋分享了騰訊的「ARCC」方舟倫理框架(A即available(可用),R即reliable(可靠),C即comprehensible(可知),C即controllable(可控),英文簡稱ARCC與Ark方舟恰好同音)理念,獲得了與會專家的認可。這個框架的英文版還發表在了世界經濟論壇上。

抱著嘗試的心態,我順著一篇公眾號文章聯繫到了騰訊研究院的高級研究員曹建峰,和他表達了Trusted AI子委會的理念和目標,希望邀請他參與到LFAI的日常中來,用他的專業知識來擴大中國企業在科技社會責任感上的國際影響力。曹建峰作為社會科學從業者和我這個工程人員本沒有任何交集,不過幾次電話和當面溝通後,我的想法很快得到了曹建峰積極回應。現在,曹建峰也是LFAI中的一員,做為AI倫理子委會(Trusted AI)的聯合主席在國際舞台上發聲。

我在LFAI的工作就介紹到這裡。今年10月底,我會出席Linux基金會在裡昂舉辦的開源峰會和LFAI的董事會。在那裡我會和其他董事一起,統籌下一年的規劃和重點。

我們到底需要怎樣的AI開源

在結束之前,我還有個問題希望與大家討論:我們到底需要怎麽樣的AI開源?

相較於傳統軟體領域的開源,AI領域的開源最近幾年一直在閃光燈下。每一次算法和模型和的公開,都會引得媒體爭相報導。

隨著AI模型迭代速度越來越快,有些AI方向上的開源變成了佔山插旗子:研究者將代碼上傳到Github上視作一個項目的終點而非起點,之後就不再去維護,而轉向另一個山頭。

這種現象似乎也是情理之中。首先AI本來就是一個競爭激烈的行業,如果不去佔快速插旗子山頭,那麽很快你的風頭就會被別人蓋過。其次,很多研究人員非常熟悉那套會議論文模式,做實驗趕deadline,投會議回rebuttal,一旦論文錄取則萬事大吉,短暫慶祝後轉向下一個研究點。對於開源需要維護這件事情,大多數研究人員是沒有思想準備的。最後,也是人性使然:那些去冒險去開拓新領域的工作就是會比平平淡淡的維護工作要刺激的多。誰不喜歡站在風口上,誰不喜歡追求刺激和新鮮呢?

再看目前已開源的AI項目,其實做生態打配合的項目不多。舉個例子,自從2018年下半年Bert預訓練模型問世以來,很多NLP開源框架相繼浮現。它們力圖把所有最新的語言模型囊括進來,提供一個統一的接口。這其中有不少框架是出自個人開發者。工程上,這類框架主要採用兩種做法:

1. 我不去改模型原始代碼,我把你的代碼包裝一下,提供更豐富更易用的API接口;

2. 我完全重寫了代碼,我覺得我寫的比原始代碼要更好。

無論你採用哪種方式,當你想做大一統的開源模型框架時,就會遇到的可持續性開發的問題(sustainable development)。AI模型更新的速度越來越快,每天都有新的模型刷榜。無論是機構開發者還是個人開發者(其實兩者都一樣,我還是前面的話,真正落實做事的是個人),你幾杯咖啡下去熬個通宵能覆蓋住幾個新的模型,可是你能一直跟上今天AI模型的迭代速度麽?你帽子扭到後面一咬牙說我跟得上,那麽這些AI模型的底層依賴關係呢?他們背後需要的Tensorflow/Pytorch/cuda/驅動版本呢,這些你也需要在你的開源項目中進行版本管理麽?就像我們一直在喊可持續性發展,做項目也一樣,做開源項目尤其講究可持續性發展。做開源最怕的就是體力和熱情全被燃燒殆盡(Burn-out)。

做開源最怕的就是體力和熱情全被燃燒殆盡(Burn-out)

3.1 給希望參與建設AI開源社區開發者的話

回過頭看來近十年來AI的發展,下面三個觀點是我想和大家分享的,尤其是對那些有熱情參與建設AI開源社區的開發者:

AI研發領域已經不在是2013年以前的」從0到1」硬核創新和」從1到N」的應用創新並駕齊驅。在深度學習時代,越來越多的人轉而投入到」從1到N」的應用創新上。他們會優化已有的算法和模型,在更好的知識融合,更廣的應用領域、更多的服務閱聽人、更快的部署速度上下功夫。而」從0到1」的硬核創新圈會變得非常小眾。

預訓練模型的出現重新定義了AI研發的供應鏈。傳統的機器學習下那種一兩個團隊全棧負責AI訓練部署分發等以整條供應鏈的情景將會越來越少。大家更多的從供應鏈上遊得到已預訓練好的模型,然後去做預測時態下的工程優化。真正負責從零開始訓練模型的人,會越來越少,哪怕是在大公司。一是訓練成本的高速增加,二是我們也確實沒必要那麽多模型:通用的知識(比如語言中的語法、比如視覺中的顏色、反光、文理)一旦模型被掌握,往往是可以跨領域複用的。

雖然計算架構層(CPU/GPU/TPU/NPU/FPGA)和框架層(Tensorflow/Pytorch)要麽門檻高,要麽已經是紅海。但是面向客戶面向應用的深度學習市場上仍然是一片藍海,還有很多垂直領域的機會等著我們去挖掘。

我關於AI研發的三個觀點,詳情可參看我的英文blog:https://hanxiao.github.io

如果讀者有興趣,可以在這裡看到我這三個觀點的英文全文。裡面配合了一些例子,也會更容易理解一些。

3.2 開源即創業

說到底,做開源項目就像做一個Startup,技術策只是其一

把代碼放到Github上也只是小小的一個起點,還會有運營、有市場、有客戶管理需要去考慮。像創業一樣,你需要畫一個「大餅」,囊括住社區的熱情和夢想;也需要有個堅定和目標才不會被社區紛雜的Issue帶偏。

而作為一個擁有計算機博士學位的人來說,我從來不相信一個黑科技算法會成為開源項目的技術壁壘,我反而更相信那些工程化、社區化的東西會最終決定用戶的留存,比如可移植性、彈性伸縮和用戶體驗。

最重要的,其實往往是你對開源的理解和信念

你是個理想主義者,那麽你就會感染那些理想主義者與你一同前行;

你是個注重細節的人,那麽你項目中每一個小feature就會讓那些在乎細節的用戶津津樂道;

你是個樂於助人的人,那麽你所打造的社區就會感激你的無私付出。

無論你是哪種人,正是因為你相信了開源,開源才有了意義。

--END--

獲得更多的PTT最新消息
按讚加入粉絲團