每日最新頭條.有趣資訊

Waymo破天荒公開數據集,發福利還是做生意?

對自家技術一貫守口如瓶的Waymo,今年突然對“外部力量”張開了懷抱。

在全球最大的計算機視覺會議CVPR 2019現場,Waymo首席科學家Drago Anguelov公開了自家的自動駕駛數據集Waymo Open Dataset。作為公司研究院老大,Drago Anguelov同時預告了幾個關鍵數字:3000段駕駛記錄、時長共16.7小時、平均每段長度約為20秒;60萬幀、共有大約2500萬3D邊界框、2200萬2D邊界框,以及多樣化的自動駕駛場景。

事實上,在Waymo Open Dataset之前,自動駕駛領域中已經存在幾個比較知名的數據集。其中,KITTI被公認為使用最廣泛的數據集之一,Cityscapes的專長是城市街景的語義理解,ApolloScape則以標注的精細程度著稱,還有UC Berkley最新發布的BDD100K等等。

然而,這些優勢在Waymo眼裡似乎都不值一提。Drago Anguelov在演講中列了一個表格,條分縷析地將Waymo Open Dataset與KITTI、NuScenes等數據集直接進行對標:

直觀地說,主流數據集提供的數據量已經遠遠不夠用了。因此,Drago Anguelov稱,Waymo 將在7月份發布1K數據集,且將在近期公布數據集基準並組織競賽。

目前為止,Waymo Open Dataset的細節內容尚未公開。單從數據量的對比來看,該數據集就已經比現有的公開三維標注數據集領先了好幾個身位,基本是兩位數與個位數的差距。當然,Waymo自己的全量數據應該已經到達近億級別。

對於學術界而言,這60萬幀的數據量無異於稀世珍寶。受限於數據與傳感器兼容的問題,學校實驗室大概率會在Waymo的傳感器配置基礎上展開科研工作,也不排除其最終找到適用於其他類似傳感器搭配的方案。

但最重要的是,一旦這些科研成果能夠形成一個影響力廣泛的數據集,其上的研究成果全部都適用於Waymo自家傳感器配置,這家科技大牛完全可以輕鬆吸收最新的無人駕駛技術。更何況,這某種程度上也能夠推動無人駕駛方向的人才培養,甚至可以造福整個行業。

可換個角度看,這件事的意義卻並沒有這麽樂觀。Waymo對於傳感器設置的嚴格把控,意味著如果其賦予一些超特殊的、難以複現的屬性,那麽其他無人車公司從這些基於Waymo數據的科研成果中得不到半點好處。此外,Waymo Open Dataset的數據分布大概率位於美國地區,那麽受法律法規限制,此上訓練出的深度學習模型也不見得能夠適用於其他國家地區。

最根本的一點是,現階段Waymo公布出的數據量級仍舊滿足不了工業界的胃口。雖然其多少能夠緩解初創公司在數據標注層面的時間和經濟壓力,但僅僅16個小時的資源也無法支持一個年輕的團隊從0做出一個可以上路的無人車Demo,更別提試圖以此博取資本市場的青睞。

因此對於汽車工業而言,仍舊需要依靠從業者長期的數據積累,Waymo Open Dataset現階段的數據量不足以說明問題。而且對於當下最稀缺的3D雷射點雲標注數據,Waymo目前的貢獻值幾乎是寥寥無幾。

除了發布數據集,Waymo也同時曝光了無人車傳感器配置,包括視覺系統、雷射雷達系統和雷達系統。而Waymo Open Dataset也將同步涉及到來自5個雷射雷達、5個攝影頭,雷射雷達和攝影頭的數據。

換句話說,隨著本次數據集的公開,Waymo自家傳感器的所有性能將一覽無遺。友商甚至可以直接進行評測:噪點多不多、遠處物體距離準不準、除了距離和信號強度外還有沒有其它信息……

那麽,如果Waymo後續將延用“對外出售雷射雷達”的策略,打算繼續拿其他傳感器硬體掙錢,Waymo Open Dataset的開放將會揭開Waymo無人車上最大一塊“遮羞布”。

獲得更多的PTT最新消息
按讚加入粉絲團