每日最新頭條.有趣資訊

谷歌開放史上最大分割掩碼數據集,開啟新一輪挑戰賽

乾明 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

谷歌的圖像數據集Open Images又升級了!

這次,他們在注釋集中加入分割掩碼(segmentation masks),樣本規模達到280萬,橫跨350個類別。

谷歌說,這些掩碼覆蓋的對象類別和數量,比其他任何數據集都要多。

根據Google AI部落格消息,這一版本的數據集被命名為Open Images V5,現在已經對外開放。

同時,谷歌也宣布將在ICCV 2019上開啟第二屆挑戰賽Open Images Challenge。與之前相比,這次挑戰賽增加了新的實例分割(Instance Segmentation)賽道。

谷歌表示,提供大型和多樣化的訓練數據集,希望能夠激發大家對更高級的實例分割模型的研究。

280萬樣本,橫跨350個類別

與之前各個版本的Open Images數據集相比,V5版本新增了對圖像分割掩碼的注釋。對象樣本達到了280萬個,覆蓋350個類別。

而且,與僅僅識別對象所在區域的邊界框不同,圖像分割掩碼會標記目標對象的輪廓,在更高的細節水準上表征它們的空間範圍。

谷歌說,在這個數據中,他們努力確保不同對象之間的注釋一致。

比如說,所有貓的掩碼都會包括尾巴;駱駝上的袋子,也會包含在其掩碼中。下圖,就是Open Images V5訓練集中一些掩碼的示例:

訓練集中,一共包括268萬個樣本,分割掩碼是由谷歌的互動式分割過程產生的,並通過專業的人工注釋來不斷校正分割神經網絡的輸出。

谷歌表示,這比單獨的手動繪圖更加有效,給出掩碼平均精度能達到84%。

驗證集和測試集中,一共有近10萬掩碼。這些掩碼都是由人工標注,非常注重質量。他們在部落格中說,這些掩碼近乎完美,甚至捕捉到了複雜物體邊界的細微細節。

谷歌認為,與大多數現有數據集提供的多邊形標注相比,他們的訓練集和驗證+測試集提供了更精確的對象輪廓,下圖是Open Images V5驗證集中一些掩碼的示例:

除了掩碼,在這次對Open Images數據集的升級中,谷歌還增加了640萬個經過人工驗證的圖像級標簽。整體達到3650萬,類別覆蓋近20000個。

而且, 他們還改進了驗證集和測試集中600個對象類比的注釋密度,添加了超過40萬個邊界框來匹配訓練集中的注釋密度,來確保能夠更精確地評估目標檢測模型。

目前,數據集已經開放下載,如果你有興趣,請收好下面的傳送門:

https://storage.googleapis.com/openimages/web/download.html

Open Images挑戰賽

與此同時,谷歌還宣布,將在2019年的國際計算機視覺大會(ICCV)上,開啟新一屆的Open Images Challenge。基於Open Images V5的發布,挑戰賽中增加了實例分割賽道。

此外,這一挑戰賽中還有其他兩個賽道:

大規模的目標檢測,預測500個類別中所有對象樣本周圍的邊界框。

視覺關係檢測,檢測特定關係中的目標對。

現在,包含所有注釋的數據集已經可以獲取。

測試集包括10萬張圖片,其中用於目標檢測和視覺關係檢測的數據集將於2019年6月3日在Kaggle上開放,用於實例分割的數據集將在7月1日開放。

如果你對這一挑戰賽感興趣,一定要記住下面的整個時間點:

提交結果的截止時間是2019年10月1日

Open Images Challenge官方地址:

https://storage.googleapis.com/openimages/web/challenge2019.html

關於Open Images

Open Images是谷歌在2016年推出的大規模圖像數據集,包括大約900萬張圖片,標注了數千個圖像類別。

2018年,谷歌開放Open Images V4,增加了1540萬個用於600個對象類別的邊界框,以及30萬個視覺關係注釋,使其成為現有最大的帶有目標位置注釋的數據集。同時,谷歌也開始基於Open Images數據集發起挑戰賽。

小程序|get更多AI學習乾貨

加入社群

量子位AI社群開始招募啦,量子位社群分:AI討論群、AI+行業群、AI技術群;

歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字“微信群”,獲取入群方式。(技術群與AI+行業群需經過審核,審核較嚴,敬請諒解)

喜歡就點「在看」吧 !

獲得更多的PTT最新消息
按讚加入粉絲團