谷歌開放史上最大分割掩碼數據集，開啟新一輪挑戰賽

乾明發自凹非寺

量子位報導 | 公眾號 QbitAI

谷歌的圖像數據集Open Images又升級了！

這次，他們在注釋集中加入分割掩碼（segmentation masks），樣本規模達到280萬，橫跨350個類別。

谷歌說，這些掩碼覆蓋的對象類別和數量，比其他任何數據集都要多。

根據Google AI部落格消息，這一版本的數據集被命名為Open Images V5，現在已經對外開放。

同時，谷歌也宣布將在ICCV 2019上開啟第二屆挑戰賽Open Images Challenge。與之前相比，這次挑戰賽增加了新的實例分割（Instance Segmentation）賽道。

谷歌表示，提供大型和多樣化的訓練數據集，希望能夠激發大家對更高級的實例分割模型的研究。

280萬樣本，橫跨350個類別

與之前各個版本的Open Images數據集相比，V5版本新增了對圖像分割掩碼的注釋。對象樣本達到了280萬個，覆蓋350個類別。

而且，與僅僅識別對象所在區域的邊界框不同，圖像分割掩碼會標記目標對象的輪廓，在更高的細節水準上表征它們的空間範圍。

谷歌說，在這個數據中，他們努力確保不同對象之間的注釋一致。

比如說，所有貓的掩碼都會包括尾巴；駱駝上的袋子，也會包含在其掩碼中。下圖，就是Open Images V5訓練集中一些掩碼的示例：

訓練集中，一共包括268萬個樣本，分割掩碼是由谷歌的互動式分割過程產生的，並通過專業的人工注釋來不斷校正分割神經網絡的輸出。

谷歌表示，這比單獨的手動繪圖更加有效，給出掩碼平均精度能達到84%。

驗證集和測試集中，一共有近10萬掩碼。這些掩碼都是由人工標注，非常注重質量。他們在部落格中說，這些掩碼近乎完美，甚至捕捉到了複雜物體邊界的細微細節。

谷歌認為，與大多數現有數據集提供的多邊形標注相比，他們的訓練集和驗證+測試集提供了更精確的對象輪廓，下圖是Open Images V5驗證集中一些掩碼的示例：

除了掩碼，在這次對Open Images數據集的升級中，谷歌還增加了640萬個經過人工驗證的圖像級標簽。整體達到3650萬，類別覆蓋近20000個。

而且，他們還改進了驗證集和測試集中600個對象類比的注釋密度，添加了超過40萬個邊界框來匹配訓練集中的注釋密度，來確保能夠更精確地評估目標檢測模型。

目前，數據集已經開放下載，如果你有興趣，請收好下面的傳送門：

https://storage.googleapis.com/openimages/web/download.html

Open Images挑戰賽

與此同時，谷歌還宣布，將在2019年的國際計算機視覺大會（ICCV）上，開啟新一屆的Open Images Challenge。基於Open Images V5的發布，挑戰賽中增加了實例分割賽道。

此外，這一挑戰賽中還有其他兩個賽道：

大規模的目標檢測，預測500個類別中所有對象樣本周圍的邊界框。

視覺關係檢測，檢測特定關係中的目標對。

現在，包含所有注釋的數據集已經可以獲取。

測試集包括10萬張圖片，其中用於目標檢測和視覺關係檢測的數據集將於2019年6月3日在Kaggle上開放，用於實例分割的數據集將在7月1日開放。

如果你對這一挑戰賽感興趣，一定要記住下面的整個時間點：

提交結果的截止時間是2019年10月1日。

Open Images Challenge官方地址：

https://storage.googleapis.com/openimages/web/challenge2019.html

關於Open Images

Open Images是谷歌在2016年推出的大規模圖像數據集，包括大約900萬張圖片，標注了數千個圖像類別。

2018年，谷歌開放Open Images V4，增加了1540萬個用於600個對象類別的邊界框，以及30萬個視覺關係注釋，使其成為現有最大的帶有目標位置注釋的數據集。同時，谷歌也開始基於Open Images數據集發起挑戰賽。

—完—

小程序|get更多AI學習乾貨

加入社群

量子位AI社群開始招募啦，量子位社群分：AI討論群、AI+行業群、AI技術群；

歡迎對AI感興趣的同學，在量子位公眾號（QbitAI）對話界面回復關鍵字“微信群”，獲取入群方式。（技術群與AI+行業群需經過審核，審核較嚴，敬請諒解）

喜歡就點「在看」吧 !