乾明 發自 凹非寺
量子位 報導 | 公眾號 QbitAI
谷歌的圖像數據集Open Images又升級了!
這次,他們在注釋集中加入分割掩碼(segmentation masks),樣本規模達到280萬,橫跨350個類別。
谷歌說,這些掩碼覆蓋的對象類別和數量,比其他任何數據集都要多。
根據Google AI部落格消息,這一版本的數據集被命名為Open Images V5,現在已經對外開放。
同時,谷歌也宣布將在ICCV 2019上開啟第二屆挑戰賽Open Images Challenge。與之前相比,這次挑戰賽增加了新的實例分割(Instance Segmentation)賽道。
谷歌表示,提供大型和多樣化的訓練數據集,希望能夠激發大家對更高級的實例分割模型的研究。
280萬樣本,橫跨350個類別
與之前各個版本的Open Images數據集相比,V5版本新增了對圖像分割掩碼的注釋。對象樣本達到了280萬個,覆蓋350個類別。
而且,與僅僅識別對象所在區域的邊界框不同,圖像分割掩碼會標記目標對象的輪廓,在更高的細節水準上表征它們的空間範圍。
谷歌說,在這個數據中,他們努力確保不同對象之間的注釋一致。
比如說,所有貓的掩碼都會包括尾巴;駱駝上的袋子,也會包含在其掩碼中。下圖,就是Open Images V5訓練集中一些掩碼的示例:
訓練集中,一共包括268萬個樣本,分割掩碼是由谷歌的互動式分割過程產生的,並通過專業的人工注釋來不斷校正分割神經網絡的輸出。
谷歌表示,這比單獨的手動繪圖更加有效,給出掩碼平均精度能達到84%。
驗證集和測試集中,一共有近10萬掩碼。這些掩碼都是由人工標注,非常注重質量。他們在部落格中說,這些掩碼近乎完美,甚至捕捉到了複雜物體邊界的細微細節。
谷歌認為,與大多數現有數據集提供的多邊形標注相比,他們的訓練集和驗證+測試集提供了更精確的對象輪廓,下圖是Open Images V5驗證集中一些掩碼的示例:
除了掩碼,在這次對Open Images數據集的升級中,谷歌還增加了640萬個經過人工驗證的圖像級標簽。整體達到3650萬,類別覆蓋近20000個。
而且, 他們還改進了驗證集和測試集中600個對象類比的注釋密度,添加了超過40萬個邊界框來匹配訓練集中的注釋密度,來確保能夠更精確地評估目標檢測模型。
目前,數據集已經開放下載,如果你有興趣,請收好下面的傳送門:
https://storage.googleapis.com/openimages/web/download.html
Open Images挑戰賽
與此同時,谷歌還宣布,將在2019年的國際計算機視覺大會(ICCV)上,開啟新一屆的Open Images Challenge。基於Open Images V5的發布,挑戰賽中增加了實例分割賽道。
此外,這一挑戰賽中還有其他兩個賽道:
大規模的目標檢測,預測500個類別中所有對象樣本周圍的邊界框。
視覺關係檢測,檢測特定關係中的目標對。
現在,包含所有注釋的數據集已經可以獲取。
測試集包括10萬張圖片,其中用於目標檢測和視覺關係檢測的數據集將於2019年6月3日在Kaggle上開放,用於實例分割的數據集將在7月1日開放。
如果你對這一挑戰賽感興趣,一定要記住下面的整個時間點:
提交結果的截止時間是2019年10月1日。
Open Images Challenge官方地址:
https://storage.googleapis.com/openimages/web/challenge2019.html
關於Open Images
Open Images是谷歌在2016年推出的大規模圖像數據集,包括大約900萬張圖片,標注了數千個圖像類別。
2018年,谷歌開放Open Images V4,增加了1540萬個用於600個對象類別的邊界框,以及30萬個視覺關係注釋,使其成為現有最大的帶有目標位置注釋的數據集。同時,谷歌也開始基於Open Images數據集發起挑戰賽。
—完—
小程序|get更多AI學習乾貨
加入社群
量子位AI社群開始招募啦,量子位社群分:AI討論群、AI+行業群、AI技術群;
歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字“微信群”,獲取入群方式。(技術群與AI+行業群需經過審核,審核較嚴,敬請諒解)
喜歡就點「在看」吧 !