每日最新頭條.有趣資訊

李飛飛ImageNet獲CVPR計算機視覺基礎貢獻獎

新智元報導

來源:CVPR 2019

編輯:新智元編輯部

【新智元導讀】剛剛,CVPR 2019最佳論文公布了:來自CMU的辛書冕等人合作的論文獲得最佳論文獎,最佳學生論文也由加州大學聖巴巴拉分校Xin Wang等人摘得。此外,經典論文獎授予了李飛飛等人的傑出工作ImageNet。

備受矚目的CVPR 2019正在美國加州長灘舉行。作為計算機視覺和模式識別的頂級學術會議,每年的 CVPR 都匯聚了領域技術發展的前沿。而 CVPR 的最佳論文則更是備受關注,多有經典。

而就在剛剛,CVPR 2019揭曉了最佳論文獎以及其他獎項。

最佳論文獎授予了卡內基梅隆大學、多倫多大學、倫敦大學學院的辛書冕(Shumian Xin), Sotiris Nousias等人合作的論文A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction

最佳學生論文授予了加州大學聖巴巴拉分校、微軟研究院、杜克大學的Xin Wang, Qiuyuan Huang等人合作的論文Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation

此外,經典論文獎Longuet-Higgins 獎被授予了李飛飛、李佳等人的ImageNet工作。

根據CVPR官網的介紹,今年CVPR一共收到創紀錄的5165篇有效投稿,比去年的3309篇多出近2000篇。

經過132位領域主席和2887位審稿人三個月的辛勤工作,最終有1294篇論文被接收,最終錄取率為25.2%。1294篇錄取論文中,有288篇被錄用為Oral論文。參會人數上,本屆CVPR也是盛況空前,超過9000人注冊。

本屆CVPR大會主席是馬裡蘭大學Larry Davis教授、牛津大學Philip Torr教授,以及加州大學洛杉磯分校(UCLA)朱松純教授。本屆CVPR組織者中也不乏華人學者面孔,除UCLA朱松純教授擔任大會主席外,便利蜂 AI 研究院的華剛博士、加州大學聖地亞哥分校的屠卓文擔任程序主席。

會議的132位領域主席中,也有多位華人面孔,比如白翔、程明明、孫劍、賈佳亞、林達華、呂樂、馬毅、蘇昊\顏水成、虞晶怡、張正友等等(不完全統計)。

接下來,新智元帶來CVPR 2019最佳論文獎及其他獎項的介紹:

最佳論文

最佳論文:

A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction

作者:Shumian Xin, Sotiris Nousias, Kiriakos N. Kutulakos, Aswin C. Sankaranarayanan, Srinivasa G. Narasimhan and Ioannis Gkioulekas

作者機構:卡內基梅隆大學、多倫多大學、倫敦大學學院

論文地址:https://www.ri.cmu.edu/publications/a-theory-of-fermat-paths-for-non-line-of-sight-shape-reconstruction/

摘要:

我們提出了一個新的理論,即在一個已知的可見場景和一個不在瞬態相機視線範圍內的未知物體之間的Fermat path。這些光路要麽遵守鏡面反射,要麽被物體的邊界反射,從而編碼隱藏物體的形狀。

我們證明費馬路徑對應於瞬態測量中的不連續性。然後,我們推導出一種新的約束,它將這些不連續處的路徑長度的空間導數與表面法線相關聯。

基於這一理論,我們提出了一種名為Fermat Flow的算法來估計非視距物體的形狀。我們的方法首次允許複雜對象的精確形狀恢復,範圍從隱藏在拐角處以及隱藏在漫射器後面的漫反射到鏡面反射。

最後,我們的方法與用於瞬態成像的特定技術無關。因此,我們展示了使用SPAD和超快雷射從皮秒級瞬態恢復的毫米級形狀,以及使用干涉測量法從飛秒級瞬態微米級重建。我們相信我們的工作是非視距成像技術的重大進步。

最佳論文提名

獲得最佳論文提名獎的是:

Learning the Depths of Moving People by Watching Frozen People

作者:Zhengqi Li, Tali Dekel, Forrester Cole, Richard Tucker, Noah Snavely, Ce Liu, William T. Freeman

作者機構:Google Research

論文鏈接:https://arxiv.org/abs/1904.11111

A Style-Based Generator Architecture for Generative Adversarial Networks

作者:Tero Karras, Samuli Laine, Timo Aila

作者機構:NVIDIA

論文鏈接:https://arxiv.org/abs/1812.04948

最佳學生論文

最佳學生論文:

Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation

題目:面向語言視覺導航(VLN)的強化交叉模型匹配和半監督模仿學習

作者:Xin Wang,Qiuyuan Huang,AsliCelikyilmaz,Jianfeng Gao,Dinghan Shen,Yuan-Fang Wang,William Yang Wang,Lei Zhang

Xin Wang,Yuan-FangWang,William Yang Wang 加州大學聖芭芭拉分校

Qiuyuan Huang,Asli Celikyilmaz,Jianfeng Gao,Lei Zhang 微軟研究院

Dinghan Shen 杜克大學

摘要:

視覺語言導航(VLN)是對真實智能體在真實 3D 環境內執行自然語言指令的任務。本文研究了如何解決這項任務的三個關鍵挑戰:跨模態基礎、不適定反饋和泛化問題。

首先,我們提出了一種基於強化學習的新的強化交叉模型匹配(RCM)方法。我們特別將匹配的批評內容作為內在獎勵,以促進指令和智能體運動軌跡之間的全局性匹配,並利用推理導航器在本地視覺場景中執行跨模態 grounding。對 VLN 基準數據集的評估表明,我們的 RCM 模型在 SPL 上顯著優於以前的方法,優化幅度高達 10%,並達到了最先進的性能。

為了提高學習政策的可泛化性,文章進一步引入了自我監督模仿學習(SIL)方法,通過模仿自己過去的高質量決策來探索未見過的環境。結果表明,SIL 方法可以近似地獲得更好、更有效的策略,極大地降低了已見過和未見過的環境之間的成功率上的性能差距(由 30.7%降低至 11.7%)。

經典論文:Longuest-Higgins 獎

Longuet-Higgins 獎是 IEEE 計算機協會模式分析與機器智能(PAMI)技術委員會在每年的 CVPR 頒發的 “計算機視覺基礎貢獻獎”,表彰十年前對計算機視覺研究產生了重大影響的 CVPR 論文。獎項以理論化學家和認知科學家 H. Christopher Longuet-Higgins 命名。

2019 年的 Longuet-Higgins 獎被授予了李飛飛、李佳等人的ImageNet工作ImageNet: A Large-Scale Hierarchical Image Database。ImageNet可以說是計算機視覺領域最負盛名的工作,這篇論文發表於 2009 年CVPR,目前已有11508次引用。

獲得更多的PTT最新消息
按讚加入粉絲團