商湯揚威國際會議 論文比賽力壓全場

商湯科技創始人湯曉鷗(右三)參加ICCV 2019開幕式

自主科技

香港人工智能獨角獸商湯,被美國商務部納入貿易黑名單,不過仍在上星期韓國首爾召開,兩年一屆的ICCV 2019(International Conference on Computer Vision)會議,論文入選數量破了紀錄,並在多項競賽奪冠。商湯科技創始人湯曉鷗,亦擔任今次ICCV 2019大會主席。

過去20年,亞洲舉辦三次ICCV,分別ICCV 2005(北京)、ICCV 2009(京都)和ICCV 2019(首爾),湯曉鷗三次分別擔任ICCV組織委員會主席、程式委員會主席和大會主席。

今次,商湯科技及聯合實驗室共有57篇論文入選ICCV 2019(其中11篇為口頭報告Oral Presentation),電視運算的論文報告分三級,口頭報告需要作者以簡報上台報告;入圍較難,ICCV論文錄用率非常低,今年Oral錄用比例僅為4.62%。;其他poster壁報和workshop研究熱點論文則較多,商湯提出的原創視覺運算科技,已佔全球先列位置。

商湯也在Open Images、COCO、LVIS等13項競賽奪冠,尤其是Open Images,目前通用物體檢測和實例分割兩個領域中,涉及資料量最多,資料分佈最複雜,也是最有挑戰性的競賽,比COCO涉及資料更多,標注更不規則,場景更複雜。

商湯科技被ICCV 2019錄取的論文,也在多個領域有突破,包括:面向目標檢測的深度網絡基礎運算元、基於插值卷積的點雲處理骨幹絡、面向AR/VR場景的人體感知與生成、面向全場景理解的多模態分析等。

Google AI主辦ICCV 2019 Open Images比賽中,中文大學和商湯研究院的聯合團隊奪得了物體檢測和實例分割兩個主要賽道的冠軍。主辦方提供了千萬級別的實例框,涵蓋了500類結構性類別,包含大量漏標、類別混淆和長尾分佈等問題。此項競賽之中,商湯的團隊提出的兩項全新技術:頭部空間解耦檢測器(Spatial Decoupling Head)和模型自動融合技術(Auto Ensemble)。前者可令任意單模型在COCO和Open Images上提升3~4個點的mAP,後者相對于樸素模型融合能提升0.9mAP。最終,在提交次數顯著小於其他高名次隊伍下獲得了雙料冠軍。

ICCV 2019 COCO比賽中,來自香港中文大學-商湯科技聯合實驗室和南洋理工大學-商湯科技聯合實驗室的MMDet團隊獲得目標檢測(Object Detection)冠軍(不使用外部資料集),這也是商湯連續兩屆在COCO Detection項目中奪冠。同時,商湯科技新加坡研究團隊也獲得COCO全景分割(Panoptic)冠軍(不使用外部資料集)。

Facebook AI Research主辦的第一屆LVIS Challenge 2019大規模實例分割比賽中,商湯科技研究院團隊獲得了冠軍,同時獲得該項目最佳論文獎。相比於以往的實例分割資料集,LVIS最大的特點在於超過1000多類的類別和更加接近于自然存在的資料長尾分佈。這些特點對現有的實例分割演算法提出了非常大的挑戰。

在Facebook AI Research主辦的ICCV 2019 自監督學習比賽中,香港中文大學─商湯科技聯合實驗室和南洋理工大學-商湯科技聯合實驗室團隊,一舉獲得了全部四個賽道冠軍;麻省理工MIT主辦的ICCV 2019 Multi-Moments In Time Challenge比賽中,中文大學和商湯研究院的聯合團隊奪得了多標籤視頻分類賽道的冠軍。

Insight Face主辦的ICCV 2019 Lightweight Face Recognition Challenge比賽中,中文大學和商湯研究院的聯合團隊奪得了大模型-視頻人臉識別冠軍;ETH舉辦的ICCV AIM 2019 Video Temporal Super-Resolution Challenge比賽中,商湯科技團隊獲得了冠軍;視覺目標跟蹤領域國際權威比賽VOT2019 Challenge比賽中,商湯科技團隊獲得VOT-RT 2019即時目標跟蹤挑戰賽冠軍。

開源演算法

從2018年年中開始,香港中文大學-商湯科技聯合實驗室啟動OpenMMLab計畫,為提高學術界演算法可複現能力以及推動行業學術交流,開源了物體檢測代碼庫MMDetection。相比於其它開源檢測庫,MMDetection有多項優點,包括高度模組化設計、多種演算法框架支援、顯著提高訓練效率和密切同步最新演算法支援等。

MMDetection和MMAction作為視覺領域的重要任務,在商湯及聯合實驗室的研究人員共同努力下取得了豐碩成果。今年六月,OpenMMLab第二期發佈,多個重要更新吸引了業界目光:MMDetection(目標檢測庫)升級到1.0,提供了一大批新的演算法,同時MMAction(動作識別和檢測庫),MMSkeleton(基於骨骼關鍵點的動作識別庫),MMSR(超解析度演算法庫)亦發佈。MMDetection被業界廣泛應用, GitHub上獲7000 Stars。

Leave a Reply

Your email address will not be published. Required fields are marked *