中国AI全面制霸顶会?没有,还差个最佳论文。ICCV 2019,中国入选论文总数第一,但最佳论文奖,被以色列理工学院和谷歌拿下。在这个全球最重要的计算机视觉顶会上(与CVPR、ECCV并列),AI热情继续倍速增涨,中国力量依然闪耀——除了汤晓鸥任大会主席,中国学者的入选论文总数排名第一,各项夺冠数也遥遥领先。只是这一次,最佳论文和最佳学生论文,均未出现华人身影。最佳论文由以色列理工和谷歌研究院摘取,最佳学生论文属于美国佐治亚理工。
而中国AI独角兽公司商汤,加上其联合实验室,共有57篇论文入选,其中包括口头报告(Oral)论文11篇,成为公司维度上的全球No.1。
此外,旷视、华为、百度和腾讯,也都有不俗表现。比如旷视完成了最重要比赛COCO物体检测的三连冠。
完整详情如下:
最佳论文奖
获得最佳论文的是:SinGAN:Learning a Generative Model from a Single Natural Image (用一张自然图片,学出一个生成模型) 。
成果来自以色列理工学院 (Technion) 和谷歌研究院。
500
SinGAN只用一张图片训练,便可以捕捉图像中,各种图像块的内部分布 (internal distribution of patches) 。训练后,就能生成高质量、多样化的样本,但与原图带有相同的视觉内容:
500
SinGAN里面,有一个由许多全卷积GAN组成的金字塔,每只GAN负责在一种不同的尺度上学习图像块的分布。
这样就可以生成新的样本,任意大小任意纵横比的那种。而在拥有显著多样性 (variability) 的同时,也保留原图的全局结构和精细纹理。
与从前的那些单图GAN方法相比,SinGAN不限于纹理图像 (texture images) 生成,并且也不是条件GAN (conditional) :也就是说它是从噪声中生成样本的。
实验显示,SinGAN生成的图像,常常被人类当成了真实的图像。并且,研究人员在许多图像操作任务里,都展示了SinGAN的作用:
500
把画作变成照片、编辑图像里的物体、把一个风格的物体融入另一种风格的画面里、超分辨率,甚至把静态图变成动画也可以。
500
这项研究的作者有三位。一作是来自以色列理工学院的博士生Tamar Rott Shaham,她的研究方向是图像处理、计算机视觉和机器学习;
二作是来自谷歌研究院的Tali Dekel,在进入谷歌之前,她曾经是MIT CSAIL实验室的博士后。
三作是以色列理工学院的副教授Tomer Michaeli,也是一作实验室的老板。
最佳学生论文
获得最佳学生论文的是PLMP:Point-Line Minimal Problems in Complete Multi-View Visibility(完整的多视图可见性中的点线最小问题)。
论文的作者来自佐治亚理工学院,瑞典皇家理工学院和布拉格捷克理工大学。第一作者是佐治亚理工学院的Timothy Duff,他是数学专业的四年级博士。
500
对于通过校准的透视相机完全观察到的点和线的一般排列,Timothy Duff等人提出了所有最小问题的完整分类。他们证明总共只有30个最小问题,对于6个以上的摄像机,5个以上的点以及6条以上的线,则不存在任何最小问题。
研究人员提出了一系列检测最小值的测试,这些测试从对自由度进行计数开始,到对代表样本进行完整的符号和数字验证结束。
在论文中,对于发现的所以最小问题,研究人员介绍了它们的代数程度,即解决方案的数量,以衡量其固有难度。结果显示了问题的难度是如何随着视图数量的增长而增长。
一些新的最小问题在图像匹配和3D重建中可能不具有很强的实用性。
其他各项大奖
亥姆霍兹奖
亥姆霍兹奖由IEEE模式分析和机器智能(PAMI)技术委员会颁发,旨在表彰十年前对计算机视觉研究产生重大影响的ICCV论文。
今年获此荣誉的是Attribute and Simile Classifiers for Face Verification。
以及Building Rome in a Day。
终身成就奖
即Azriel Rosenfeld Lifetime Achievement Award。
本届ICCV的终身成就奖,颁给了以色列魏茨曼科学研究院的计算机科学教授Shimon Ullman(西蒙·乌尔曼),他现在是魏茨曼AI中心主任。乌尔曼出生于1948年,今年71岁。曾任MIT教授。
他专注于物体和面部识别研究,在该领域做出了许多贡献。
2008年,乌尔曼因对认知科学的理论贡献而获得大卫·哈梅尔哈特奖。
2014年,他因对AI和计算机视觉的贡献而获得了计算机科学领域的EMET奖。
2015年,他被授予以色列数学和计算机科学奖。
杰出研究奖
今年的杰出成就奖 (Distinguished Researcher Award) ,有两位得主。
一位是哥伦比亚大学计算机系的教授Shree Nayar,他以计算机视觉、计算机图形学和计算相机领域的研究而闻名。
500
计算相机 (Computational Camera) 的概念就是由Nayar本人提出的,他也是计算摄影研究的先驱。
在这个领域,他的发明包括了能够捕捉360度影像、高动态范围 (High Dynamic Range) 影像、以及拍摄3D图像的摄影设备。
Nayar与ICCV也颇有渊源。早在1990年和1995年,他的研究便获得过ICCV的最佳论文奖。
另一位是麻省理工学院 (MIT) 的计算机系教授William T Freeman,以计算机视觉领域的研究最为出名。
500
Freeman的研究方向,包括应用于计算机视觉的机器学习,用于视觉感知的贝叶斯模型,以及计算摄影;
他也在方向可控滤波器与方向可控金字塔
(steerable filters and pyramids) 、方向直方图 (orientation histograms)
、通用视点假设 (generic viewpoint assumptions) 等等方面,做出了贡献。
Freeman曾经四次在CVPR上获得杰出论文 (Outstanding Paper Awards) 奖项。
不断刷新的记录
与其全球AI顶会一样,今年举办的ICCV 2019,也再度刷新纪录。
总参会人数7501,workshop有60场。
直接推动这一状况产生的,是投稿数量的“暴涨”,今年ICCV收到了4303篇论文投稿,与上一届2143篇相比,翻了一番还要多,作者数达到1万人。
500
但在论文接受方面,并没有同步增长,其中1075篇接收,接受率仅有25.02%,上一届是29%。
尽管参与人数更多,投稿论文更多,接受率降低,但中国力量依旧出彩。
ICCV 2019官方统计,接收论文按国家分属:中国第一、美国第二,德国第三。
中国有超过350篇论文入选,美国则超过310篇,两强领跑之后,第三名的德国不到50篇。
但如果按算上身处其他国家或公司的华人,中国力量的影响力还不止于此。
根据学术头条统计,在本届ICCV接收的1077篇论文中,一作是华人的论文有523篇,占比48.6%,接近一半。
论文投稿数量排名上,前三全部是华人。
其中阿联酋国家级“起源人工智能研究院”CEO兼首席科学家邵岭,以15篇论文入选占据榜首。
百度研究院的杨易和华为诺亚方舟实验室计算视觉首席科学家田奇都以10篇论文入选并列第二。
不仅仅只是个人,中国的高校和企业也有非常突出的表现。
学术头条按照第一作者归属单位来统计的结果显示,香港中文大学有30篇,中科院有26篇,清华有24篇,而在其他顶会上表现优异的CMU、斯坦福等美国强校,入选篇数均未超过20篇。
在这个指标上,中国高校&科研机构已经压过了美国的同行。
企业/工业界,来自中国的力量,更是“制霸全场”,最具代表性的就是AI独角兽们和各大科技公司。
商汤披露,商汤科技及联合实验室共有57篇论文入选ICCV 2019(包含11篇Oral),同时在Open Images、COCO、LVIS等13项重要竞赛中夺冠。
旷视则是有11篇论文入选,并在重头戏项目“COCO物体检测挑战赛”上拿下三连冠,以及今年新设立的Best Paper Award(最佳论文奖)。
华为、腾讯、阿里、百度等虽然没有官方整体大数据披露,但旗下实验室都有实力展现。
华为诺亚计算机视觉方向,有19篇论文入选,腾讯旗下的优图实验室,入选13篇论文。阿里达摩院,也在这场顶会中拿下了一项世界冠军,成果也已经落地到了淘宝的拍立淘中。百度旗下实验室也获得了两项世界冠军。爱奇艺也有论文入选。
相比之下,在各大AI顶会霸榜的谷歌&DeepMind组合,虽然论文数量仍有近50篇论文入围,但其领先优势,已经没有太多。
又是一场“CICCV”
而且,中国并不只是参与者,也是其中的组织者以及赞助者。
此外,商汤创始人、香港中文大学教授汤晓鸥也是这次大会主席。
赞助商方面,中国企业的Logo也非常突出。
地平线、华为、商汤、腾讯优图等都是最高层次的铂金赞助商,而深兰科技、旷视、依图等均是是金牌赞助。
如此状况,其实也并不仅仅只是出现在这届ICCV上,之前CVPR、NeurIPs、KDD等国际AI顶会上,中国力量就已经亮眼,从参与到成绩,正在展示出全方位的实力。
目前,就差最佳论文等“皇冠明珠”上的临门一脚。
以及下次AI顶会,是不是也该考虑在中国举办了?