2020年度的CVPR(国际计算机视觉与模式识别会议),来自康奈尔大学四年级的学生林之秋以第一作者身份提交的“Visual Chirality”(视觉手性)论文荣获了本届大会“Best Paper”(最佳论文)提名,这是本次大会的最高级别荣誉。在全球科学界精英提交的6424篇论文中,仅有26篇获得最佳论文提名,占0.4%。而林之秋更是本次大会唯一一个还在本科阶段的获奖者,也是年龄最小的第一作者。



CVPR(国际计算机视觉与模式识别会议)是美国电子技术与信息科学工程师的协会一年一度的学术会议,在各种学术会议统计中,CVPR被认为有着很强的影响力和很高的排名。在中国计算机学会推荐国际学术会议的排名中,CVPR为人工智能领域的A类会议。

在顶级会议中发表论文,等同于获得业界巅峰人士的认可,也是每个计算机行业学者追求的目标。林之秋,一位中国留学生的名字进入全球人工智能专家的视野。“计算机视觉奥斯卡奖”获得者、“常春藤学霸”和“人工智能科学家”,这些标签朝这位1998年出生的年轻人袭来。


科学新秀的炼成


林之秋的科研生涯是从17岁考入美国“常春藤”盟校——康奈尔开始的。

常春藤无疑是出国学子们的梦之校,但由于其录取门槛极为苛刻,每年十几万赴美国攻读本科的中国留学生中,仅有数百人能被常春藤录取。

彼时在北京人大附中国际部就读的林之秋,就已经崭露头角。不光学业成绩优秀,还一直保持着拳击这项体育爱好,他曾经在北京什刹海体校举办的“北京市青少年拳击比赛”中获得67公斤级的亚军。优异的学业和丰富的课外活动使得他最终顺利进入康奈尔大学。

康奈尔大学坐落于美国纽约上州风景绮丽的伊萨卡小镇,被群山包围,方圆4小时车程内都没有现代化的城市。正是这么一片冷僻的世外桃源造就了一所学术氛围浓厚的常春藤名校。

常春藤学校向来是严进严出,以其苛刻的录取门槛和巨大的学习压力著称。繁多的作业和数不清的考试,使得康奈尔的理工科堪称常春藤中的“炼蛊场”。在这群学生之中,压力山大、睡眠不足甚至患上抑郁症都不是什么稀奇的事,大多数人光是应付课业就早已疲于奔命。

在这样一个竞争压力巨大的环境下,林之秋充分显示出一个超级学霸的实力:大学第一年所选的五门高年级课程就全部拿到A+的最好成绩。随后在多项专业课,例如多元微积分、线性代数、人工智能、高等抽象代数、计算机操作系统等都取得了第一名。他的“A+是个小目标”在大一时就被身边的同学广为传颂。

在康奈尔就读的很多美国学生,一门专业都学得非常辛苦,林之秋却同时选修了计算机和数学两个专业,而且仅用两年时间就全部修完学分。从大二起,他就开始选修博士课程,同时开始跟随计算机系的教授从事科研工作。

不走寻常路,林之秋的学术生涯颇有些非同凡响。大一时,林之秋受系里邀请,以助教身份给高年级同学讲课,还为康奈尔科技学院(Cornell Tech)的同学编写硕士级别的计算机预修课程。到了大三,林之秋已经当上了机器学习(Machine Learning)高阶课程的助教,给博士生的期末试卷打分。大学毕业,他的GPA总分4.2,在学院数千名学生中名列TOP3,被授予学院最高荣誉,并代表学院在毕业典礼上举旗。



“我其实没有花太多时间在课程的学习上。”平淡的一句回答并不是因为矫情。林之秋说,他早想好了要学计算机科学这个专业,所以大部分入门课在高中已经自学完了。“上了大学后,比起花时间上课,其实我把更多精力花在科研上了。”谈到科研,林之秋的语气明显兴奋了起来:“因为我中学就想着要做个计算机学者,所以大一暑假就开始做第一个科研项目了。”

不管是天道酬勤还是笨鸟先飞,成功的背后自然有着不一般的付出与聚焦。“说到底也没什么秘诀,就是准备得早,也比较专注吧。”林之秋告诉记者。


专注的胜利


计算机领域自从上个世纪开始腾飞之后就飞速发展,而近年来广受关注的人工智能方向更是以迭代迅速为特征,几乎每年都会有新的技术变革。

在这样的背景下,林之秋作为第一作者的文章“Visual Chirality”(视觉手性)获得了2020 CVPR最佳论文提名。这项荣誉是计算机视觉领域的最高行业认可,对每一个行业工作者来说都是毕生追求的目标。

“其实过程比想象的要曲折,这篇文章我从大二就开始做,一直到了今天才得以发表。”林之秋说。

因为人工智能学科的迭代速度快,多数科研工作者都是以一年甚至几个月为周期来做课题的。“但我们和别人做的东西确实不太一样。我的导师希望能从一个没人用过的角度来考察一个看似容易的题目,我当时光是听到这个想法就觉得非常有新意。”

林之秋这项课题的导师——Noah Snavely,兼职谷歌AI科学家,3D视觉重建(SfM)鼻祖之一。ICCV 2019 Helmholtz prize经典论文奖获得者,曾多次取得ECCV、CVPR等大会上的最佳论文奖。

一以贯之的兴趣、始终的专注与聚焦,加上从勤奋中历练出来的灵感,林之秋的科研之路能够在一个又一个的探知中保持前进的张力。“我们研究的出发点是通过神经网络来识别图片的镜像翻转。换句话说,我们想看看人工智能是否能区别现实世界和被镜子翻转过的世界。实际上,这对于人类来说都不是一个简单的任务。”


被拒稿后的豁然开朗


在这篇文章之前,镜像翻转并不是一个热门课题,但却是一种常用的给神经网络训练增加数据量的增强(Data Augmentation)方法。更多的科学家热衷于从事传统的识别、分割等工业界应用比较成熟的领域(例如人脸识别)。

林之秋说:“现在主流学术界往往聚焦在几个比较成熟且神经网络已经做得比较好的任务上。有的时候你只要在已有的基础上做些小的改进,就能有成果发表。但我们的课题却是完完全全的创新,之前也没有学者从我们的角度切入过。”

尽管课题题目看似简单,但做起来的难度并不小。林之秋提到光是训练神经网络和探索可解释性,就花了一年时间。

但正是因为是个全新的课题,成果也是异常丰硕。他们的文章中列举了在三种不同视觉领域里关于手性的发现,涵盖了互联网图片、人脸以及数字图像处理,并且从此延伸讨论了这些新发现在传统神经网络训练和识伪中可能的应用。

第一个吃螃蟹的人总会遇到意想不到的困难。林之秋提到,这种新的课题往往充满了争议性,会面临很多“莫须有”的批判。他们这项怎么看都是创新的课题也曾在另一个会议上被一个审稿人以“不够有新意”为由拒稿。

“(拒稿)也不是坏事,那一次(拒稿)其实给了我们更多时间把这个文章做得更完美,让那些可能怀疑的人无话可说。”林之秋说。



是金子总会发光!这项新课题终于在今年取得了业界最高级别的认可。对此,林之秋觉得多年来的专注和坚持总算有了回报,也是对他的学术精神的一种肯定。在当下人工智能的热度下,他对中美学术界如此看待:“我觉得现在太多的研究只专注于几个热门领域,在小数据集上面刷精度,争当第一,而实际上学术不应当分第一第二。我觉得在神经网络技术趋于成熟的情况下,更多研究者应当去挑战更有创新性和发散性的课题。这也是我未来的学术目标。”

林之秋的论文研究主题是“视觉手性”,从最简单的图片镜像翻转出发,重新探讨了神经网络训练下数据增强和图片防伪的意义。


“后浪”的社会责任感


“我身边优秀的同龄人很多,我有很多要向他们学习,”林之秋谦虚地说道,“只是像我这么一门心思搞学术做科研的人,其实是少数。”

因为本科阶段“不务正业”地做科研,林之秋的时间其实非常紧张。有次论文提交前,因为连续一周每天伏案工作超过15小时,下背部从那时开始剧痛。将近一个月后,当他晚上腰椎痛到实在睡不着,才去了校医院。医生说,不要久坐,除此之外别无他法。然而他却仍放不下工作,竟从此练就了站立办公的习惯。

康奈尔作为美国顶尖学府之一,其毕业生颇受高盛、谷歌等知名企业青睐。很多优秀毕业生都会选择前往这些大公司工作,既可以享受优渥的待遇,又是实现个人价值的捷径。相比之下,从事科研着实是条更难走的路。

为什么会有这样的选择?说到这里,便不得不提林之秋的成长经历。

林之秋的父亲是上世纪80年代北京大学社会学系的毕业生,酷爱读书,家里光是旧书就屯了几个房间,连阳台都放了个书架。林之秋打小经常看到父亲在书房里读书,一读就是一下午。一个小学的暑假,之秋也开始学着父亲的样子,坐在书房里捧着本书看。时间久了便一发不可收拾,越来越入迷,一些大部头的专业书籍都被这个小小少年广泛涉猎。

读书、调查、研究是做学术的基本功,林之秋有意识地把观察视角放到现实的背景下考量。高二假期,他主动申请参与了清华大学的一项人口老龄化研究,作为其中最年轻的调查员,他深入乡村及城市各地的养老机构和福利养老院,考察中国老年人的真实生活现状,也以自己的方式看待社会问题。

对人工智能的兴趣源于一次在中关村的讲座。在讲座中,主讲吴军博士讲到人类信息智能化的进程即将迎来一次“奇点”时,之秋的心一下子提到了嗓子眼儿:智能化带来的变革,何尝不是这个时代能够推动社会进步、解决诸多社会问题的巨大力量?于是,他下定决心,要把进军国际科学界、学习最新科技及应用作为自己的人生目标。在高二、高三的时候,他便利用几个月时间在MOOC上学完了数门计算机和数学的大学预修课程。

目前,已经本科毕业的林之秋即将前往专业排名世界第一的卡内基梅隆大学机器人学院攻读博士学位,继续投入到国际科学界的前沿阵地。在此之前,他在竞争非常激烈的计算机视觉方向的博士申请中脱颖而出,获得卡内基梅隆、普林斯顿、哥伦比亚和牛津等多所世界名校的录取和邀约。

前路漫漫汝可知,少年初心当拿云。从理想和现实中寻求平衡,在书本和实践中历练真知,林之秋从常春藤盟校踏上了前往世界计算机最高学府的道路,直朝向科学家的理想而乘风破浪。对于未来的科研之路,林之秋说:“我希望能在强手林立的国际科学界,潜心研究,做出更多的科研成果,用科学的力量服务社会。”