首页 > 同人 > 高二分科，我选校花也选亿万身家 > 第660章读不出的中国名字背后是他们读不懂的野心

第660章读不出的中国名字背后是他们读不懂的野心

更新很快，看到就是赚到。

⚡ 自动翻页 开启后阅读到底自动进入下一章

⚡ 开启自动翻页更爽 看到章尾自动进入下一章，追书不用一直点。

2014年6月3日，清晨。

arxiv，全球最大的学术预印本平台。这东西对搞ai的研究者来说，就是学术圈的朋友圈。

论文上传后二十四到四十八小时内全球可见，不用等同行评审，不用排队走期刊流程，直接面向全世界亮牌。

每天早上起来第一件事，刷arxiv。

这是所有做深度学习的人的肌肉记忆。

今天早上，这个朋友圈里炸了一颗雷。

论文标题：deep residual learning for image recognition。

作者：shaoqing ren, yuhang zheng, liqiu chen。

单位：jiutian ai lab, echo technology, china。

斯坦福大学盖茨计算机科学大楼三层，博士后林之远端着咖啡走进办公区，习惯性刷新了cs.cv板块。

他的手停住了，咖啡差点洒出来。

152层卷积神经网络。imagenet验证集top-5错误率，3.57%。

人类标注员的平均水平是5.1%。去年imagenet竞赛冠军googlenet是6.67%。这篇论文直接把数字按到了3.57%。

“你们过来看看这个。”

林之远的声音不大，但语调不对。

旁边几个人抬起头，三分钟后，实验室十一个人全围在他屏幕前面。

“等等，152层？”一个叫kevin的白人博士生最先反应过来，

“不可能。超过三十层的网络根本没法训练，梯度消失会把信号吃干净。这是常识。”

“你往下看。”林之远指着论文第三页的示意图，

“他们加了一个跳跃连接，把输入直接加到输出上。梯度可以跳过中间层回传。”

kevin盯着那张图看了十几秒。

“这也太简单了吧。”

“简单？”坐后面的赵明推了推眼镜，

“最好的想法往往都简单。问题是你没想到。”

kevin的脸色不好看。

实验室主任professor williams也走了过来。

他花了五分钟把论文从头到尾扫了一遍，表情从惊讶慢慢变沉。

“这个结果如果可以复现，整个领域的范式都要变。”

他看了一眼作者单位。

“jiutian ai lab。echo technology。这是什么单词？j-i-u-t-i-a-n，有人知道这是哪儿的吗？”

没人回答。kevin盯着那个拼音，舌头打着结尝试发音：

“朱……田？或者……久提安？听起来像是个拼写错误。”

“中国的。”林之远实在听不下去他那惨不忍睹的发音，冷声开口，

“这是汉语拼音。jiutian，对应的中文意思是‘九天’，指代极高的天空，或者是天的最高处。通讯地址标的四川。”

安静了两秒。

kevin率先打破沉默：“四川？那是哪里？他们拿什么训练152层网络？这个规模的算力需求，谷歌大脑都得排队。一个中国民间实验室？”

他顿了顿，耸了耸肩：“也许他们伪造了数据。”

办公区气氛一下子变了。

林之远转头看了kevin一眼，没说话。

赵明的手指在桌面上敲了两下，也没接话。

williams倒是很快开了口：

“论文附了完整的训练日志和超参数配置，实验设计很规范。在没有复现之前，不要下结论。kevin，你下午把18层和50层的对照实验搭起来，用我们的集群跑一遍。”

kevin张了张嘴，看了看williams的表情，把话咽了回去。

午饭时间，学术圈的邮件列表已经炸了。

不只是斯坦福。伯克利、cmu、mit、多伦多，所有做深度学习的组都在讨论这篇论文。

谷歌大脑的jeff dean在内部邮件里转发了链接，批注只有一个词：“read this。”

脸书ai研究院的yann lecun在推特上发了一条：“一篇有趣的论文，来自一个从未听说过的中国实验室。残差连接看起来很有前景。需要复现验证。”

deepmind伦敦总部的slack频道里吵成了一锅粥。

但所有的外国研究者都在问同一个问题：jiutian ai lab到底是个什么词？

谷歌搜不到，领英搜不到，学术数据库里没有任何这个实验室的历史论文。

第一作者shaoqing ren在微软亚洲研究院有过几篇论文，但那是一两年前的事了，之后这个人就从学术界蒸发了。

一个没有任何学术积累的民间实验室，第一篇公开论文就丢出了这个量级的东西。

要么是天才，要么是骗子。

学术圈更愿意相信后者。

但数据摆在那里。干干净净，清清楚楚。

第660章 读不出的中国名字背后是他们读不懂的野心

第660章读不出的中国名字背后是他们读不懂的野心