第268章 比基尼与凸优化(求订阅求月票)(2/2)
林允宁指了指窗外灰蒙蒙的天空,“但你既然从新泽西飞到这个鬼天气的地方,还特意穿成这样来见我,说明你根本不想当一颗螺丝钉。”
克莱尔那张一直保持着职业假笑的脸僵了一下,眼神里闪过一丝被看穿的错愕。
下意识地,她缩了缩左脚,试图把脚踝藏进椅子
“Res(残差网络)。”
林允宁没有给她喘息的机会,直接抛出了技术话题,“上个月我们在CVPR上公布了源码。李飞飞教授说,你在我们发布之前就在研究类似的结构。
“我想听听你的看法。不是那种写在论文里的漂亮话,我要听实话,听缺点。”
克莱尔沉默了两秒。
然后,她抬起手,摘下了那副碍事的平光眼镜,随手放在桌上。
那种职业性的伪装虽然还在,但眼神变了。
变得锐利,甚至带着一点初生牛犊的攻击性。
“实话?”
克莱尔看着林允宁,语气变得犀利,“实话就是,您确实是个天才,Res是个工程学的奇迹,但在数学美感上,它并不完美。
“H(x)=F(x)+x。这确实解决了梯度消失,把网络堆到了101层。这对于计算机视觉(CV)来说是核武器,因为图像是局部相关的。
“但是,林先生,AI并不只是用眼睛看,更要与人沟通,Res如对于自然语言处理(NLP)来说,它太‘笨重’了。”
她站起身,也不管这是面试现场,直接走到白板前,抓起马克笔画了一个长长的序列图。
“语言不是像素点。语言是流动的,是有长距离依赖的。‘Iloveyou’和‘Youlove’,字是一样的,意思完全不同。
“目前的RNN(循环神经网络)太慢,无法并行。而Res虽然深,但它依然是基于局部卷积的逻辑。如果我们想让机器读懂莎士比亚,或者是理解一篇复杂的论文,靠堆层数是堆不出来的。”
她转过身,看着林允宁,眼神灼灼:
“我在想,未来的方向不应该是更深(Deeper),而应该是更宽,或者是……更关注(Attetive)。
“我们需要一种机制,能让模型在看到‘苹果’这个词的时候,瞬间联想到句尾的‘好吃’,而忽略中间那十个无关紧要的形容词。无论它们距离多远。
“就像……我们在看一张复杂的派对照片时,目光会自动聚焦在那个最辣的女孩身上,而忽略背景里的墙纸。”
说着,她下意识挺了挺饱满的胸口,却又意识到自己的话有些不合时宜,轻咳了一声,掩饰尴尬。
方雪若眉毛一挑,看向林允宁,显然对克莱尔这种突然反客为主的画风有些不适应。
但林允宁却笑了。
他看着克莱尔,满意地点了点头。
这姑娘果然是个天才,而且有着极强的直觉。
她已经摸到了那扇门的把手,只是还不知道怎么推开。
“很有趣的想法。”
林允宁站起身,走到白板前,拿起另一支笔。
“你想要‘关注’。但在数学上,怎么定义这种关注?”
他在白板上写下了一个矩阵乘法的雏形。
“如果我们将每个词都映射为一个向量。我们要寻找词与词之间的关系……”
林允宁一边说,一边写下了三个字母:Q、K、V。
“Query(查询),Key(键),Vae(值)。”
林允宁的声音在安静的会议室里回荡,带着一种引导性的魔力,“如果把每个词看作是在数据库里的一次查询。
“我想找和‘苹果’相关的词。那么‘苹果’就是Query。
“句子里的其他所有词,都举起手中的Key。
“我们计算Q和K的点积(DotProduct),这就代表了它们之间的匹配度——也就是关注度(AttetioSre)。”
随着他的书写,一行简洁而优美的公式出现在白板上:
Attetio(Q,K,V)=softax((QK^T)/sqrt(d_k))*V
克莱尔盯着那个公式。
她的瞳孔猛地收缩,像是看到了什么不可思议的东西。
“点积……归一化……加权求和……”
她喃喃自语,随即猛地转头看向林允宁,眼神里满是震惊,“抛弃循环?直接计算所有词之间的相互作用?全连接的拓扑结构?”
“没错。”
林允宁看着她,“就像量子纠缠。只要关联度够高,信息瞬间送达,无视距离。最重要的是——”
林允宁指了指隔壁机房的方向:“因为没有了时序依赖,我们可以利用GPU进行大规模并行计算。训练速度将提升成百上千倍。”
克莱尔深吸了一口气。
她知道林允宁在注意力机制和神经网络领域造诣极高,但没想到他居然三言两语就帮她推开了一扇新的大门!
这种数学上的通透感,让她浑身的鸡皮疙瘩都起来了。
比她在半月湾冲过最大的那个浪还要爽。
“这太……性感了。”
她忍不住感叹了一句,完全忘了这是在面试,也忘了自己应该保持矜持。
“所以,Cire。”
林允宁放下笔,靠在会议桌上,看着这个终于露出了真面目的女孩,“你的导师李飞飞,是我的好友,她跟我说了你的情况。
“我知道你在担心什么。
“你觉得芝加哥很冷,很无聊,没有加州的阳光和海滩。如果都是要枯燥地写代码,为什么不去一个自己喜欢的地方定居呢?
“但是,我想告诉你,在谷歌,你只是几万名工程师里的一个,负责给搜索广告优化0.1%的点击率。
“而在这里……”
林允宁指了指白板上的公式,又指了指机房的方向:
“这几千张显卡归你指挥。我们要做的,不是优化旧世界,而是创造一个新的物种。一个能读懂语言、甚至能生成艺术的硅基大脑。
“以太动力用不着听话的工程师,我们缺的是能让台下欢呼的音乐节DJ。
“我知道你是网络红人,也知道你想让全世界都看到你的名字。”
林允宁抛出了最后一个重磅炸弹,“我能给你的,不仅仅是在Facebook上的知名度,而是通过改变世界的算法,让你真正成为AI界的红人。”
克莱尔看着比自己还要年轻的创业者。
又看了看白板上那个还没擦掉的公式。
林允宁所说的愿景,就是她梦寐以求的理想。
她深吸了一口气,重新戴上眼镜,试图找回一点刚才那种职业女性的矜持,但嘴角的笑意怎么也压不住:
“好吧。虽然芝加哥的风确实挺讨厌的……
“但你们这里的咖啡闻起来不错,而且……老板也很棒。
“我接了。”
林允宁松了口气,伸出手:
“欢迎加入以太动力。”
……
面试结束,三人走出会议室。
走廊尽头,维多利亚正靠在墙边。
她今天依旧是一身复古的中性吸烟装,手里把玩着一根没点燃的雪茄,眼神像鹰一样扫过走出来的克莱尔。
“谈完了?”
维多利亚直起身,目光扫过克莱尔那双虽然穿着丝袜、但依然能看出紧致肌肉线条的小腿,又看了看她那个稍显凌乱的领口。
“CireWag……我在华尔街见过很多像你这样的人。”
维多利亚的声音低沉而沙哑,带着一种看透一切的老练,“明明是一匹野马,却非要给自己套上笼头,装作是个拉磨的驴。
“你腿上那个纹身,是荆棘还是玫瑰?藏得挺辛苦吧?”
克莱尔愣了一下,下意识地想要遮掩。
但随即意识到在这几个人精面前,伪装已经没有意义了。
她索性大方地笑了笑,那种非主流的气质终于彻底释放出来:
“是一条咬着自己尾巴的蛇,衔尾蛇。意味着无限循环。”
“酷。”
维多利亚吹了个口哨,转头对林允宁眨了眨眼,“BOSS,这个我喜欢。既懂技术,又有品味,还懂得在无聊的规则
她走上前,并没有像方雪若那样礼貌性地握手,而是像个老朋友一样拍了拍克莱尔的肩膀:
“既然入伙了,那就别端着了。明天上班,你可以穿你想穿的任何衣服。
“哪怕是比基尼,只要你能把代码写好,也没人管你。当然,前提是别把那帮没见过世面的程序员给吓傻了。”
方雪若无奈地扶额:
“维多利亚,注意分寸。”
“我在帮她放松,亲爱的。”
维多利亚耸了耸肩,对着克莱尔露出一个迷人的、带有侵略性的笑容,“欢迎来到改变世界的疯人院,小野猫。”
克莱尔看着眼前这一幕。
一个随手写出神级公式的天才老板,一个像女王一样严肃的CFO,还有一个……像是个从电影里走出来的女流氓COO。
这确实不是谷歌。
这里比谷歌……有意思多了。
她推了推并不存在的眼镜,露出了一个灿烂的笑容:
“谢谢。我想我会喜欢这里的。”
……