第365章 穿皮衣的男人(求订阅求月票)(2/2)
他对着电话吼了几句,然后挂断,深吸了一口气,转身时脸上已经换上了一副得体的、虽然略显疲惫的笑容。
“林先生,久仰。”
黄仁勋走过来,握手力度很大,手掌干燥有力,带着一股不服输的劲头,“我在GitHub上看过你的那个FPGA流体代码。非常漂亮。那种对并行度的压榨,简直像是某种暴力美学。
“说实话,我本来以为你会一直待在芝加哥搞你的专用芯片。”
“过奖了,Jese。”
林允宁微笑着回应,并没有因为对方比自己年纪大、资格老而显得拘谨,“FPGA虽然好,但它毕竟是个‘偏科生’。我现在遇到的麻烦,只有你的GPU能解决。当然,前提是它得先把某些毛病改改。”
两人落座。
服务员送来了冰水和加州特色的坚果拼盘。
“毛病?”
黄仁勋挑了挑眉,拿起一颗核桃捏在手里,并没有吃,“你是说我们的驱动不够稳定?还是CUDA的学习曲线太陡峭?”
“不,这些都是软件问题,软件问题好解决。”
林允宁摇了摇头。他对克莱尔使了个眼色。
克莱尔打开笔记本电脑,没有展示那些炫酷的流体动画,而是直接把那张惨不忍睹的效率曲线图推到了黄仁勋面前。
“这是我们在芝加哥测试的数据。四张TesC1060并联。”
林允宁指着那条趴在地上的线,“Jese,我对CUDA非常有信心,但我对PCIe没信心。
“我的流体计算需要每秒TB级的数据在显卡之间交换。但在现在的架构里,GPU0要想把数据给GPU1,必须先经过CPU,再经过内存,走一个漫长的‘U’型弯。”
林允宁从桌上的便签盒里抽出一张白纸,拔开签字笔的笔盖。
他在纸上画了两个方块,代表GPU,中间画了一个圆圈,代表CPU。
“这就像是两个坐在隔壁办公室的邻居,想说句话,却必须先把信寄到邮局,盖个戳,经由邮递员分拣,再送回来。
“无论你的GPU核心频率多高,无论你有多少个流处理器。只要这个通讯机制不改,它们就是一群被堵在高速公路入口的法拉利。
“只能怠速烧油,没法全速冲刺。”
黄仁勋盯着那张图,手里的核桃被他捏得咔咔作响。
他是懂技术的,他当然知道这个痛点。但他现在的处境,让他很难在这个时候去动底层架构。
“林,你知道改变总线协议意味着什么吗?”
黄仁勋把核桃扔回盘子里,声音低沉,“这意味着我们要去跟英特尔和AMD谈判,要去动主板厂商的蛋糕,甚至要重新设计GPU的物理接口。
“现在的英伟达,正在为了活下去而跟全世界打官司。你让我现在去搞这种‘基建工程’?”
“不是现在。”
林允宁看着黄仁勋的眼睛,语气平静,“我知道你现在很难。所以我给你带来了一个不用动硬件,就能立刻提升效率的‘止痛药’。”
他示意克莱尔切换窗口。
屏幕上出现了一行行枯燥的代码日志,那是针对矩阵运算的性能测试。
“这是我们内部开发的一个并行计算加速库。”
林允宁指着屏幕,“我们针对CUDA做了一些深度的指令集优化。主要是针对矩阵乘法(GEMM)和卷积运算。
“我们发现,如果不依赖通用的线性代数库,而是针对GPU的缓存特性手动管理显存切片,可以让浮点运算效率提升120%。”
黄仁勋的眼睛瞬间亮了。
现在的CUDA生态还很荒凉,大多数科研人员还在用着效率低下的通用库。能提升120%效率?这意味着英伟达的显卡在科学计算领域瞬间就能在性价比上碾压英特尔的CPU。
这对现在的英伟达来说,是急需的强心针。
“你想要什么?”黄仁勋身体前倾,商人本能让他立刻意识到这是笔交易。
“我把这套库的源代码授权给你,你可以把它集成进下一代的CUDA版本里——也许可以叫它的雏形。”
林允宁提出了他的条件,“作为交换,我需要你们下一代架构——代号Feri——的底层驱动权限,我要能直接操作寄存器的那种。
“以及……”
林允宁拿起笔,在那张白纸上那两个代表GPU的方块之间,画了一条粗粗的直线,直接绕过了中间的CPU。
“在未来的硬件设计路线图上,认真考虑一下这个‘桥’。
“如果我们在硬件层面上,给GPU开一个专用的高速互联接口。让它们可以直接访问对方的显存(UifiedMeoryAess)。
“那它们就不再是插在主板上的外设卡,而是一个巨大的、分布式的超算单元。
“Jese,游戏显卡可能会受经济周期影响,但科学计算的需求是无底洞。只要你把这条路修通了,以后全世界的科学家都会给你打工。”
会议室里安静了片刻。
窗外,一只蜂鸟悬停在薰衣草花丛中,翅膀高频振动,发出嗡嗡的声响。
黄仁勋看着那张草图,又看了看林允宁。
他看到了野心。
不是那种想要颠覆谁的狂妄,而是一种纯粹的、对算力极限的渴望。
“NVLik……”
老黄喃喃自语,仿佛在品味这个概念,“或者是类似的某种东西。
“好。这个‘桥’,我会让架构团队去研究。Feri的底层权限,我也可以给你。”
他伸出手,这次的握手比刚见面时更加用力,甚至带着一丝盟友般的默契:
“林,你是个疯狂的家伙。但我喜欢疯狂。在这个行业里,只有偏执狂才能生存。”
……
半小时后。
黑色的凯迪拉克驶离了瑰丽酒店,沿着280号公路向斯坦福大学的方向驶去。
两辆雪佛兰Suburba依然不远不近地吊在后面,像两条甩不掉的尾巴。
方雪若坐在副驾驶,手里拿着刚才签署的备忘录,眉头微皱。
“允宁,我们把核心加速库给了英伟达,这会不会是在培养一个巨头?”
她有些担忧,职业本能让她对这种核心技术的转让感到不安,“如果以后他们垄断了AI算力市场,反过来卡我们怎么办?”
“我们需要巨头,雪若姐。”
林允宁降下车窗,加州干爽的风吹乱了他的头发。
他看着窗外飞速后退的硅谷景色,目光深远。
“单靠以太动力一家公司,造不出整个生态。我们需要有人去铺路,去把GPU计算变成标准。只有路铺好了,我们的车才能跑得快。
“至于以后……”
林允宁笑了笑,“等那个‘桥’真的造出来了,他们会发现,这世界上最会过桥的人,还是我们。”
他转过头,看向前方路牌上那个红色的标志——“SLAatioalAeleratorLaboratory”(斯坦福直线加速器中心)。
那是物理学的圣地,也是他此行的终极目的地。
“算力的问题,算是暂时找到了盟友。
“接下来……就是去SLAC。”
林允宁摸了摸贴身口袋里的一张折叠起来的纸。
那上面写着他在芝加哥那个夜晚推导出的质量间隙公式,以及一组预测的胶球质量数据。
那是比商业合同更重的东西。
那是用来和上帝摊牌的底牌。
“让我们去看看,那些实验物理学家看到‘预言’成真时,会是什么表情。”