第405章 天权6號热功耗攻坚(2/2)
请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。
方案確定后,团队开始分工推进。张京京负责多时钟域设计的rtl修改,她带著八名微架构工程师直接搬进了研究院的封闭开发区,桌上堆满了时序分析报告和功耗仿真脚本。林薇亲自盯著自適应偏置校准电路的模擬验证,这个电路需要和羲和架构的物理设计紧密耦合,任何一个版图调整都可能影响到其他模块的布局布线。
赵静接到通知后不到一小时就赶到了中央研究院。她带著小芯团队的三名核心工程师,在会议室里和林薇的gpu架构团队进行了一场长达四个小时的技术对接。双方在开放接口的深度上反覆拉扯——gpu团队担心开放过多底层接口会影响晶片安全性,小芯团队则认为接口深度不够就做不出精准的负载预判。最终章宸亲自拍板:羲和架构的gpu驱动层向小芯开放全部性能监控接口和百分之八十的调度控制接口,核心安全接口保留,但设立联合安全审计机制,小芯团队可以查看安全接口的调用日誌但不直接操作。
“这是未来科技內部最大规模的一次跨团队技术融合。”林薇在当晚的进展总结会上说,“天权6號不是一颗传统意义上的晶片,它是cpu、自研gpu、小芯ai调度引擎和天罡os的深度耦合体。热功耗攻坚看上去是硬体问题,实际上需要软硬体协同才能彻底解决。”
攻坚进行了整整一周。
张京京的多时钟域设计方案在第三天完成了rtl初版,经过两轮功能验证后进入功耗仿真。初步仿真结果显示,四时钟域架构將张量阵列的动態功耗波动幅度压缩了百分之四十三,略超预期。但时序收敛成了新的痛点——四个时钟域之间的数据交换需要一个额外的同步缓衝层,这个缓衝层引入了大约零点三纳秒的延迟。
“零点三纳秒。”张京京盯著时序报告,手指无意识地敲著桌面,“在gpu主频两吉赫兹的情况下,零点三纳秒等於百分之六十个时钟周期。对於实时渲染和ai推理这种对延迟敏感的任务,这个代价太大了。”
她和团队在封闭开发区里又熬了两天,最终找到了一个精巧的解决方案:把同步缓衝层从数据通路中拆出来,改为一个独立的“影子寄存器组”,四个时钟域各自配一个影子寄存器,域间数据交换通过影子寄存器异步完成,不经过主数据通路。这个方案增加了一点三平方毫米的晶片面积,但把延迟代价从零点三纳秒压缩到了零点零八纳秒。
林薇的自適应偏置校准电路也在第五天通过了模擬验证。她在spice仿真中注入了从零下四十度到一百二十五度的温度扫描,校准电路在全温度范围內將差分对的静態偏置电流波动控制在正负百分之二以內。加上赵静团队的动態偏置电压调度算法,gpu与共享缓存之间数据通路的静態漏电功耗下降了百分之六十二,远超最初设定的目標。
最复杂的是第三条线——异构互联总线的瞬时电流尖峰。赵静的小芯预判模型在接入羲和架构的底层数据后,经过三轮叠代训练,將gpu负载峰值的预测准確率提升到了百分之九十四。但真正的挑战不在预测,而在於cpu侧的预调度能否在纳秒级的时间窗口內完成。小芯团队和gpu驱动团队联合攻关了整整六天,重构了cpu的调度栈,將预调度的响应延迟从十二纳秒压缩到了三纳秒以內。
第七天下午,三条线的成果在联合仿真平台上匯合。林薇按下了全工况功耗仿真的启动键,整层楼的技术人员都围到了屏幕前。仿真数据逐项跳出——cpu核心功耗正常,gpu纹理处理单元功耗正常,张量计算阵列动態功耗下降百分之四十一,数据通路静態漏电功耗下降百分之六十二,异构互联瞬时电流尖峰被压平了百分之七十八。
最后一行数据弹出:全工况实测功耗四十六点三瓦。
比目標值高出一点三瓦。
会议室里安静了片刻,然后林薇开口了:“一点三瓦,用封装层面的散热优化可以吃掉。这不是失败,是成功。”
章宸看著屏幕上的数据,忽然露出了这七天来的第一个笑容。天权6號的热功耗攻坚,核心问题已经解决了。剩下的一点三瓦裕量完全在封装散热的可控范围內——梁志远那边的追光四期先进封装团队已经在做高导热封装基板的验证,实验室数据显示可以將封装热阻降低百分之十五左右,足够覆盖这最后的一点三瓦。
“七个月。”章宸说,“从今天算起,天权6號的流片倒计时还有十个月。扣除三个月的后端物理设计和流片准备,我们还有七个月的时间完成全部前端设计的收敛。热功耗攻坚打掉了最大的拦路虎,接下来就是稳步推进——时钟树、漏电电路、调度接口,三个模块的优化方案直接写进羲和架构的正式设计基线。”
林薇已经在安排下一步的工作计划。张京京负责把时钟域设计和影子寄存器方案正式合入rtl主线。赵静负责把预调度接口固化並编写安全审计文档。林薇自己则开始筹备天权6號的第一次完整功能验证。
散会后,章宸单独叫住了林薇。两人走到走廊尽头的窗边,窗外合城產业园的灯火在夜色中铺展开来,追光四期厂房的轮廓清晰可见。
“羲和架构的gpu核心,这次从头到尾都是自研。”章宸说,“天权4號解决了有没有的问题,天权5號在4號基础上做了冗余设计的叠代,天权6號则是第一次真正意义上的架构重构。异构计算这条路走通之后,天权7號的3d堆叠就有了一个坚实的底座。”
林薇看著窗外的灯火,沉默了一会儿,然后说:“自研gpu架构这件事,三年前还写在风险清单里。现在它变成了我们的护城河。”
“三年。”章宸重复了一遍这个词,点了点头。
走廊另一端,章宸的终端震动了一下。他低头看了一眼,是方程从南洋发来的消息:智慧教室试点在新加坡五所学校全部完成部署,首批数据將在两周內回收。同时,李明哲从法兰克福传来消息,欧罗巴安全协定第七条款的b版本已经进入正式表决程序,表决日期定在十天后。火龙联盟在表决前夕向所有欧陆成员国发出了一份新的技术安全评估补充报告,措辞比上一版更为强硬。
挑战不会排队,它们总是同时抵达。章宸收起终端,拍了拍林薇的肩膀:“让团队休息一天。接下来的硬仗还很多。”
他转身朝电梯走去,身后的中央研究院依旧灯火通明。天权6號的功耗曲线在屏幕上稳定运行著,四十六点三瓦——这个数字像一枚钉子,把未来科技在异构计算领域的旗帜钉在了技术高地上。而在这片高地的更远处,更复杂的3d堆叠、更严苛的先进封装、以及即將到来的崑崙基金二期课题,正在夜色中等待破晓。