首页 > 都市重生 > 星金道长:我把行星当金矿 > 第196章 压力都给到计算了

第196章 压力都给到计算了(2/2)

目录

这一块是控制核心,也可以叫大核,负责指令调度、内存交互、还有对外的IO接口,它跑的是1GHz到10GHz的兼容时钟频率,这个时钟会同步给外部系统、内存、总线,保证整个外围设备时序对齐,不会出错。

但里面这些运算小核不一样,它们是完全独立的。每个小核心内部,都可以跑自己的高频时钟,不需要跟外部控制单元同步,核跟核之间频率也可以不一样,有的一百GHz,有的几百GHz,甚至拉到1THz都没问题。

因为光速延迟的问题,频率到THz级别,信号一个周期跑不了多远,芯片一大就会时序错乱。但您这个设计很巧妙,每个运算核都做得特别小,对角线都控制在0.5毫米以内,刚好在光速限制之内,信号一个周期内完全能覆盖整个核心,内部是稳定同步的。

运算单元这边,我发现不仅得有2048位定点运算核心,64位整数运算核心也保留下来才是最合理的。高精度计算交给2048位定点,浮点转过来也就多一个周期,虽然比整数慢一倍,但对大计算量任务完全够用。而地址计算、循环计数、位操作这些高频整型任务,直接走64位整数单元,一个周期出结果,效率最高。

整体就是全局异步、局部同步,外慢内快,大小互补,既兼容现有系统,又把超导的速度优势拉满了。”

林野说完,稍稍收回目光,看向一旁的吴军。

吴军一直安静听着,虽然精神有些不太专注,脸上却露出释然又欣慰的笑意,语气里满是赞赏:“思路全对,我没有和你详细讲解,你居然不仅仅是看懂了设计,更是真的把这颗超导CPU的灵魂,彻底理解透了。”

林野的手指在设计图上快速划过一片密集的小方块,目光顿了顿,像是在心里默算。

吴军站在他身旁,轻声问了一句,“林野,你心里有数吗?这一版架构里,我们到底能塞进去多少个超导小核?按传统硅基CPU那样封装,一片大小能装下多少?”

林野没有抬头,视线依旧落在图纸上,语气平稳:“吴老师,我们单个超导运算核,控制在0.3毫米见方以内,面积不到0.1平方毫米。一颗标准桌面CPU大小,差不多是10毫米×10毫米,也就是100平方毫米。不算外围控制、IO、缓存那些区域,只算中间算力阵列部分,保守能放下1000个核,实际工程里留布线、散热、冗余,至少也能上500个。”

他顿了顿,补充了一句,“每个核内部都是2048位定点加64位整数ALU,独立跑高频。也就是说,一块指甲盖大小的封装里,就是几百个THz级别的超导核心。”

吴军听完,轻轻点了点头,眼神里带着明显的肯定:“你这一算,就把这颗芯片的真正量级给看透了。这颗芯片,不仅是强,而且是碾压级的强。”

吴军的语气里带着一丝期待,继续问道:“那你再算一算,这样一片封装出来,性能比现在最顶尖的硅基CPU,到底强多少倍?速度又快出几个量级?”

林野指尖轻轻敲了敲运算核心区域,没有犹豫,直接给出了答案,“我们按最保守的比。现在硅基旗舰CPU,整数运算单核大概3GHz左右,浮点单元则是要十几周期才能跑完一次。

而我们每个超导小核,整数1周期、浮点2周期,内部时钟轻松跑到100GHz到500GHz。单看整数运算,一个小核的频率,就是硅基单核的30倍到150倍。再加上2048位定点算力,单周期数据宽度就是硅基的32倍,一乘下去,单核算力就是硅基的近千倍。

更别说我们一片封装里,塞了五百到一千个这样的核。整体算下来,同等面积下,算力是顶尖硅基CPU的十万倍起步,极限能到百万倍级别。”

他在最后补上了最关键的一句:“至于速度,不是快一点,是把延迟压到了皮秒级。硅基还在等数据、等时序、等散热的时候,我们已经算完了。这不是优化,是降维打击。”

吴军假装惊讶:“哦?那岂不是已经达到桌面超算的水平了?”

林野又想了一下,还是说道:“极限性能是硅基的百万倍不假,但是只能算是纸上数字,还算不上跨时代的进步。”

林野也不傻,外面的评论他也看过,外界对他的过高期待他也知道,也许不够详细也许不够深入,但一颗这样的芯片就想让外界满意,说实话根本不现实,关键是他自己内心的阈值也提高了,多少有点贪心不足。

他盯着设计图,轻轻摇了摇头,语气很冷静:“理论上这一单颗芯片达到了超算的门槛,但要直接说等于国家超算,我觉得还是有点过了。

室温超导已经量产了一年多的时间,主板能换超导线路的全换了,总线带宽早就拉上去了,我之前做的约氏环超导硬盘,读写速度也早就不是硅基能比的。

整个系统,之前最大的瓶颈确实就是CPU。现在把这颗超导CPU换上去,整个机器的性能肯定会一次性解放一大截,快个几十倍、上百倍都正常,一千倍也不算稀奇,但想达到理论值一百万倍,不太可能!”

吴军点点头:“那你觉得,离真正的‘单机超算’还差在哪?”

林野很实在:“差在软件、算法、调度、指令效率,还有内存墙。硬件我们是拉满了,可程序不是说跑就能跑满所有核心的。有的任务天生就没法并行,有的要等数据,有的受限于内存延迟。就算全链路超导,也做不到零延迟、百分百利用率。这颗CPU一上,这台机器会是全世界最强的单机,吊打所有民用、甚至大部分科研超算的节点,这没问题。

但要说一颗芯片直接顶掉一整个超算中心,那还是夸张了。硬件到了,软件和实际应用还没跟上。它很强,是新一代计算的起点,但还称不上神。”

吴军欣慰的笑了,只是,师徒两人对视一眼,又同时陷入了沉默。

目录
返回顶部