中科曙光“硅立方”:藏在“魔方”里的超级大脑(1/2)
如果你听说过“超级计算机”,可能会想到“体积比房子还大”“耗电堪比小区”“专门算宇宙奥秘”这些标签。但中科曙光的“硅立方”打破了这些刻板印象——它长得像个透明的蓝色魔方,占地只够停两辆小汽车,却能顶五万台高端家用电脑一起干活,还特别省电。
从芯片研发到天气预报,从飞机设计到AI训练,这台“魔方”已经悄悄成了东北科技圈的“香饽饽”,7000多个用户抢着用它的算力。接下来,咱们就用最通俗的话,从“它长啥样”“为啥这么牛”“能帮我们做啥”一步步拆解,把这个高科技产物讲明白,全程没有复杂公式,只聊实在的。
一、先见个面:硅立方到底是个啥“机器”?
第一次见到硅立方,你大概率会以为是个艺术装置,而不是能“算遍天下”的超级计算机。咱们先从它的“外貌”和“身份”说起,建立个直观认识。
1.长得像“透明魔方”,却是个“浓缩的算力宝库”
在哈尔滨数字经济产业园里,有个特别扎眼的建筑:高13米,占地才180平方米(差不多是两个卧室的大小),浑身是蓝色透明的玻璃,远远看去就像个放大的魔方。这就是硅立方的“真身”。
走进魔方里面,景象更特别:三层楼高的架子上摆满了密密麻麻的计算机,机器发出轻微的嗡嗡声,透过展示窗口能看到,所有芯片、主板这些核心部件,居然都泡在透明的液体里,还不停冒着小气泡,像在“泡澡”一样。
别小看这个“紧凑身材”,它的算力却恐怖得惊人。哈尔滨超算中心的主任魏伦勇打了个比方:“这一个硅立方,相当于五万台民用最高配置的电脑同时开工。它一分钟的计算量,够全球所有人不吃不喝不间断算一年。”这么说吧,要是让你用家用电脑算“某款新药的分子结构是否有效”,可能要算十几年;但交给硅立方,几天甚至几小时就能出结果。
2.不是“单一电脑”,是“超算+智算的全能平台”
很多人以为超级计算机只能干“算宇宙年龄”“解物理难题”这类“高冷活”,但硅立方不一样,它是个“全能选手”——既能做传统超级计算机的“硬核计算”,又能当人工智能的“训练基地”。
简单分个类,它的身份有两个:
-“超级计算器”:处理需要海量数据和复杂公式的科学问题,比如模拟发动机叶片的气流变化、计算芯片里的原子运动;
-“AI教练”:支撑人工智能学习,比如训练一个能识别癌症的AI模型,需要喂给它几十万张医学影像,硅立方能快速处理这些数据,让AI更快“学成毕业”。
这种“超算+智算”二合一的能力,让它能服务的场景特别广——上到航天航空的国家级项目,下到企业的产品研发,都能搭上手。这也是它刚投运两年,就吸引了7000多个注册用户的原因之一。
3.出身“名门”,是中科曙光的“技术代表作”
硅立方不是“杂牌机”,它是中科曙光研发的“新一代浸没液冷计算机”。中科曙光是国内做超算的“龙头企业”,咱们国家很多重大科技项目的算力支撑,都离不开它家的设备。
这个硅立方能拿到“中国创新设计红星奖”“匠心产品奖”这些大奖,核心靠两个技术突破:一是“把机器泡在液体里降温”的液冷技术,二是“在小空间里塞下超强算力”的紧凑设计。这两个技术咱们后面细讲,现在只要知道:它是靠实打实的技术创新,才做到“小身材、大能量”的。
二、核心密码:硅立方为啥能“又快又省电”?
普通电脑用久了会发烫,得靠风扇降温;要是五万台电脑堆在一起,热量能把房间变成“桑拿房”,还得拉一堆空调来降温,既费电又占地方。
硅立方能在这么小的空间里实现超强算力,关键就解决了两个难题:“怎么让机器不发烧”和“怎么把算力拧成一股绳”。这背后藏着它最核心的两个技术秘诀。
1.秘诀一:“液体泡澡”降温,比空调省电多了
咱们先搞懂一个关键问题:电脑为啥要降温?因为芯片工作时会大量发热,温度一高,算力就会下降,甚至直接“罢工”。传统的超级计算机都是用“风冷”——就像给机器装了无数个巨型风扇,或者用空调把整个机房吹凉。但这种方式效率低、特别耗电,而且降温能力有上限,没法支撑高密度的算力。
硅立方用了个“反常识”的办法:浸没相变液冷技术——简单说,就是把所有发热的部件都泡在特殊的液体里“降温泡澡”。
这可不是普通的水,是一种“高绝缘、低沸点”的特殊冷媒。它有两个神奇之处:
-不导电,泡在里面的芯片、主板不会短路,安全得很;
-沸点低(大概30-40c),芯片一发热,液体就会变成气体,像水烧开冒蒸汽一样把热量带走,然后气体再变回液体循环使用,全程不用消耗多少能量。
这种降温方式比传统风冷强太多了:
-效率高:能把芯片的热量快速带走,让芯片可以“满负荷跑”,算力能比平时提升15%-20%;
-超省电:衡量数据中心耗电的关键指标叫“pUE”,数值越接近1越省电。传统风冷数据中心的pUE一般在1.3以上,全球平均是1.58,而硅立方的pUE能低到1.04。这意味着它每用1度电做计算,只多花0.04度电降温,几乎是“零浪费”。
有人算过一笔账:要是全国的数据中心都用硅立方的液冷技术,每年能省400亿度电,相当于1\/3个三峡大坝的年发电量[__LINK_I]。这对于需要24小时不停运转的超级计算机来说,简直是“降本神器”。
2.秘诀二:“异构架构”,让算力“不浪费一分钱”
除了降温,硅立方的“算力分配能力”也很关键。就像一个大公司,要是部门之间沟通不畅、分工混乱,再多人也干不好活;超级计算机要是“算力分配不合理”,再强的硬件也白搭。
硅立方解决这个问题的办法,叫“异构架构+超融合管理”。咱们用“公司办公”来打比方:
-传统计算机就像“全是程序员的公司”,遇到写代码的活很顺手,但遇到做设计、写文案的活,要么干不了,要么干得很慢;
-硅立方的“异构架构”,就像公司里既有程序员、又有设计师、还有文案——它里面装了不同类型的芯片(比如擅长复杂计算的cpU、擅长并行处理的GpU、擅长AI计算的tpU),不管是算科学公式、处理大数据,还是训练AI模型,都能找到“最擅长的人”来干,不会浪费算力。
而“超融合管理”,就像公司里的“智能调度系统”:哪个任务急、需要多少算力、该分给哪种芯片,系统能自动安排,不用人工盯着。比如哈尔滨工业大学的团队要算“芯片钴互联技术”,系统就自动把任务分给擅长“原子级计算”的芯片;要是企业要训练“产品推荐AI”,就分给擅长“数据处理”的芯片。
这种“人尽其才、物尽其用”的设计,让硅立方的算力利用率特别高——投运没多久,就经常处于“满载状态”,甚至出现用户排队等算力的情况。
3.秘诀三:“模块化设计”,小空间塞下大能量
前面说过,硅立方占地才180平方米,却有五万台家用电脑的算力,这靠的是“模块化设计”。
你可以把硅立方想象成“乐高积木”:它的计算单元、存储单元、冷却单元都是独立的模块,能像搭积木一样组合起来。这种设计有两个好处:
-省空间:传统风冷机房里,机器之间要留很大空隙通风,而硅立方的模块可以紧密排列,单机柜的功率密度能达到160千瓦,是传统风冷机组的4-5倍。简单说,同样大小的架子,硅立方能装下更多“算力核心”;
-好维护:要是某个模块坏了,不用拆整个机器,直接把坏模块抽出来换个新的就行。而且它的进出液口是“快速插拔”设计,换冷媒、修设备都很方便,不会耽误用户用算力。
再加上它用了“Nd-tor网络技术”,就像给所有计算模块装了“高速网线”,模块之间传递数据的速度特别快,不会出现“A模块算完等b模块接收”的卡顿。这也是它能“高效干活”的重要原因。
三、实战场景:硅立方到底在帮我们做什么?
讲了这么多技术,可能还是有点抽象。其实硅立方早就渗透到了科研、产业的方方面面,很多你没听说过的“硬核突破”,背后都有它的功劳。咱们结合几个真实案例,看看它到底在干哪些“大事”。
1.帮科研人员“打破技术垄断”:从芯片到发动机
搞科研的人最怕啥?要么是“算不出来”,要么是“算得太慢”。很多前沿技术的突破,就卡在“算力不够”这一步。硅立方的出现,直接给科研人员装上了“加速器”。
案例1:研发芯片“钴互联技术”,跟国外抢话语权
芯片是“工业粮食”,但很多核心技术被国外垄断,比如芯片里的“互联技术”——芯片上有无数个微小的电路,需要用金属把它们连起来,以前主流用的是铜,但现在芯片越做越小,铜已经快不够用了,钴成了新的备选。
但钴怎么用、加什么添加剂能让连接更稳定?这需要算清楚钴原子和添加剂分子的相互作用,靠实验试错要花几年时间,还不一定成功。
哈尔滨工业大学的课题团队找到了硅立方,用“dFt理论计算”(一种能算原子运动的方法)结合实验,让硅立方模拟不同添加剂和钴的反应。很快就找到了关键规律:某种添加剂能和钴离子形成强配位作用,能精准调控钴的沉积行为。
本章未完,点击下一页继续阅读。