上个月中际旭创一季报公布,营收、净利润双双翻倍,市值突破1万亿元,成为宁德时代之后,创业板第二个获得此成就的个股。
中际旭创是A股光模块龙头,也是“老登买白酒”事件第一当事人:
去年9月,荒原资产凌鹏怀疑中际旭创2027年250亿的利润预测只存在于EXCEL表里,引来国盛通信分析师年度金句级转发语:“买你的白酒去吧,老登”。
此后,但凡沾上点白酒、地产,言必谈股息分红、安全边际,都被统一贴上“老登”标签。
出圈后的中际旭创也非常争气,市值开启逆天暴涨趋势。此次季报发布后,加上分别突破6000亿和2700亿的新易盛与天孚通信,A股光模块三剑客“易中天”合计市值超过贵州茅台。
一波接一波的AI数据中心建设浪潮,是光模块一涨再涨的幕后推手,加上AI大厂大超预期的资本开支,把光模块的超强行情又往后续了几年,也让A股光模块彻底疯狂。
一片烈火烹油中,英伟达却在暗地里磨刀霍霍。
在弄清黄仁勋想干什么之前,要先讲讲光模块的作用和功能。
每个大模型背后,都有一个7×24小时不停计算的数据中心。把数据中心视作“计算工厂”,GPU就是厂里的基层工人,负责一线计算工作。
但厂长不能直接指挥每个工人,要让成千上万人有序工作,最大限度提升效能,就得将工人分成各个小组和车间。光模块的作用就是连接数据中心的算力资源,让彼此互相通信,有效协调组织。
简单来说,一个数据中心内部,有三个关键环节需要“通信”:
第一层是服务器,一个服务器就是几张GPU组合在一起,相当于“工作小组”,GPU之间的协作就需要通信互连,英伟达大名鼎鼎的NVLink就是干这个活的。
由八颗英伟达GPU组成的服务器
第二层是机柜,一般由多台服务器组成,相当于一个“车间”。每个服务器之间也得配合协作。
这些机柜放在一起,就组成了第三层:有序生产的“计算工厂”。机柜与机柜之间也得通过交换机互相通信。
由服务器组成的机柜
一个数据中心里,层级内部(GPU和GPU、服务器和服务器)、层级之间都要互连,让数据自由流动。一旦流动时间太长,外面的计算任务传不进来,算好的结果传不出去,就会拖垮整体计算效率。
光模块的出现,就是为了解决传得太慢的问题。
过去几十年,数据中心的互连任务主要由铜完成。铜缆线的优点是零功耗、零延迟、高可靠性,不产生额外热量。最重要的是便宜:所有金属中,铜的导电性仅次于银排名第二,但成本却远低于银。
黄仁勋就认为,只要物理距离允许,铜就是最好的连接方式。
英伟达GB200 NVL72机柜内部,72颗GPU由5000多根铜缆线连接起来,缆线长度加起来长达2英里。
GB200 NVL72内部的铜缆
然而如黄仁勋所说,铜缆的最大限制在于物理距离:超过3-5米,信号就会快速衰减。尤其机柜和机柜间传输距离变长,缆线变得像手臂一样粗,布线非常困难。
大概二十年前,谷歌就尝试用光纤替代铜缆,负责机柜之间的通信[4]。
光纤/光缆最大的优势是传得远,标准的单模光纤在400G的速率下,能把信号最远传输至10公里的地方,并且几乎没有损耗,长距离传输的功耗也低得多。
比较麻烦的是信号转换问题。
铜能导电,因此铜缆能直接传输芯片送出的电信号,但光缆的材料是玻璃、塑料等绝缘体需要额外安装一个“翻译官”——也就是光模块。
数据以电信号进入光缆,光模块把电信号转换成光信号;光信号从光缆输入另一个设备,光模块再把光信号转回电信号。
可以说,需要用光缆的地方,就有光模块的需求;对算力的需求越大,对数据传输延迟容忍度越低,对光模块的需求就越发高涨。
一个英伟达H100算力集群,平均一颗GPU就要配备6-8个光模块,H200集群更是需要18-24个[5],光模块也从800G迭代到了1.6T规格。
但即便如此,英伟达还是觉得不够用。
英伟达的替代方案是CPO(Co-Packaged Optics/光电共封装),顾名思义,就是把负责翻译的光器件直接装进负责计算的电芯片上,别过一道中间商了。
光模块本身是一个集合多种零部件的模组,谷歌最初探索光纤替代铜缆时,负责翻译功能的各个零件是“散装”的。后来行业逐渐成熟,各类器件的规格逐步标准化,才被“打包”起来,成为模块。
光模块厂商崛起后,光模块变得即插即用。典型的光模块是可插拔形式,通过标准接口插在交换机上,再连接光缆,数据通过光模块的瞬间就完成了光电信号的转换。
可插拔式光模块
然而,数据规模中心规模越大,对光模块的需求量就越大,也带来了一个问题:功耗。
数据传输得越快,功耗越高,最新的1.6T光模块,功耗已经从10G时代的1W飙升到了30W。英伟达年初就在GTC上抱怨,光互连的功耗已经占据计算系统总功耗的10%。
光模块的功耗,很大一部分花在了“路上”:
信号从交换机“走到”光模块内部的光引擎,这个过程会导致信号损耗。为了弥补损耗,又需要光模块里的DSP补偿,补偿得越多,功耗就越高。
英伟达的想法很简单,既然路太长,那就把路缩短:
电芯片说的是英语,每次数据传输都得让光模块查字典,翻译成汉语。那干脆把字典直接塞给电芯片,自己翻译完直接汉语输出。这就是CPO的设想——把光模块重新“打散”。
按照英伟达的构想,可以把光引擎等核心部件从光模块里拿出来,放在交换机的芯片旁边,就省的花钱找翻译了。
传统光模块(上图)vs CPO(下图)
当然,如果只是为了那点功耗,那就把黄总想简单了。黄仁勋早年提出过一个观点,光卖芯片,英伟达肯定不值这么多钱,所以英伟达“一定不是个芯片公司”,而是要卖整个“计算系统”。
要实现这个伟大构想,英伟达还需要一位盟友:台积电。
CPO的技术构思是把光器件“粘”在电芯片上,这就需要先进封装技术。而台积电恰好是那个在先进封装领域技术布局最早、投资力度最大、研发成果最多的公司。
2021年的Hot Chips会议,台积电首次在PPT上展示了COUPE(即CPO)技术,随后业内传出,英伟达正在谋划一个硅光子集成研发项目,台积电是重要成员。
台积电在2021年Hot Chips的PPT中展示的COUPE技术
好盟友合作的最新成果,是今年初刚刚发布的AI超级计算平台Vera Rubin NVL576。
负责机架间通信的Spcectrim-SPX交换机群,就利用了CPO技术,把光引擎放在了交换机芯片旁边。去掉第三方光模块后,英伟达对整个系统的掌控力前所未有。
英伟达Spcectrim-SPX交换机
黄仁勋表示,从光模块改用CPO,“节省出的6兆瓦电力相当于10个Rubin Ultra机架的功耗”。
根据英伟达的规划,把光引擎与交换机芯片集成只是开始,最终目标是把光引擎集成进GPU,量产节点初步定在2028年。
另一边,台积电也在最近召开的SEMI论坛上宣布,其COUPE平台预计将在2026年晚些时候正式进入量产阶段[6],意思是:COUPE要开始大范围接单了。
两个技术狂魔磨刀霍霍,眼看着就要将光模块稳定已久的格局,重新清洗一遍。
英伟达把光模块打散了重做,会直接打击系统集成商。
这一部分,恰恰就是中国厂商在整个光模块产业链中最具统治力的一环。中际旭创、新易盛分列光模块出货量全球第一、第三,全球前十中国占了七席(2024年)。
光模块集成属于精密制造,最大的技术难点是对准精度,要让光信号在各个零部件之间以最低的损耗完成对接,对准精度通常需要控制在μm级别,而且速率越高,通道数越多。
最新的1.6T光模块,光芯片贴片精度要达到±3μm,电芯片是±10μm[9]。
中际旭创在1.6T光模块的市占率达到70%,是英伟达的核心供应商之一,一季度毛利率42.61%,相较于行业平均的20%以下,已经做到了天花板级别。
但从上下游结构看,系统集成依然属于下游组装环节。
换句话说,英伟达用CPO拆装光模块,拆掉的都是中国企业擅长的部分,留下的光器件和电芯片,中国厂商存在感稀薄。
光器件中,激光器、探测器是“翻译”功能的关键。光器件在光模组成本中占比超过70%,而激光器、探测器合计又占了光器件成本的50%以上。
电芯片占光模组成本接近20%,核心器件是DSP芯片和AFE模拟前端,用来确保“翻译”的准确性。
这两大类目的四大零部件,目前被美日厂商联手包圆,尤其在高端产品上,中国厂商几乎占不到什么身位。
高端激光器由Lumentum、Coherent、博通(美国),和三菱、住友电工(日本)牢牢把持;探测器则有GCS、SiFotonics、Coherent、博通四座大山。
中国本土虽有源杰科技有高端激光器出货,但其他厂商多数盘踞在低端市场。
DSP和AFE是典型的模拟芯片,更是博通、Marvell、MACOM等美国模拟芯片老艺术家的传统艺能,中国厂商更加式微。
国内的光模块企业大多从美日厂商采购核心器件,再将其封装打包成光模块,虽然毛利不错,但并未改变光模块“中间商”的定位。
从英伟达的动作来看,已经在为光模块的下桌做准备。
就在今年一季度,英伟达前后脚向Lumentum和Coherent战略投资了20亿美元,两者都是当前高端激光器的全球领头羊,两笔投资,直接锁定了未来几年激光器的产能。
上游厂商也在挟天子令诸侯,借着自家技术优势,替代光模块厂商去做tier1。
例如在高端DSP占据主导地位的博通,是英伟达之外、台积电COUPE技术的另一个盟友,也是全球最早实现CPO商业化的厂商,2024年就发布过相关的CPO产品。
这种大客户和上游一块挤压集成商的趋势一旦形成,集成商的日子就很难过了。
好消息是,鉴于高昂的成本和复杂的技术,短时间内CPO大概率只会应用在少数的高端交换机侧,而大部分中低端和高端场景,足够让光模块厂商接下来的几年不愁订单。
但考虑到硅谷这帮人已经嚷嚷着往太空发射数据中心,用CPO干掉光模块听上去也没那么难了。
[1] 高盛喊买!中际旭创股价创新高,算力需求爆发带动净利激增262%,界面
[2] 电子行业专题报告:DGX服务器集群架构催生大量光模块光芯片需求,广发证券
[3] Nvidia comany blog:NVIDIA Blackwell
[4] 当AI集群突破万卡:铜线已死,光进芯片,电子工程专辑
[5] 光模块调研纪要
[6] 台积电COUPE预计今年量产,工商时报
[7] 从光模块、1.6T、CPO 到 OIO 的全产业链终局推演,梓豪谈芯
[8] 从Tower的硅锗工艺看未来的硅光发展,梓豪谈芯
[9] 光模块行业分析,今日光电
本文来自微信公众号“远川科技评论”(ID:kechuangych),作者:何律衡,36氪经授权发布。