博亿堂娱乐官方网站企业logo
直接搜索 "CO2激光管"
EN 英文版本网站
博亿堂娱乐官方网站激光品牌logo
 

解决方案


GPU-CPO国内首创

阅读量: 1619次 发布时间:2025-07-31 23:51:18

  

GPU-CPO国内首创

  在英特尔、博通、Marvell、英伟达等巨头的联手推动下,CPO(co-packaged optics:共封装光学)这个概念慢慢的被人熟悉。尤其是在人工智能大模型推高数据中心数据流量传输、“超节点”日渐走红的当下,CPO被提上了紧急议程。

  知名分析机构Yole也预测,未解决数据中心面临的功率、密度、可扩展性、带宽和距离限制等问题,产业界正在推动从铜缆到光纤,从可插拔光模块到CPO的转变,这将带动CPO市场规模从2024年的4600万美元跃升到2030年的81亿美元,复合年增长率达137%。有见及此,除了文章开头提到的几家厂商以外,包括台积电、格罗方德等在内的传统巨头和不少初创企业也投入到了这个轰轰烈烈的CPO浪潮中。

  作为全球领先的光电混合算力提供商,曦智科技也成为了这个技术的重要推动者。在近日开幕的2025世界人工智能大会(WAIC 2025)上,曦智科技联合燧原科技推出了国内首款xPU-CPO光电共封装原型系统,为本土的数据中心互连树立了一个新标杆。

  归根到底,CPO的诞生,本质是激增的流量需求与电信号传输瓶颈的矛盾,驱动光互连发展的必然走向。

  如文章开头所说,超大规模数据中心和云服务提供商的数据流量呈指数级增长,导致对网络基础设施带宽的需求大幅度的增加,伴之而来的首个要求,就是驱动交换机系统和以太网光纤提供慢慢的升高的总带宽。不过我们也清楚,由于数据中心在设定之初,对功率和能耗等参数都有一个预设。换而言之,带宽的提升,必须要在一个可控的功率范围内实现,否则带来的改动将是昂贵的。

  近年来,随着数据传输量的飞增以及数据传输速度要求的指数级增长,这种矛盾越来越突出。

  曦智科技联合发起人,首席技术官孟怀宇博士在接受半导体行业观察采访的时候也直言:“光进铜退是过去几十年的一个主旋律。光通信一开始发力点是长距离的跨洋通信,后来逐渐进入更短的距离,目前在数据中心内部通信中慢慢的变成了主流。随着速率慢慢的升高,光在越来越短的距离通信上取代铜,是一个不可逆的趋势。”以数据中心的应用为例,孟怀宇告诉半导体行业观察,当前数据中心机柜之间的互连已经默认使用光。但在十几年前,它们依然是铜。

  之所以会发生这样的转变,是大家意识到铜的局限性越来越明显,光互连的成本也在下降。在看到第一个厂商尝到甜头并大获成功以后,大家就纷纷效仿,进而推动行业完成变革。在孟怀宇博士看来,同样的故事,也将在近期火热的超节点上演。

  当前国际主流超节点方案是通过提升单机柜功耗来部署更多GPU,但受限于数据中心机柜的功耗天花板,GPU密度提升存在瓶颈。而在引入光互连技术之后,就能够最终靠增加机柜数量保障GPU总量从而构建超节点网络。相比铜缆,光缆的远距离传输优势为超节点带来交付与机柜解耦的核心价值:

  例如早在1995年就被普遍的使用的可插拔光模块(根据设计的不同,可区分为DPO和LPO),就是数据中心的宠儿。但由于这种模块被安装在PCB边缘,ASIC则在封装基底上,这就让PIC/EIC与ASIC芯片之间拥有了较远的距离,而信号损耗随着距离的增长而变得更加明显。此外,这些模块的体积较大、互连密度低、功耗较大,随着使用的增多,会给系统带来非常大的功耗负担。

  如图所示,NPO架构将光引擎与封装ASIC相邻布局于光学基板上,二者通过高性能基板互连。根据OIF标准,NPO中ASIC与光学元件的间距可达150mm,同时确保信道损耗≤13dB。

  不过,这依然不能实现用户。于是,将光器件和硅片集成在单一封装基板上,旨在应对下一代带宽、功耗和成本挑战的CPO应运而生。

  有关注数据中心内通信的读者应该有印象,在此前,英伟达曾引发了一波“光退铜进”的讨论。起因是该公司黄仁勋当时在介绍DGX GB200 NVL72时候表示:

  “英伟达在总系统中使用了长度合2英里共5000条NVLink线缆。如果将其切换成光学器件,就一定要使用收发器和重定时器。仅这些收发器和重定时器就需要20000瓦功耗。但采用现在的方案,我们通过NVLink交换机完全免费完成了这项工作,并且节省了这些功耗用于计算。”

  姑勿论我们对英伟达的这种理解是不是正确,抑或在当前他们真的觉得铜缆更好。但从他们在GTC 2025大会上发布了全球领先的硅光交换系统这一条消息看来,英伟达是看好CPO的方向的。据他们介绍,与传统的可插拔光模块相比,创新的共封装硅光技术具有非常明显优势,包括功耗降低3.5倍、延迟更低以及网络可靠性显著提升。

  众所周知,在数据中心通信中,大家公认的功耗三座大山分别是交换ASIC、光模块和SerDes。当中,对于担负数据传输重任的SerDes来说,还有一个不能规避的客观事实,那就是随着速率提升,功耗也要提升。而且,受到传输材料的影响,为了能够更好的保证信号传输效果,就需要把距离缩短,CPO就是实现这个目标的一个方法。由此,我们大家可以看到做出使用铜缆决定的英伟达在SerDes的实力。

  如上图所示,借助先进封装,CPO技术能将光收发模块和控制操作的ASIC芯片异构集成到一起。这个设计不但缩短了芯片与模块之间的布线距离,还通过将光学引擎和电交换芯片封装在单个芯片中,形成具有一定功能的微系统。避开了BGA和LGA的管脚密度的限制,并以更短的导线驱动收发器,显著减少通道损耗,进而降低能耗。

  孟怀宇博士也告诉半导体行业观察,之所以英伟达还在选择铜缆,是因为他们本身模拟设计就是世界一流,再加上他们在对先进工艺和数字纠错能力有很高要求的SerDes上面有很深的积累。“在当前的全球竞争态势下,国内的参与者是时候选择CPO了。尤其是考虑到当前供应链的成熟度,CPO蓄势待发。”孟怀宇博士表示,“相比传统光模块,CPO可以明显提高带宽与密度,降低功耗和成本,提高光互连可靠性。”

  在WAIC 2025上,曦智科技联合燧原科技推出国内首款xPU-CPO光电共封装原型系统,通过将光学引擎与计算芯片(XPU)在基板上实现光电共封装,将电芯片与光芯片的传输距离缩短,大幅度的提高信号完整性并降低损耗,从而提升出口带宽并降低延迟。特别是与传统可插拔光模块相比,由于光电共封装技术能让每个GPU内部都配有一个光引擎模块,因此可省去大量光模块带来的系统功耗,同时有效提升光电转换的稳定性。

  作为一种发展已久的技术,CPO发展至今,衍生出了多种方案。如在光引擎方面,提供了基于硅光和基于VCSEL的技术路线选择;来到硅光调制器方面,则有MZM(Mach-Zehnder Modulator)和MRM(Microring Modulator)之分;在封装和互连方面,也各有各的优势。

  具体到应用场景上,作为一个物理层的技术,CPO能把光电的引擎和主芯片封装在一起,当中主芯片常见的是交换机芯片和GPU,这也让各大厂商基于各自优势,选出了最适合他们的决定。例如博通就提供了可连接到博通以太网交换机和博通XPU的CPO平台解决方案;至于另一个资深玩家英伟达则基于公司在可插拔光模块和MRM积累,利用其独特的硅光子工艺平台,打造了基于微环调制器的CPO系统。

  来到曦智科技和燧原的合作,则是国内首次采用CPO技术实现GPU直接出光的成功案例。

  “我们这个合作是基于短距SerDes实现的,这是全球首创。”孟怀宇博士告诉半导体行业观察,他进一步指出,这种短距方案,还没有人做过尝试。但公司做了一系列的技术验证,证明这是可行的。

  “该项目验证了xPU-CPO光电共封装技术的可行性与技术方向,同时为中国人工智能基础设施建设与先进光学封装产业突破奠定了关键技术锚点。”孟怀宇博士说。

  在孟怀宇看来,现在国内的CPO产业链已成熟,特别是在上游厂商开始纷纷入局以后,CPO的落地更是指日可待。在问到既然万事俱备 ,为何目前CPO还没有大规模落地的原因时,孟怀宇回应道:新技术和新产品必然伴随一定的风险,大多数厂商对于技术方向的选择都会有惯性,会依据自己的风险承担接受的能力来调整节奏。因此,CPO的规模化落地会需要一些时间。但任何积极的验证都会加速这个过程。

  *免责声明:本文由作者原创。文章的主要内容系作者本人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

  以上内容与证券之星立场无关。证券之星发布此内容的目的是传播更多详细的信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关联的内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备240019号。

博亿堂娱乐官方网站

微信号:SPTlaser
扫描微信二维码
了解更多信息
博亿堂娱乐官方网站微信公众号二维码
微博图标 facebook图标 领英图标 联系qq 推特图标 YouTube图标