C114讯 4月17日消息(南山)过去几年,大模型掀起算力基础设施建设的“军备竞赛”,对用于数据中心光互联的高速数通光模块需求显著增长,且速率从400G迅速迭代到800G,再到1.6T。在此背景下,“超大规模智算中心:1.6T时代的全光互连”研讨会于4月17日下午举办,就智算中心内光互连进行深入探讨,展示光互连技术的最新进展情况,介绍未来发展趋势, 推动智算中心互连技术的创新发展。
作为光模块供应商的“甲方”,阿里巴巴集团在今年初宣布了三年投入3800亿元建设云和人工智能硬件基础设施的规划,超过去十年总和,震撼业界。“全球人工智能基础设施市场规模持续保持高水平增长,无论是北美还是中国都在加大投资。”在研讨会上,阿里云计算有限公司技术专家王鹏发表主题演讲表示。
AI已成光通信技术演进的核心驱动力,光模块作为基础设施中的“高速公路”,对其数量和带宽的提升均有强烈诉求,2025年持续保持强势增长劲头。王鹏介绍,满足智算中心的光模块具有几大特质:高速率高带宽、低功耗、低时延、低成本,以及高交付能力和高稳定性。2024年各厂家的800G光模块陆续亮相,今年已经规模化商用,成为AI集群的标配。1.6T光模块成为新焦点,3.2T光模块也进入业界视野。
王鹏谈到几个要点:一是光模块随着速率提升,功耗也在提升,低功耗设计因而非常重要。二是智算中心在GPU服务器部署后,需要光模块快速完成部署,避免设备折损浪费。三是智算中心对链路抖动更加敏感,对光模块的稳定性提出了更高要求。
具体到光模块技术方面,ISP服务商要具备多种技术方案评估的能力、芯片方案选型的能力、快速迭代技术方案的能力;在交付方面,具备突发需求供应和大规模交付能力;在运营方面,具备千万级光模块运营的能力,包括建立优胜劣汰机制,选择可靠性更优的模块技术、型号和厂家。
在演讲中,王鹏介绍了阿里云的光模块演进路标。从2014年设计40G光模块,到2017年批量交付100G光模块,2021年和2022年,阿里云实现传统数据中心和智算中心的200G光模块批量交付。2023年,400G光模块批量交付。预计2025年在智算中心导入800G光模块,2026年开始导入1.6T光模块。
在光模块技术方案上,阿里云在400G及以下速率,多模用量大于单模用量,主要采用VCSEL/SiPh/EML方案,LPO小批量部署。800G继续采用VCSEL/SiPh/EML方案,并储备LPO/LRO技术。到1.6T,预计单模成为主流应用,以SiPh和EML方案为主。王鹏补充,1.6T光模块主要解决四个挑战,一是功耗和系统散热,二是高速设计和制造,三是可靠性,四是供应和成本。
王鹏最后总结,在光模块领域,阿里云将聚焦400G、800G、1.6T光模块的批量部署应用,关注交换芯片的RX Serdes信号处理能力,探索LRO/LPO应用,同时推动光电芯片技术成熟和供应多元化、国产化。一切技术方案均以支撑业务发展为主,高带宽、低能耗、低成本、可以稳定供应的技术方案依然会是主流选择。
0 条