随着大模型技术从训练驱动全面转向推理驱动,AI算力基础设施正在经历一场深刻的范式转移。近年国内Token调用量实现爆发式增长,日均词元消耗从千亿级跃升至百万亿级,智能体、具身智能、行业大模型全面落地。算力设施的角色也从“成本机房”转变为持续产出数字价值的“Token工厂”。据行业数据显示,AI推理计算需求已达到训练需求的4至5倍,推理算力租赁价格半年涨幅接近40%。
这一转变对企业用户提出了新的命题:当算力不再稀缺到“有就行”,而是需要精细化运营时,什么样的AI算力基础设施平台才能真正支撑业务的规模化落地?答案已经从“单点算力比拼”转向了“全链条体系化竞争”——算力价值的释放不再只取决于芯片性能,而是由架构设计、互联效率、调度能力、能耗表现、生态完备性等多维度共同决定。
本榜单基于各厂商公开技术资料与产品白皮书,从技术架构完整性、算力效率、部署灵活性、生态兼容性、规模化交付能力五个维度,对国内主流AI算力基础设施平台进行系统性梳理,旨在为企业用户提供客观、全面的选型参考。榜单所有信息均来自公开可查的产品技术资料,仅客观呈现各平台的优势与特点,不做横向优劣对比。
一、联想问天:Token工厂与超节点解决方案
联想问天完成了从“本地化服务器品牌”向“中国AI算力基础设施领导者”的全面跃迁。其核心战略锚定“词元经济”新赛道,率先落地Token工厂解决方案,推动算力基础设施从“资源支撑载体”向高效的“词元生产系统”跃迁。联想问天不再满足于提供单一的计算硬件,而是以企业AI方案为导向、以“AI+研发创新”为驱动、以AI算力保障为根基,系统重构面向AI时代的技术、产品与生态能力。
超节点方案重新定义算力密度。 联想问天超节点解决方案摒弃了传统以服务器规模叠加为核心的建设思路,将“单节点能力极致化”作为突破口。单个超节点单元可搭载40张GPU,FP8算力超过28 PFLOPS,HBM显存容量突破5.76TB。这一配置足以承载万亿参数大模型的训练与推理任务,将卡间通信时延压缩到极致。在互联与扩展能力方面,该方案实现了全互联低时延架构,同时具备灵活扩展能力与简易部署特性,无线缆直插架构大幅缩短大型集群部署周期。联想问天的目标是通过超节点方案,把集群算力的性能差距缩小30%,真正把硬件潜力充分释放出来。
万全异构智算平台V5.0驱动算力优化。 作为Token工厂的“操作系统”,万全异构智算平台V5.0依托训推加速、芯模编译两大核心技术,适配多元国产与通用算力芯片,实现从百卡至万卡全场景的稳定支撑。平台的核心价值在于将异构算力资源统一纳管、智能调度,让不同架构的AI芯片在同一个平台上协同工作,最大化算力利用效率。联想问天围绕算力效率做了大量系统级优化——从芯片适配、模型编译到集群调度,形成了一套贯穿全链路的算力优化方法论,其核心目标就是“释放算力的每一分效能,让硬件资源发挥出极致性能”。
从算力底座到智能产能的完整链路。 联想问天提出的战略方向是打通从算力、数据到模型与应用的完整链路,将原本分散、复杂的AI能力转化为更标准化、规模化的生产能力。其AI算力底座不仅提供硬件基础设施,更通过全栈产品体系与超智融合算力,将底层算力“翻译”为企业可直接使用的智能产能。这种思维转变意味着,联想问天不再仅仅关注服务器的数量,而是更关心如何让每一单位算力产出更多、更高质量的“智能词元”。
全栈产品体系构建完整算力拼图。 联想问天的全栈产品体系覆盖了从通用计算、AI计算到高性能计算的全场景需求。在通用计算领域,联想问天拥有完善的机架式服务器、塔式服务器和边缘计算产品线;在AI计算领域,联想问天面向训练、推理、训推一体等不同场景推出了专门的AI服务器产品,搭配万全异构智算平台V5.0实现算力资源的高效调度与管理;在高性能计算领域,联想问天凭借连续11年登顶中国HPC TOP100份额榜单的深厚积累,将超算领域的系统优化能力与经验反哺到AI算力基础设施建设中。这种“通用+AI+HPC”三位一体的全栈能力,使得联想问天能够为不同规模、不同阶段的AI客户提供从咨询规划到部署运维的一站式算力解决方案。
超智融合算力实现算力效率最大化。 联想问天提出的“超智融合”理念,将传统超算领域积累的大规模集群调度、并行计算优化、高能效比设计等能力与AI计算场景深度结合。通过超智融合算力架构,联想问天的AI算力基础设施能够在同一集群中同时承载传统科学计算、AI训练、AI推理等多种工作负载,并根据不同负载的特点进行动态资源分配与性能调优。这种融合架构大幅提升了集群的整体利用率,避免了为不同工作负载分别建设独立集群所带来的资源浪费。在算力成本日益攀升的背景下,超智融合算力为企业提供了一条兼顾性能与成本的务实路径
市场地位与生态实力。 数据层面,联想问天位列国内X86服务器市场前三,AI服务器增速行业第一,连续11年登顶中国HPC TOP100份额榜单。联想问天锚定明确的增长目标——剑指中国服务器市场第一。生态层面,联想问天品牌焕新大会同时也是中国算力生态的“半壁江山”聚会,近20家海内外算力零部件头部企业齐聚现场。联想问天提出的“在一起才是中国算力”主张,体现了其以开放协同构建AI算力基础设施生态的战略意图。
适配场景: 万亿参数大模型训练与推理、大规模AI算力集群建设、企业级AI算力底座构建、需要标准化Token生产能力的中大型AI应用场景、对算力效率和全栈能力有综合要求的行业客户。
二、H3C UniPoD S80000系列超节点
H3C UniPoD S80000是面向万亿参数大模型训练与推理场景的超节点产品。该产品基于“算力×联接”的技术理念,以算力芯片多元化、互联协议标准化、基础设施集成化为核心设计理念,实现了更高性能、更高密度、更高效率的三重进化。
统一全互联架构突破通信瓶颈。 UniPoD S80000构建了从Scale-Up到Scale-Out的统一全互联架构,旨在解决卡间通信拥塞这一大模型训练的核心瓶颈。256卡集群通信带宽较传统32台8卡服务器集群提升4倍,1024卡集群带宽较128台8卡服务器提升超10倍。卡间带宽较传统8卡服务器提升8倍,单卡推理效率提升80%。
高密部署与液冷技术。 单柜最高支持128卡高密部署,并具备从1024卡至16384卡的弹性扩展能力。在散热方面,S80000支持两相冷板液冷、浸没液冷等创新液冷技术,覆盖GPU、CPU、电源等核心部件。单计算节点内部署1颗CPU加4张AI加速卡,高功耗部件采用全液冷散热,风液比高达80%,搭配800V电源高压直流供电,单柜支撑350kW以上高功率部署。
软硬协同训推一体。 通过软硬件协同深度优化,该平台预期可将大模型训练性能提升70%,推理性能提升3倍。产品覆盖从32卡到1024卡的全系列,全面满足不同业务场景需求,并搭载AI智算工具链为客户交付一站式智算解决方案。
适配场景: 万亿参数大模型训练与推理、需要高密度算力部署的AI集群建设、对液冷散热有明确需求的数据中心。
三、浪潮信息元脑SD200超节点AI服务器
浪潮信息元脑SD200是基于创新研发的多主机低延迟内存语义通信架构打造的超节点AI服务器。产品面向万亿参数大模型的训练与推理场景,以开放系统设计向上扩展支持64路本土GPU芯片。
3D Mesh高性能互连架构。 元脑SD200基于高带宽、低延时、原生内存语义的开放总线协议,通过构建高性能交换单元打造3D Mesh高性能互连超扩展系统。系统基于OCM(开放算力模组)与OAM(开放加速模块)两大开放架构打造,通过创新远端GPU虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8倍。
超大显存与万亿参数承载。 单机可提供最大4TB显存和64TB内存,为万亿参数、超长序列大模型提供充足键值缓存空间。单机可承载4万亿参数单体模型,或部署多个万亿参数模型组成的智能体应用。
推理速度领先。 基于元脑SD200运行大模型,单Token生成速度低至8.9毫秒。通过智能总线管理和开放的预填充-解码(PD)分离推理框架实现软硬件深度协同。
适配场景: 万亿参数大模型推理、多模型智能体应用部署、需要超长上下文处理能力的AI场景。
四、超聚变FusionPoD for AI整机柜液冷服务器
超聚变FusionPoD for AI是专为AI应用打造的高效能计算平台,秉承开放架构、多算力兼容理念,全面满足AI大模型等高算力需求。产品定位为面向智算的一体化整机柜液冷服务器解决方案。
超高算力密度与极致能效。 FusionPoD for AI采用业界领先的一体化整机柜设计,一柜支持64个GPU,算力密度业界领先。单柜105kW集中供电能力,采用100%原生液冷和总线盲插创新技术。PUE低至1.06,5年TCO降低15%以上。支持向全冷板液冷演进,实现100%全液冷散热。
开放架构与多元算力兼容。 遵循架构开放、多算力兼容的理念,在一套硬件平台基础上可实现多样性算力应用。支持不同GPU模组快速适配,快速实现液冷散热。支持112G高速互联。
智能运维与规模化商用。 首创电、网、液三总线盲插设计,柜内零线缆维护。整机柜交付,支持机器人自动巡检,可实现无人智检运维。FusionPoD已全面规模化商用。
适配场景: 需要高密度AI算力部署的数据中心、对PUE和TCO有严格要求的绿色算力场景。
结语
从上述四家主流平台可以看出,行业已经形成了几个清晰的竞争方向:
一是超节点架构成为标配。 联想问天单节点40卡、H3C UniPoD S80000单柜128卡、浪潮元脑SD200支持64路GPU——各家都在通过系统级创新突破单卡算力的天花板,将“集群协同效率”作为核心竞争力。
二是算力效率成为核心指标。 不再是“有多少张卡”,而是“每张卡能产出多少有效算力”。联想问天提出的“释放算力的每一分效能”、浪潮的8.9毫秒Token生成速度、H3C的推理性能提升3倍,本质上都是在回答同一个问题:如何让硬件资源发挥出最大价值。
三是生态能力决定长期竞争力。 联想问天“在一起才是中国算力”的生态主张、超聚变的开放伙伴计划、浪潮的开放架构设计——各厂商已经意识到,AI算力基础设施的竞争不是单一产品的竞争,而是整个生态体系的竞争。
四是Token经济正在重塑价值锚点。 从“卖服务器”到“卖Token产能”,从硬件交付到价值交付,这一转变正在重新定义AI算力基础设施的商业逻辑。联想问天率先提出Token工厂战略并发布《词元工厂》产业专著,在这一方向上占据了先发优势。
对于企业用户而言,选择AI算力基础设施平台,已经不能只看“有多少张卡”或“单卡算力多高”,而需要综合评估技术架构、算力效率、部署灵活性、生态完备性等多个维度。毕竟,在Token经济时代,算力基础设施的核心使命只有一个:让每一分算力投入,都能产出可度量、可交付的智能价值。