蚂蚁集团发布最新AI成果：无需高端GPU计算成本降低20%

作者：小编点击：发布时间：2025-03-28 04:05

蚂蚁集团发布最新AI成果：无需高端GPU计算成本降低20%(图1)

　　长久以来，英伟达凭借高性能芯片构筑起“算力霸权”，在AI（人工智能）模型训练领域占据主导地位。这一局面在DeepSeek（深度求索）问世后遭 Kaiyun平台官方遇到不小冲击，如今又面临着新的挑战。

　　3月初，由蚂蚁集团首席技术官何征宇带领的Ling团队发表了一篇技术成果论文。论文显示，该团队开发了两款百灵系列开源混合专家（MoE）模型Ling-Lite（总参数为16.8B）和Ling-Plus（总参数为290B）。相比之下，据《麻省理工科技评论》，GPT-4.5总参数为1.8T，DeepSeek-R1总参数为671B。

　　惊艳之处在于，Ling团队在模型预训练阶段使用较低规格的硬件系统，将计算成本降低了约20%，训练1万亿Token（词元）成本从635万元降至508万元，最终取得了与使用高性能芯片（如英伟达H100、H800等）的模型相当的效果。

　　百灵系列混合专家模型的横空出世，让市场再次质疑英伟达的“算力信仰”。Hugging Face（抱抱脸）工程师Tiezhen Wang（人名）在社交媒体上表示，“做空英伟达的又一理由？”Toms Hard-ware（一个测评网站）发表评论称，蚂蚁集团此次的技术突破清晰展现出中国正坚定地朝着技术独立方向迈进。

　　针对此事，3月24日蚂蚁集团回应媒体称，针对不同芯片持续调优，以降低AI应用成本，目前取得了一定的进展，也会逐步通过开源分享。

　　目前，蚂蚁集团Ling团队的技术成果论文《每一个FLOP都至关重要：无需高级GPU（图形处理器）即可扩展3000亿参数混合专家LING大模型》已发表在预印本平台arXiv上。

　　蚂蚁Ling团队认为，正如DeepSeek开源发布中分析的“昼夜推理负载不均”问题，在推理服务高峰期，高性能资源同样面临短缺。在长期科研实践中，许多机构都持续面临着高端AI加速卡供应不足的问题。相比之下，性能较低的加速器更易获得，且单价更低。因此，模型需要能在异构计算单元和分布式集群间切换的技术框架，同时在AI Infra（人工智能基础设施）部分，在跨集群、跨设备的兼容和可靠层面进行性能优化。

　　该团队的实验结果表明，参数规模为300B左右的混合专家模型可以在性能较低的设备上有效训练，并在性能上达到与同规模的其他模型相当的水平。

　　以Ling-Plus模型为例，在实验中，该模型在五种不同硬件配置下完成9万亿Token的预训练任务。经测算，使用高性能硬件设备训练1万亿Token，预计成本高达635万元人民币，而使用低规格硬件系统，成本则可控制在约508万元，节省近20%。

　　在英语理解能力Kaiyun平台官方上，LingLite模型在一项关键基准测试中的表现与Qwen2.5-7B（模型名）相当，优于Llama3.1-8B（模型名）和Mistral-7B-v0.3（模型名）。

　　在工具使用方面，大多数情况下，Ling-Plus和Ling-Lite在基准测试中均取得了最佳成绩。而工具使用对于大语言模型来说是一项重要且具有挑战性的任务。工具使用能力使模型能够作为AI代理工作、控制机器人系统并与众多软件工具集成。

　　此外，在安全性方面，LingPlus和Qwen2.5-7B表现突出，而Ling-Plus在错误拒绝方面表现更佳。

　　提高大模型的无害性（harmlessness）通常会导致其有用性（helpfulness）的降低。测试结果表明，Ling-Plus在安全性和错误拒绝之间整体平衡性上表现最佳。

　　据悉，蚂蚁百灵大模型LingPlus和Ling-Lite计划开源，并应用于医疗、金融等行业领域。

　　有分析称，百灵系列混合专家模型的推出标志着蚂蚁集团加入AI领域的竞赛。自DeepSeek展示出能够以远低于OpenAI（公司名）和谷歌投入的数十亿美元成本训练出强大模型以来，这一竞争加速升级。

　　此前，DeepSeek在技术论文中表示，DeepSeek-V3模型（总参数671B，激活参数37B）总训练成本为557.6万美元，完整训练消耗了278.8万个GPU小时，几乎是同等性能水平模型训练所需的十分之一，堪称“榨干”GPU，也因此引发了资本市场的恐慌。

　　对此，英伟达CEO（首席执行官）黄仁勋在公开场合多次赞美DeepSeek，但其认为，DeepSeek-R1等更高效的模型出现，反而会刺激计算需求增长。

　　然而，蚂蚁集团正在探索一条新的路径在无高端GPU的情况下扩展模型训练能力。

　　百灵系列混合专家模型的横空出世，让市场再次质疑英伟达的“算力信仰”。Tiezhen Wang在社交媒体上表示，“做空英伟达的又一理由？”著名硬件媒体Toms Hardware指出，这极有可能成为（中国）降低对西方技术依赖进程中的又一重要里程碑。

　　蚂蚁集团有关人士告诉《每日经济新闻》记者，在模型训练过程中，他们既使用了国产芯片，也采用了英伟达芯片。

　　Toms Hardware发表评论称，蚂蚁集团此次技术突破清晰展现出中国正坚定地朝着技术独立方向迈进。彭博资深商业智能分析师罗伯特李（Robert Lea）同样指出，蚂蚁集团的研究展示了中国在AI创新方面的快速进步，也显示出本土企业正朝着AI自给自足的方向迈进。

　　如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权，严禁转载或镜像，违者必究。

　　特别提醒：如果我们使用了您的图片，请作者与本站联系索取稿酬。如您不希望作品出现在本站，可联系我们要求撤下您的作品。

　　商汤科技董事长兼CEO徐立：“基础设施-模型-应用”三位一体推动AI产业规模化发展

　　DeepSeek V3模型完成小版本升级；蚂蚁自研2900亿大模型用国产AI芯片完成高效训练丨全球科技早参

　　国家体育总局：免去周继红职务，按有关规定办理退休手续！她曾带领中国跳水队获得超300枚金牌

　　特朗普宣布：25%关税，永久生效！“马斯克没提建议，也没要好处”！美股集体跳水，特斯拉大跌！美国关键指数连续4个月下降

　　落户成都东部新区！四川首迎国家科创母基金，“创-投-贷-保”全要素金融服务体系打造科技金融新范式

　　特朗普宣布对所有进口汽车征收25%关税；纳指大跌超2%，英伟达特斯拉跌超5%；阿里巴巴发布全模态大模型；股价一度暴涨230%，恒大汽车回应丨每经早参

　　4名美国士兵突然失踪，距白俄罗斯边境不到10公里，所乘装甲车被发现淹没在水中！北约表态，特朗普回应

标签：

分布式技术

上一篇：创新分布式数据库单机技术OceanBase发布单机版产品
下一篇：OceanBase推出单机版专为中小规模业务场景设计

KAIYUN(中国大陆)官方网站-创造最伟大的开云

蚂蚁集团发布最新AI成果：无需高端GPU计算成本降低20%

联系方式

二维码