中国证监会认证证券投资咨询机构(证书编号:ZX0118) | 客服电话:400-636-8688 | 投诉电话:0755-33189899

【德讯课堂】蚂蚁国产芯片训大模型降本,AI 应用板块会迎爆发潮?

近日,蚂蚁集团在 AI 领域的一项重大突破引发了广泛关注。蚂蚁集团 Ling 团队发表的技术成果论文显示,其推出的两款不同规模的 MoE 大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),性能均达到行业领先水平。

 

更为关键的是,该团队通过一系列创新方法,成功实现了使用国产 GPU 的低性能设备对 3000 亿参数的 MoE 大模型进行高效训练,且性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

 

这意味着蚂蚁集团使用国产 AI 芯片训练大模型,成本可进一步降低。

【德讯课堂】蚂蚁国产芯片训大模型降本,AI 应用板块会迎爆发潮? 1

一、蚂蚁集团国产芯片大模型训练降本之路

 

一直以来,MoE 模型的训练高度依赖高性能计算资源,如英伟达 H100/H800 等先进 GPU。DeepSeek、阿里通义千问、MiniMax 等系列的 MoE 大模型虽在特定任务中表现卓越,但高昂的训练成本严重制约了其在资源受限环境中的普及应用。

 

加之近年来英伟达高性能芯片持续短缺,与之形成鲜明对比的是,低性能加速器供应更为充足且单机成本更低。在此背景下,构建跨异构计算单元与分布式集群无缝切换的技术框架迫在眉睫。

 

蚂蚁集团 Ling 团队毅然设定 “不使用高级 GPU” 来扩展模型的目标,并提出了一系列创新性训练策略。在架构与训练策略革新方面,采用动态参数分配与混合精度调度技术,让资源利用更高效;训练异常处理机制升级上,通过自适应容错恢复系统,大幅缩短中断响应时间;模型评估流程优化中,借助自动化评测框架,将验证周期压缩超 50%;工具调用能力突破层面,基于知识图谱的指令微调,提升复杂任务执行精度。

 

据技术论文,Ling 团队在五种不同硬件配置上对 9 万亿个 token 进行 Ling-Plus 的预训练。

 

其中,使用高性能硬件配置训练 1 万亿 token 的预训练成本约为 635 万元人民币,而利用蚂蚁的优化方法后,使用低规格硬件的训练成本降至 508 万元左右,节省了近 20%,最终还实现了与阿里通义 Qwen2.5 – 72B – Instruct 和 DeepSeek – V2.5 – 1210 – Chat 相当的性能。

【德讯课堂】蚂蚁国产芯片训大模型降本,AI 应用板块会迎爆发潮? 2

二、训练成本下降为 AI 应用发展注入强劲动力

 

训练成本的降低,犹如为 AI 应用发展的列车铺上了更坚实的轨道。以 DeepSeek 为例,其通过一系列算法创新及工程优化,使用性能较低的英伟达 H800 训练出性能与顶尖模型相当的 V3 与 R1,这一突破为大模型训练开辟了新路径,让更多企业和研究机构看到了降低成本、提高效率的希望。

 

而蚂蚁集团此番使用国产 AI 芯片实现成本降低,意义更为深远。

 

对于 AI 应用开发者而言,训练成本降低直接减轻了资金压力,使得更多的中小企业甚至个人开发者有机会涉足 AI 应用开发领域。在以往,高昂的训练成本使得许多创意因资金不足而夭折。

 

如今,成本门槛降低,开发者能够将更多资金投入到应用的创新与优化上。例如在医疗 AI 领域,过去受限于成本,许多医疗影像分析、疾病诊断辅助等 AI 应用的研发进展缓慢。现在,成本降低促使更多企业和科研团队能够深入开展相关研究,加速医疗 AI 应用从实验室走向临床的进程,为患者提供更精准、高效的医疗服务。

 

从产业生态角度看,成本降低会吸引更多的参与者进入 AI 应用市场,丰富产业生态。大量新的开发者和企业涌入,将带来更多新颖的创意和应用场景,促进 AI 应用的多元化发展。

 

如在智能家居领域,随着训练成本降低,更多企业能够开发出智能化程度更高、更贴合用户需求的家居控制应用,实现家居设备的互联互通、智能控制与个性化服务,推动智能家居产业迈向新高度。

【德讯课堂】蚂蚁国产芯片训大模型降本,AI 应用板块会迎爆发潮? 3

 

 

 

三、大模型竞争推动 AI 应用发展

 

蚂蚁集团使用国产 AI 芯片训练大模型实现成本降低,为 AI 应用板块带来了诸多潜在机会。

 

1、华西证券指出,随着 AI 技术的持续进步和成本的大幅降低,结合政策持续加码,AI 与消费领域的融合有望迎来爆发式增长,为行业投资带来全新机遇。

 

DeepSeek 首次实现了大规模 AI 模型性能与成本之间的 “剪刀差式突破”,显著降低了 AI 应用的成本,降至传统模式的 10%-20%。蚂蚁集团使用国产芯片降低训练成本,进一步印证了 AI 成本下行的趋势。

 

在消费场景中,AI 技术的快速发展催生了一系列新型硬件载体,像 AI 眼镜、AI 玩具等,通过集成大模型技术,实现功能跨越,推动消费级 AI 硬件市场规模不断扩大。同时,在电商、教育等下游软件服务领域,AI 应用实现降本增效与智能化升级。

 

AI 内容生成技术降低商家广告制作成本,智能推荐提升转化率;AI 驱动的个性化学习方案和虚拟教师助手优化教育教学效果。随着 AI 调用成本持续下降,AI 软件将在更多行业深度渗透,蚂蚁集团在医疗等领域的 AI 布局正契合这一趋势,有望带动相关产业链发展。

 

2、平安证券表示,当前全球范围内大模型领域的竞争依然白热化,这将持续拔升大模型的整体能力水平。大模型需要大算力,而降低训练成本有助于提升算力的使用效率,使得更多的算力能够投入到模型训练与应用开发中。蚂蚁集团使用国产芯片训练大模型降低成本,有助于推动大模型技术在更广泛的领域应用。

 

随着大模型能力提升,AI 应用在金融领域的风险评估、投资决策辅助等方面将更加精准;在教育领域,能够实现更个性化的学习辅导、智能作业批改等功能。大模型竞争推动下的 AI 应用发展,将为相关企业带来新的业务增长点,也为投资者带来更多的投资机会。

【德讯课堂】蚂蚁国产芯片训大模型降本,AI 应用板块会迎爆发潮? 4

未经允许不得转载:德讯证券顾问 » 【德讯课堂】蚂蚁国产芯片训大模型降本,AI 应用板块会迎爆发潮?

赞 (0)

评论 0

评论前必须登录!

登陆 注册