2025年4月29日,阿里通义发布Qwen3模型引发行业震动的同时,另一则重磅消息在AI芯片领域暗流涌动——深度求索(DeepSeek)即将发布的R2大模型,基于华为昇腾910B集群实现性能突破,其推理预计成本较GPT-4下降97%,集群利用率达82%,整体性能达到英伟达A100集群的91%。这一突破标志着国产AI芯片首次在性价比领域对国际巨头形成实质性威胁,而华为昇腾910B的大规模出货计划(预计2025年产能突破50万片)更被业界视为改变全球算力格局的关键变量。
一、技术突破解析
DeepSeekR2采用华为昇腾910B集群的分布式训练架构,通过MindSpore框架的动态图优化技术,将模型训练效率提升至传统GPU集群的3倍。昇腾910B基于达芬奇架构,半精度算力达320TFLOPS,结合华为自研的全互联网络技术(HCIA),实现了千卡集群的端到端延迟低于1微秒,这一指标较英伟达H100集群(延迟约3微秒)具有显著优势。值得注意的是,昇腾910B的单位算力功耗仅为A100的65%,在数据中心电费占比超40%的背景下,这一特性将大幅降低企业运营成本。
二、自主可控加速:华为昇腾构建国产算力护城河
在英伟达H20芯片遭美国政府“无限期禁售”、中国算力缺口扩大至80万片的背景下,华为昇腾910B的大规模出货成为行业“救火队长”。截至2025年4月,昇腾910B已完成与DeepSeek、百度文心、科大讯飞等160多个大模型的适配,并在政务、金融、医疗等领域落地超400个场景。华为通过“昇腾AI云服务”模式,为企业提供从算力租赁到模型部署的全栈解决方案,其云服务价格较英伟达生态低30%-50%,吸引了比亚迪、吉利等车企的批量采购。
三、市场格局重构:英伟达降价难阻国产替代浪潮
面对华为昇腾的强势崛起,英伟达被迫启动“价格保卫战”。其H20芯片单卡价格已降至10万元,较昇腾910B(12万元)低10%,但市场反馈显示,昇腾910B在金融风控、生物医药等垂类场景的实际推理效率仍领先H20约15%。更值得关注的是,华为昇腾910B的国产化率已达90%,其供应链涵盖中芯国际(7nm)、长鑫存储(HBM)等本土企业,彻底摆脱了对台积电的依赖。
四、机构观点:算力自主与场景落地双轮驱动
中信证券指出,昇腾910B的规模化应用将推动中国AI算力成本下降80%,建议关注服务器厂商及算力租赁企业。
中金公司强调,昇腾910B在政务、医疗等“数据敏感型”场景的渗透率已达35%,预计2025年相关市场规模将突破500亿元,可关注昇腾服务器代工、昇腾生态渠道相关公司。
华泰证券认为,华为昇腾与DeepSeek的合作模式(昇腾提供算力+DeepSeek提供模型)将成为行业标杆,建议布局大模型厂商及芯片设计企业。
华为昇腾910B与DeepSeekR2的“算力-模型”组合,正在改写全球AI芯片的竞争规则。随着国产算力自主化进程加速,中国有望在2025年实现AI芯片市场50%的国产化率,这一趋势不仅将重塑产业链格局,更将为全球AI产业提供“去美国化”的新选择。投资者需重点关注昇腾生态的技术突破、政策支持及国际供应链变化,把握这一历史性机遇。
未经允许不得转载:德讯证券顾问 » AI芯片重大突破!国产替代再加速:预达英伟达A100 91%性能!
评论前必须登录!
登陆 注册