返回热力追踪
关键AI产品芯片

深圳多团队依托华为昇腾910C完成1.6万亿参数大模型训练

深圳河套学院联合哈工大深圳、华为、深智城等单位,依托昇腾910C国产AI算力集群,完成1.6万亿参数DeepSeek-V4-Pro全参数后训练。项目算力利用率超30%,关键算子效率提升14%,验证了国产AI芯片支撑超大模型训练的可行性。

编辑视角

本次实践是国产AI算力支撑顶级大模型训练的关键验证,为国内大模型产业基于国产算力发展提供了重要参考,具备很高产业价值。

深度解读

本次事件是国内多机构联合攻关,验证国产AI芯片支撑超大参数大模型全参数训练可行性的重要实践。已有多家权威媒体援引官方信息报道,明确项目完成1.6万亿参数DeepSeek-V4-Pro全参数后训练,算力利用率超30%,关键算子效率提升14%,各项指标达到工业级运行标准。边界方面,目前仅披露训练环节成果,未公开模型的能力测评结果,也未公布该模型的开源或商业化计划,本次成果仅验证训练环节技术路径可行,不代表模型整体性能达到顶级水平。后续需关注该模型的公开能力测试、落地进展,以及更多国产算力训练大模型的实践成果。

核心要点
  • 深圳多家机构联合依托昇腾910C完成1.6万亿大模型训练
  • 项目算力利用率超30%,关键算子效率提升14%达工业级
  • 验证国产AI芯片可支撑世界级超大参数模型训练
延伸阅读
  • 华为徐直军称昇腾芯片将持续演进更多芯片在规划补充昇腾芯片迭代背景,辅助理解本次成果