关注Model Opensource2026-06-14 11:31:14

NVIDIA发布基于DeepSeek-V4-Pro的NVFP4量化开源大模型

本模型是NVIDIA推出的基于DeepSeek-V4-Pro底座的4位浮点量化开源大模型，采用专为MoE优化的NVFP4量化技术，可在精度损失极小的前提下减半内存占用，提升推理效率，已有第三方测评与解析发布。

编辑视角

该模型验证了NVFP4量化技术在万亿参数MoE大模型上的落地效果，为大规模大模型低显存部署提供了新方案，对AI工程部署有较高参考价值。

深度解读

本次信号核心是NVIDIA基于DeepSeek官方V4-Pro底座，推出适配自家NVFP4 4位量化技术的开源大模型，验证了低精度量化在万亿参数MoE模型上的可用性。证据显示该模型已公开上传至Hugging Face，累计下载量超3.6万，已有第三方发布了NVFP4与FP8的性能对比测评，以及量化技术原理解析。边界：目前没有NVIDIA官方发布的完整技术文档与产品路线，现有第三方数据覆盖场景有限，无法全面验证全场景性能。后续需观察该量化技术的进一步适配推广与实际部署表现。

核心要点

NVIDIA发布基于DeepSeek-V4-Pro的NVFP4 4位量化开源大模型
该模型总参数1.6万亿，激活参数490亿，采用MoE架构
NVFP4量化可减半内存占用，精度损失极小且提升推理效率