关键Model Opensource2026-06-10 09:34:22

谷歌DeepMind发布开源无编码器多模态模型Gemma 4 12B

谷歌DeepMind推出120亿参数的Gemma 4 12B统一多模态开源模型。该模型采用无编码器设计，可直接处理文本、图像、音频输入，仅需16GB显存即可本地部署，性能接近谷歌26B MoE模型。

编辑视角

该模型将无编码器多模态架构落地到开源端侧模型，大幅降低消费级设备运行多模态AI的门槛，对端侧AI应用开发有重要参考价值。

深度解读

本次事件主旨为谷歌DeepMind推出全新开源多模态模型Gemma 4 12B，核心创新为无编码器统一多模态架构，简化处理流程降低硬件需求。现有证据包括多家第三方科技媒体的报道，以及第三方模型平台ModelScope已上线该模型的开源卡片。边界说明：目前DeepMind官方博客链接无法访问，所有公开信息均来自第三方渠道，官方原始技术文档与完整测评数据暂无法核实，模型实际表现待社区进一步验证。后续需关注官方文档放出与社区实际使用反馈。

核心要点

谷歌DeepMind发布120亿参数开源多模态模型Gemma 4 12B
采用无编码器架构，无需独立视觉、音频编码器处理数据
仅需16GB显存即可在高端笔记本本地部署运行
性能接近谷歌更大规模的26B MoE模型