返回热力追踪
关键Model Opensource
谷歌DeepMind发布开源无编码器多模态模型Gemma 4 12B
谷歌DeepMind推出120亿参数的Gemma 4 12B统一多模态开源模型。该模型采用无编码器设计,可直接处理文本、图像、音频输入,仅需16GB显存即可本地部署,性能接近谷歌26B MoE模型。
编辑视角
该模型将无编码器多模态架构落地到开源端侧模型,大幅降低消费级设备运行多模态AI的门槛,对端侧AI应用开发有重要参考价值。
深度解读
本次事件主旨为谷歌DeepMind推出全新开源多模态模型Gemma 4 12B,核心创新为无编码器统一多模态架构,简化处理流程降低硬件需求。现有证据包括多家第三方科技媒体的报道,以及第三方模型平台ModelScope已上线该模型的开源卡片。边界说明:目前DeepMind官方博客链接无法访问,所有公开信息均来自第三方渠道,官方原始技术文档与完整测评数据暂无法核实,模型实际表现待社区进一步验证。后续需关注官方文档放出与社区实际使用反馈。
核心要点
- 谷歌DeepMind发布120亿参数开源多模态模型Gemma 4 12B
- 采用无编码器架构,无需独立视觉、音频编码器处理数据
- 仅需16GB显存即可在高端笔记本本地部署运行
- 性能接近谷歌更大规模的26B MoE模型
延伸阅读
- Fluid, natural voice translation with Gemini 3.5 Live Translate — 同属谷歌DeepMind近期发布的AI产品,属于同厂更新