精选新闻
2026-06-05
2
16GB内存本地即时响应!谷歌发布Gemma 4 12B,颠覆性“无编码器”架构引爆开源社区

核心要点
- 1.谷歌发布Gemma4 12B多模态模型,取消独立编码器组件
- 2.仅需16GB显存即可在消费级硬件本地运行,无需云端算力
- 3.采用多层Token预测技术提升推理速度
- 4.采用Apache2.0开源,支持Ollama、vLLM等多种框架
- 5.累计下载量突破1.5亿次,引发开发者社区关注
关键数据
参数量: 120亿(Gemma4 12B模型参数规模)本地运行所需显存: 16GB(可在高端笔记本电脑上本地部署运行)累计下载量: 1.5亿次(Gemma4系列模型总下载量)
影响评估
正面
显著降低多模态模型本地部署门槛,推动开源大模型生态发展
无编码器架构优化了计算效率,使消费级硬件能运行高性能多模态模型,加速AI应用普及
相关工具
Gemma4 12B— 谷歌发布的核心多模态模型Ollama— 支持Gemma4 12B推理的框架之一LM Studio— 支持Gemma4 12B推理的框架之一MLX— 支持Gemma4 12B推理的框架之一SGLang— 支持Gemma4 12B推理的框架之一vLLM— 支持Gemma4 12B推理的框架之一AI Edge Gallery— 谷歌提供端侧部署包谷歌云— 用于企业级集群部署的工具
谷歌发布全新多模态模型Gemma4 12B,颠覆传统架构,取消独立编码器组件,实现消费级硬件上的高效本地部署与推理。这一突破显著降低多模态模型的计算复杂度,提升运行速度,标志着开源大模型生态进入新阶段。
来源: aibase阅读原文