订阅 AI123 精选资讯,每周获取最新动态

立即订阅
返回新闻列表
精选新闻
2026-06-05
2

16GB内存本地即时响应!谷歌发布Gemma 4 12B,颠覆性“无编码器”架构引爆开源社区

16GB内存本地即时响应!谷歌发布Gemma 4 12B,颠覆性“无编码器”架构引爆开源社区

核心要点

  • 1.谷歌发布Gemma4 12B多模态模型,取消独立编码器组件
  • 2.仅需16GB显存即可在消费级硬件本地运行,无需云端算力
  • 3.采用多层Token预测技术提升推理速度
  • 4.采用Apache2.0开源,支持Ollama、vLLM等多种框架
  • 5.累计下载量突破1.5亿次,引发开发者社区关注

关键数据

参数量: 120亿(Gemma4 12B模型参数规模)本地运行所需显存: 16GB(可在高端笔记本电脑上本地部署运行)累计下载量: 1.5亿次(Gemma4系列模型总下载量)

影响评估

正面

显著降低多模态模型本地部署门槛,推动开源大模型生态发展

无编码器架构优化了计算效率,使消费级硬件能运行高性能多模态模型,加速AI应用普及

相关工具

Gemma4 12B谷歌发布的核心多模态模型Ollama支持Gemma4 12B推理的框架之一LM Studio支持Gemma4 12B推理的框架之一MLX支持Gemma4 12B推理的框架之一SGLang支持Gemma4 12B推理的框架之一vLLM支持Gemma4 12B推理的框架之一AI Edge Gallery谷歌提供端侧部署包谷歌云用于企业级集群部署的工具
谷歌发布全新多模态模型Gemma4 12B,颠覆传统架构,取消独立编码器组件,实现消费级硬件上的高效本地部署与推理。这一突破显著降低多模态模型的计算复杂度,提升运行速度,标志着开源大模型生态进入新阶段。
来源: aibase阅读原文