精选

订阅 AI123 精选资讯，每周获取最新动态

返回新闻列表

精选新闻

2026-06-05

2

16GB内存本地即时响应！谷歌发布Gemma 4 12B，颠覆性“无编码器”架构引爆开源社区

16GB内存本地即时响应！谷歌发布Gemma 4 12B，颠覆性“无编码器”架构引爆开源社区

核心要点

1.谷歌发布Gemma4 12B多模态模型，取消独立编码器组件
2.仅需16GB显存即可在消费级硬件本地运行，无需云端算力
3.采用多层Token预测技术提升推理速度
4.采用Apache2.0开源，支持Ollama、vLLM等多种框架
5.累计下载量突破1.5亿次，引发开发者社区关注

关键数据

参数量: 120亿(Gemma4 12B模型参数规模)本地运行所需显存: 16GB(可在高端笔记本电脑上本地部署运行)累计下载量: 1.5亿次(Gemma4系列模型总下载量)

影响评估

正面

显著降低多模态模型本地部署门槛，推动开源大模型生态发展

无编码器架构优化了计算效率，使消费级硬件能运行高性能多模态模型，加速AI应用普及

相关工具

Gemma4 12B— 谷歌发布的核心多模态模型Ollama— 支持Gemma4 12B推理的框架之一LM Studio— 支持Gemma4 12B推理的框架之一MLX— 支持Gemma4 12B推理的框架之一SGLang— 支持Gemma4 12B推理的框架之一vLLM— 支持Gemma4 12B推理的框架之一AI Edge Gallery— 谷歌提供端侧部署包谷歌云— 用于企业级集群部署的工具

谷歌发布全新多模态模型Gemma4 12B，颠覆传统架构，取消独立编码器组件，实现消费级硬件上的高效本地部署与推理。这一突破显著降低多模态模型的计算复杂度，提升运行速度，标志着开源大模型生态进入新阶段。

来源: aibase阅读原文

相关新闻

智能体“装”进PC！中兴携手腾讯打造 AI 云电脑，原生绑定混元大模型

A股迎来大模型定价时代！智谱拟募资 150 亿元冲刺科创板

手机AI能直接调动微信了!微信互联多厂商推A2A助手，操作链路迎变革

Anthropic 发布 Claude 安全隔离架构：三款产品展现多层防护策略

GPT-5. 5 拿下利用率冠军，DeepSeek V4 Pro斩获性价比之王！大模型网络安全攻防实测报告出炉