谷歌发布DiffusionGemma：尝试用文本扩散架构提速AI推理

谷歌于6月10日发布开源实验模型DiffusionGemma，采用文本扩散架构，在专用GPU上文本生成速度较传统自回归模型最高提升4倍，旨在提升AI生成效率，但官方对此保持谨慎态度。

核心要点

1.谷歌发布开源模型DiffusionGemma
2.采用文本扩散架构，提升生成效率
3.速度较传统自回归模型最高提升4倍
4.官方对此保持谨慎态度

关键数据

文本生成速度提升倍数: 4倍(在专用GPU上较传统自回归模型)

影响评估

正面

提升AI文本生成效率，但开源实验性质意味着仍需验证

DiffusionGemma通过文本扩散架构实现速度大幅提升，可能推动高效生成模型发展，但官方谨慎态度提示其稳定性或实用性有待观察。

相关工具

DiffusionGemma— 谷歌于6月10日发布的开源实验模型

谷歌于当地时间 6 月 10 日正式推出了一款名为DiffusionGemma的实验性开源模型。这款模型的一大亮点在于其采用了文本扩散架构（Text-to-text diffusion），旨在通过全新的路径提升人工智能的生成效率。

在性能测试中，DiffusionGemma展现出了独特的技术优势。得益于其架构设计，该模型在专用GPU上的文本生成速度，相比传统的自回归大语言模型最高提升了 4 倍。不过，谷歌官方对此保持了客观的评价，明确指出DiffusionGemma目前定位为面向研究者与开发者的实验性产品。在模型输出质量方面，它尚无法与标准的Gemma4 相比，因此现阶段仍建议在生产环境中使用标准版本。

从应用场景来看，该模型的速度红利有着明确的边界。其性能提升主要集中在本地设备运行及低并发的推理场景中。而在面对高并发的云端部署需求时，这种架构带来的速度优势则相对有限。

为了鼓励技术社区的探索与共创，谷歌将该模型以Apache 2. 0 许可证向公众开放。此举为开发者提供了更低门槛的技术验证空间，也为AI领域探索非自回归架构的推理潜力提供了新的实验样本。尽管当前仍处于早期探索阶段，但DiffusionGemma无疑为未来提升大模型推理效率，提供了一个值得关注的技术思路。

谷歌发布DiffusionGemma：尝试用文本扩散架构提速AI推理

核心要点

关键数据

影响评估

相关工具

相关新闻

DoorDash发布“Ask DoorDash”AI聊天机器人，支持文本与照片跨模态下单

谷歌联合英伟达发布开源模型DiffusionGemma:引入扩散机制，单卡推理提速4倍

讯飞星火医疗大模型 V3.5 正式亮相

微软AI负责人批评Anthropic设计思路：引导AI产生“自我意识”极度危险

Anthropic正式推出全新Claude Mythos系列Fable5 模型

核心要点

关键数据

影响评估

相关工具

相关新闻

DoorDash发布“Ask DoorDash”AI聊天机器人，支持文本与照片跨模态下单

谷歌联合英伟达发布开源模型DiffusionGemma:引入扩散机制，单卡推理提速4倍

讯飞星火医疗大模型 V3.5 正式亮相

微软AI负责人批评Anthropic设计思路：引导AI产生“自我意识”极度危险

​Anthropic正式推出全新Claude Mythos系列Fable5 模型

Anthropic正式推出全新Claude Mythos系列Fable5 模型