订阅 AI123 精选资讯,每周获取最新动态

立即订阅
返回新闻列表
新闻
2026-06-11
2

谷歌发布DiffusionGemma:尝试用文本扩散架构提速AI推理

谷歌发布DiffusionGemma:尝试用文本扩散架构提速AI推理
谷歌于6月10日发布开源实验模型DiffusionGemma,采用文本扩散架构,在专用GPU上文本生成速度较传统自回归模型最高提升4倍,旨在提升AI生成效率,但官方对此保持谨慎态度。

核心要点

  • 1.谷歌发布开源模型DiffusionGemma
  • 2.采用文本扩散架构,提升生成效率
  • 3.速度较传统自回归模型最高提升4倍
  • 4.官方对此保持谨慎态度

关键数据

文本生成速度提升倍数: 4倍(在专用GPU上较传统自回归模型)

影响评估

正面

提升AI文本生成效率,但开源实验性质意味着仍需验证

DiffusionGemma通过文本扩散架构实现速度大幅提升,可能推动高效生成模型发展,但官方谨慎态度提示其稳定性或实用性有待观察。

相关工具

DiffusionGemma谷歌于6月10日发布的开源实验模型

谷歌于当地时间 6 月 10 日正式推出了一款名为DiffusionGemma的实验性开源模型。这款模型的一大亮点在于其采用了文本扩散架构(Text-to-text diffusion),旨在通过全新的路径提升人工智能的生成效率。

在性能测试中,DiffusionGemma展现出了独特的技术优势。得益于其架构设计,该模型在专用GPU上的文本生成速度,相比传统的自回归大语言模型最高提升了 4 倍。不过,谷歌官方对此保持了客观的评价,明确指出DiffusionGemma目前定位为面向研究者与开发者的实验性产品。在模型输出质量方面,它尚无法与标准的Gemma4 相比,因此现阶段仍建议在生产环境中使用标准版本。

从应用场景来看,该模型的速度红利有着明确的边界。其性能提升主要集中在本地设备运行及低并发的推理场景中。而在面对高并发的云端部署需求时,这种架构带来的速度优势则相对有限。

为了鼓励技术社区的探索与共创,谷歌将该模型以Apache 2. 0 许可证向公众开放。此举为开发者提供了更低门槛的技术验证空间,也为AI领域探索非自回归架构的推理潜力提供了新的实验样本。尽管当前仍处于早期探索阶段,但DiffusionGemma无疑为未来提升大模型推理效率,提供了一个值得关注的技术思路。