芯位科技 | AI赋能教育_智慧校园

请输入

谷歌推出DiffusionGemma文本扩散AI模型，本地推理效率实现大幅提升

2026年6月12日

大小：3.59MB00:00:00/ 00:00:00

6 月 11 日，谷歌正式推出全新文本扩散 AI 模型 DiffusionGemma，该模型凭借创新架构将本地推理速度提升至传统自回归模型的 4 倍，为端侧及本地 AI 应用发展开辟新方向。目前 GPT、Gemini 等主流大模型均采用自回归架构，需按顺序逐一生成文本单元，虽适配云端作业，但在本地运行时易受内存带宽制约，造成算力损耗。DiffusionGemma 另辟蹊径，运用文本扩散技术，以噪声逐步去噪、并行处理文本单元的方式生成内容，高度适配本地低带宽环境。

该模型综合能力与同系列 Gemma 4 模型持平，兼顾生成质量与运行效率，支持迭代纠错，输出内容稳定性更强。其采样速率可达每秒 1479 个文本单元，单次生成仅需 0.84 秒。多项测试展现出差异化实力，代码生成领域表现亮眼，在三项权威测评中分别取得 30.9%、45.4%、89.6% 的成绩，整体水平比肩 Gemini 2.0 Flash-Lite；数学推理能力突出，在 AIME 2025 测试中得分 23.3%，优于同类对比模型。不过该模型仍存在短板，在科学推理、高难度综合推理场景中表现不及主流模型。

硬件适配层面，DiffusionGemma 可充分发挥英伟达 GPU 的并行计算能力。实测数据显示，不同设备运行速度差异明显，单块 H100 GPU 每秒可生成 1000 个文本单元，DGX Spark 设备速率为每秒 150 个，DGX Station 设备可达每秒 2000 个文本单元。现阶段，DiffusionGemma 已依据 Apache 2.0 开源协议对外开放，开发者可前往 Hugging Face 平台下载模型权重，开展二次开发与落地实践。

【新闻来源】环球网 https://tech.huanqiu.com/article/4RvtGkCfahP

（本网转发此文章，旨在为读者提供更多的信息资讯，所涉内容不构成投资、消费建议。文章事实如有疑问，请与有关方核实，文章观点非本网观点，仅供读者参考。）