
6 月 11 日,谷歌正式推出全新文本扩散 AI 模型 DiffusionGemma,该模型凭借创新架构将本地推理速度提升至传统自回归模型的 4 倍,为端侧及本地 AI 应用发展开辟新方向。目前 GPT、Gemini 等主流大模型均采用自回归架构,需按顺序逐一生成文本单元,虽适配云端作业,但在本地运行时易受内存带宽制约,造成算力损耗。DiffusionGemma 另辟蹊径,运用文本扩散技术,以噪声逐步去噪、并行处理文本单元的方式生成内容,高度适配本地低带宽环境。
该模型综合能力与同系列 Gemma 4 模型持平,兼顾生成质量与运行效率,支持迭代纠错,输出内容稳定性更强。其采样速率可达每秒 1479 个文本单元,单次生成仅需 0.84 秒。多项测试展现出差异化实力,代码生成领域表现亮眼,在三项权威测评中分别取得 30.9%、45.4%、89.6% 的成绩,整体水平比肩 Gemini 2.0 Flash-Lite;数学推理能力突出,在 AIME 2025 测试中得分 23.3%,优于同类对比模型。不过该模型仍存在短板,在科学推理、高难度综合推理场景中表现不及主流模型。
硬件适配层面,DiffusionGemma 可充分发挥英伟达 GPU 的并行计算能力。实测数据显示,不同设备运行速度差异明显,单块 H100 GPU 每秒可生成 1000 个文本单元,DGX Spark 设备速率为每秒 150 个,DGX Station 设备可达每秒 2000 个文本单元。现阶段,DiffusionGemma 已依据 Apache 2.0 开源协议对外开放,开发者可前往 Hugging Face 平台下载模型权重,开展二次开发与落地实践。
【新闻来源】环球网 https://tech.huanqiu.com/article/4RvtGkCfahP
(本网转发此文章,旨在为读者提供更多的信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。)