谷歌发布DiffusionGemma:文本扩散模型,速度提升四倍
谷歌今天发布了DiffusionGemma,一款开源AI模型,其生成文本的方式类似图像生成器创建图片:从噪声开始,逐步精炼直到内容合理。该模型在英伟达H100上每秒可处理1000个令牌(令牌是AI模型处理的基本信息单位),速度是常规Gemma的四倍。模型免费开源,采用Apache 2.0许可,权重已开放下载。
但限制依然存在。根据谷歌的公告,该模型“在英伟达GeForce RTX 5090上每秒可处理700+令牌”,且输出质量落后于标准版Gemma 4。谷歌自己也承认:这是一款速度优先的模型,而非质量升级版。
架构革新:从顺序生成到并行细化
你使用过的所有大语言模型都像打字机——每次生成一个令牌,每个词依赖前一个词。这是自回归架构的工作方式。DiffusionGemma则不同:它不按顺序生成令牌,而是并行处理经过精炼的乱码文本块。根据谷歌开发者指南,模型“从一个由随机占位令牌构成的画布开始”,然后迭代锁定置信度高的令牌,直到整个块清晰成型。每次前向传播处理256个令牌,GPU始终处于忙碌状态。
这种架构的副效应是双向注意力——生成过程中每个令牌都能看到其他所有令牌,这在自回归模型中是不可能的(它们无法预知未来即将编码的内容)。这使得模型特别擅长答案末尾约束开头的任务:代码填充、结构化输出、强约束问题等。谷歌微调了一个版本来解数独作为演示,基础模型几乎完全解不出,而微调后的版本正确率达到80%。
文本扩散:从学术研究到开源里程碑
文本扩散技术已作为研究项目存在多年。MDLM、SEDD、LLaDA、Dream等学术模型证明了这种方法在小规模下的可行性,但大多停留在概念验证阶段。Inception Labs于2026年2月发布了Mercury 2,作为首个商业扩散推理模型,声称速度比同级别优化模型快五倍。但此前没有任何模型是开源的,也没有在主流推理框架中获得首发支持。DiffusionGemma是顶级实验室首次大规模开源此类模型。
历史颇具讽刺意味:图像生成器最初采用扩散模型(因此得名Stable Diffusion),如今正向自回归架构迁移以提升质量;而语言模型以自回归起步,如今正尝试扩散架构以提升速度。
运行效率与当前挑战
高效运行DiffusionGemma需要一个“起草器”——一个轻量级模块,并行提出令牌块,再由主模型在一次前向传播中验证。这称为推测解码。DFlash是2026年初发布的一个框架,使用小型扩散模型作为起草器,在某些任务上实现了6倍以上的加速,是让这类模型具备实用性的核心引擎。
问题在于:DiffusionGemma需要特定的起草器才能在苹果芯片上通过MLX框架本地运行。该模块目前不存在于任何公开版本的mlx-lm、任何开放pull request或LM Studio的预装运行环境中。我们尝试通过英伟达NIM框架使用Hermes运行DiffusionGemma,模型加载后却出现“代理初始化失败:模型google/diffusiongemma-26b-a4b-it的上下文窗口为8192个令牌,低于Hermes Agent要求的64000最低值”。实际上,DiffusionGemma的真实上下文窗口是256K个令牌,8192是英伟达默认配置的错误,并非模型架构限制。在实际使用中,正确配置代理需要手动操作,大多数普通用户尚未掌握,而Hermes Agent在配置完成前无法启动。并行速度再快,如果代理无法启动也毫无意义。希望在未来几天内社区能提供更好的资源来运行这些模型。
适用场景与未来展望
面向的目标用户是拥有英伟达RTX 4090或5090硬件的开发者,用于构建实时工具——内联编辑器、自动补全、代码填充、结构化生成。正如五月份的报道,谷歌一直在稳步推进无需新硬件即可实现更快本地推理的目标。对于研究人员,双向生成为自回归模型无法触及的领域打开了大门——蛋白质序列、数学图结构,任何第N个位置依赖于第N+50个位置的问题。这并非小事。
谷歌于四月份以Apache 2.0许可发布了Gemma 4,DiffusionGemma延续了这一策略。目前已有针对llama.cpp的pull request草案提交。当工具链成熟后,该模型将覆盖更广泛的用户。在配备独立GPU的机器上,每秒1000个令牌的速度是真实可用的。

交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
去中心化交易所
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
ETF追踪
索拉纳ETF
瑞波币ETF
香港ETF
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
大额转账
链上异动
比特币回报率
稳定币市值
期权分析
新闻
文章
财经日历
专题
钱包
合约计算器
账号安全
资讯收藏
自选币种
我的关注