• 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

谷歌DiffusionGemma AI突破每秒1000 tokens,且完全免费

2026-06-11 06:34:25
收藏

谷歌发布DiffusionGemma:文本扩散模型,速度提升四倍

谷歌今天发布了DiffusionGemma,一款开源AI模型,其生成文本的方式类似图像生成器创建图片:从噪声开始,逐步精炼直到内容合理。该模型在英伟达H100上每秒可处理1000个令牌(令牌是AI模型处理的基本信息单位),速度是常规Gemma的四倍。模型免费开源,采用Apache 2.0许可,权重已开放下载。

但限制依然存在。根据谷歌的公告,该模型“在英伟达GeForce RTX 5090上每秒可处理700+令牌”,且输出质量落后于标准版Gemma 4。谷歌自己也承认:这是一款速度优先的模型,而非质量升级版。

架构革新:从顺序生成到并行细化

你使用过的所有大语言模型都像打字机——每次生成一个令牌,每个词依赖前一个词。这是自回归架构的工作方式。DiffusionGemma则不同:它不按顺序生成令牌,而是并行处理经过精炼的乱码文本块。根据谷歌开发者指南,模型“从一个由随机占位令牌构成的画布开始”,然后迭代锁定置信度高的令牌,直到整个块清晰成型。每次前向传播处理256个令牌,GPU始终处于忙碌状态。

这种架构的副效应是双向注意力——生成过程中每个令牌都能看到其他所有令牌,这在自回归模型中是不可能的(它们无法预知未来即将编码的内容)。这使得模型特别擅长答案末尾约束开头的任务:代码填充、结构化输出、强约束问题等。谷歌微调了一个版本来解数独作为演示,基础模型几乎完全解不出,而微调后的版本正确率达到80%。

文本扩散:从学术研究到开源里程碑

文本扩散技术已作为研究项目存在多年。MDLM、SEDD、LLaDA、Dream等学术模型证明了这种方法在小规模下的可行性,但大多停留在概念验证阶段。Inception Labs于2026年2月发布了Mercury 2,作为首个商业扩散推理模型,声称速度比同级别优化模型快五倍。但此前没有任何模型是开源的,也没有在主流推理框架中获得首发支持。DiffusionGemma是顶级实验室首次大规模开源此类模型。

历史颇具讽刺意味:图像生成器最初采用扩散模型(因此得名Stable Diffusion),如今正向自回归架构迁移以提升质量;而语言模型以自回归起步,如今正尝试扩散架构以提升速度。

运行效率与当前挑战

高效运行DiffusionGemma需要一个“起草器”——一个轻量级模块,并行提出令牌块,再由主模型在一次前向传播中验证。这称为推测解码。DFlash是2026年初发布的一个框架,使用小型扩散模型作为起草器,在某些任务上实现了6倍以上的加速,是让这类模型具备实用性的核心引擎。

问题在于:DiffusionGemma需要特定的起草器才能在苹果芯片上通过MLX框架本地运行。该模块目前不存在于任何公开版本的mlx-lm、任何开放pull request或LM Studio的预装运行环境中。我们尝试通过英伟达NIM框架使用Hermes运行DiffusionGemma,模型加载后却出现“代理初始化失败:模型google/diffusiongemma-26b-a4b-it的上下文窗口为8192个令牌,低于Hermes Agent要求的64000最低值”。实际上,DiffusionGemma的真实上下文窗口是256K个令牌,8192是英伟达默认配置的错误,并非模型架构限制。在实际使用中,正确配置代理需要手动操作,大多数普通用户尚未掌握,而Hermes Agent在配置完成前无法启动。并行速度再快,如果代理无法启动也毫无意义。希望在未来几天内社区能提供更好的资源来运行这些模型。

适用场景与未来展望

面向的目标用户是拥有英伟达RTX 4090或5090硬件的开发者,用于构建实时工具——内联编辑器、自动补全、代码填充、结构化生成。正如五月份的报道,谷歌一直在稳步推进无需新硬件即可实现更快本地推理的目标。对于研究人员,双向生成为自回归模型无法触及的领域打开了大门——蛋白质序列、数学图结构,任何第N个位置依赖于第N+50个位置的问题。这并非小事。

谷歌于四月份以Apache 2.0许可发布了Gemma 4,DiffusionGemma延续了这一策略。目前已有针对llama.cpp的pull request草案提交。当工具链成熟后,该模型将覆盖更广泛的用户。在配备独立GPU的机器上,每秒1000个令牌的速度是真实可用的。

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻
自选
我的自选
查看全部
市值 价格 24h%