自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

谷歌升级Gemini AI图像生成功能 全力反击ChatGPT

2025-08-27 01:35:52
收藏

谷歌发布Gemini 2.5 Flash图像模型

周二,谷歌正式推出Gemini 2.5 Flash图像模型,这款新型AI工具在图像生成与编辑精度、角色一致性方面超越前代产品,试图缩小与OpenAI旗下ChatGPT的差距。

多模态AI竞赛升级

科技巨头将高级图像编辑功能整合至Gemini的举措,反映了AI平台将图像生成视为标配功能的行业趋势。该工具现已登陆Gemini全系应用平台,用户可通过自然语言指令实现复杂编辑——包括姿势调整、多图融合等操作,同时保持人脸与场景的真实性。

谷歌在技术博客中介绍:"新模型支持将同一角色置于不同场景,或从多角度展示产品......所有操作都能保持主体完整性。"

技术细节曝光

该模型最初以"纳米香蕉"代号现身众测平台LMArena,其无缝编辑能力引发关注。谷歌周二确认这是其秘密研发的项目。

官方说明显示,系统具备多图融合、角色一致性维护(适用于故事创作与品牌宣传)等功能,并能结合"世界知识"解析图表或整合参考资料——所有这些仅需单条指令即可完成。

商业化与竞争格局

在谷歌云平台,该模型定价为每百万输出token30美元(约合单图0.04美元),同时通过OpenRouter和fal.ai渠道分发。

OpenAI于2024年5月推出GPT-4o模型,2025年3月新增图像生成功能,推动ChatGPT周活跃用户突破7亿。相比之下,谷歌2025年8月公布的Gemini月活用户为4亿,周活数据明显落后。

安全措施

谷歌表示所有输出内容将植入不可见的SynthID数字水印和元数据标签,以标识AI生成属性,应对滥用风险和真实性争议。

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻