自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

Anthropic推出Claude Opus 4.5完成AI模型升级并大幅降价

2025-11-26 01:15:05
收藏

Claude Opus 4.5发布完成三模型布局

Anthropic本周一推出Claude Opus 4.5,标志着其三大模型家族正式成型,这也是该公司在两个月内的第三次重大发布。这款新旗舰模型在编程基准测试中位居榜首,同时价格大幅下调。

三模型定位各具特色

此次发布完成了自9月底Claude Sonnet 4.5开始,10月Claude Haiku 4.5接续的快速产品迭代。随着Opus的加入,开发者现在拥有完整的工具组合:Opus适用于复杂生产任务,Sonnet处理日常事务,Haiku则专攻需要简单逻辑的速度敏感型任务。

性能表现超越同类产品

Claude Opus 4.5在SWE-bench Verified测试中获得80.9%的得分,该基准用于评估现实软件工程任务。这一成绩略微领先OpenAI的GPT-5.1-Codex-Max(77.9%)和谷歌的Gemini 3 Pro(76.2%)。据称,Opus在公司内部工程能力测试中超越了所有人类考生,这项两小时的评估专门考察压力下的判断能力。

价格策略引发市场关注

在AI巨头竞相争夺年度排行榜之际,Anthropic为Opus制定了颇具吸引力的定价:每百万输入token收费5美元,输出token收费25美元,较前代Opus模型降价67%。这一价格介于OpenAI最新GPT-5.1与Anthropic旧版Opus 4.1之间,虽然仍高于Gemini 3 Pro的定价,但显示出领先AI实验室不仅比拼技术能力,更注重推动前沿智能技术实现规模化部署的经济可行性。

技术架构持续创新

与Sonnet和GPT-5类似,Claude Opus 4.5采用“混合推理”架构,单个模型同时支持直接推理和思维链处理。它支持20万token的上下文窗口,可输出最多6.4万token。模型知识截止日期为2025年3月,略晚于Sonnet的1月截止期。

开发者实测验证性能

开发者Simon Willison在周末对Opus 4.5进行了深度测试,用它重构了自己的某个项目。该模型处理了39个文件的20次提交,新增2022行代码,删除1173行。尽管他承认新模型确实优于Sonnet 4.5,但实际使用中并未感受到显著的能力差异。另一位开发者Theo Browne则在视频评测中盛赞这是“有史以来最优秀的编程模型”。

行业竞争日趋白热化

谷歌Gemini 3 Pro近期以1501的LMArena得分引发关注, Salesforce首席执行官甚至宣布将弃用ChatGPT转投谷歌模型。与此同时,微软和英伟达上周宣布对Anthropic进行数十亿美元投资,使这家初创公司估值达到约3500亿美元。这些合作包括扩展Azure集成服务,以及配备英伟达基础设施用于Claude模型的训练和部署。

Opus 4.5已通过Anthropic API、AWS Bedrock、Google Vertex AI及Claude网页与桌面应用程序立即开放使用。

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻