Claude Opus 4.5发布完成三模型布局
Anthropic本周一推出Claude Opus 4.5,标志着其三大模型家族正式成型,这也是该公司在两个月内的第三次重大发布。这款新旗舰模型在编程基准测试中位居榜首,同时价格大幅下调。
三模型定位各具特色
此次发布完成了自9月底Claude Sonnet 4.5开始,10月Claude Haiku 4.5接续的快速产品迭代。随着Opus的加入,开发者现在拥有完整的工具组合:Opus适用于复杂生产任务,Sonnet处理日常事务,Haiku则专攻需要简单逻辑的速度敏感型任务。
性能表现超越同类产品
Claude Opus 4.5在SWE-bench Verified测试中获得80.9%的得分,该基准用于评估现实软件工程任务。这一成绩略微领先OpenAI的GPT-5.1-Codex-Max(77.9%)和谷歌的Gemini 3 Pro(76.2%)。据称,Opus在公司内部工程能力测试中超越了所有人类考生,这项两小时的评估专门考察压力下的判断能力。
价格策略引发市场关注
在AI巨头竞相争夺年度排行榜之际,Anthropic为Opus制定了颇具吸引力的定价:每百万输入token收费5美元,输出token收费25美元,较前代Opus模型降价67%。这一价格介于OpenAI最新GPT-5.1与Anthropic旧版Opus 4.1之间,虽然仍高于Gemini 3 Pro的定价,但显示出领先AI实验室不仅比拼技术能力,更注重推动前沿智能技术实现规模化部署的经济可行性。
技术架构持续创新
与Sonnet和GPT-5类似,Claude Opus 4.5采用“混合推理”架构,单个模型同时支持直接推理和思维链处理。它支持20万token的上下文窗口,可输出最多6.4万token。模型知识截止日期为2025年3月,略晚于Sonnet的1月截止期。
开发者实测验证性能
开发者Simon Willison在周末对Opus 4.5进行了深度测试,用它重构了自己的某个项目。该模型处理了39个文件的20次提交,新增2022行代码,删除1173行。尽管他承认新模型确实优于Sonnet 4.5,但实际使用中并未感受到显著的能力差异。另一位开发者Theo Browne则在视频评测中盛赞这是“有史以来最优秀的编程模型”。
行业竞争日趋白热化
谷歌Gemini 3 Pro近期以1501的LMArena得分引发关注, Salesforce首席执行官甚至宣布将弃用ChatGPT转投谷歌模型。与此同时,微软和英伟达上周宣布对Anthropic进行数十亿美元投资,使这家初创公司估值达到约3500亿美元。这些合作包括扩展Azure集成服务,以及配备英伟达基础设施用于Claude模型的训练和部署。
Opus 4.5已通过Anthropic API、AWS Bedrock、Google Vertex AI及Claude网页与桌面应用程序立即开放使用。

交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
新闻
文章
大V快讯
财经日历
专题
ETF追踪
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
索拉纳ETF
大额转账
链上异动
比特币回报率
稳定币市值
合约计算器
期权分析
账号安全
资讯收藏
自选币种
我的关注