自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

OpenAI紧急推出GPT-5.4版本 "退出潮"风波中火速迭代

2026-03-06 03:59:09
收藏

OpenAI发布全新旗舰模型GPT-5.4

面对近日约250万用户通过取消订阅或在社交媒体传播抵制行动形成的舆论压力,OpenAI于周四紧急推出迄今最强模型GPT-5.4。此次发布距离前代GPT-5.3问世仅隔两日,正值公司面临公共关系危机之际。

争议背景与模型定位

此次风波源于OpenAI与美国国防部签署的合作协议。此前另一家人工智能公司因协议未明确禁止开发自主武器及大规模监控公民而公开退出合作,而OpenAI最终选择接受该合约。这使其首席执行官萨姆·奥特曼面临公众质疑——需解释公司宣称的安全底线与合约实际条款间的明显差距。

新款GPT-5.4将推理、编码与智能体能力整合于单一版本,其百万级上下文处理能力使用户能在单次会话中更自由地处理海量信息。官方数据显示,在涵盖44个职业知识工作的GDPval基准测试中,GPT-5.4在83.0%的比较中达到或超越行业专家水平(GPT-5.2为70.9%)。

性能突破与局限

计算机操作成为进步最显著领域:在通过截图与键鼠操作评估桌面操控能力的OSWorld-Verified测试中,GPT-5.4以75.0%成功率超越前代47.3%的表现,并突破72.4%的人类基准线。深度网络研究测试BrowseComp则较GPT-5.2提升17个百分点。

值得关注的是,多数基准测试直接将GPT-5.4与GPT-5.2对比,完全跳过GPT-5.3版本。对于已使用GPT-5.3的用户而言,实际体验提升可能低于图表数据。编程开发者需调整预期:SWE-Bench Pro测试显示,GPT-5.4(57.7%)较GPT-5.3-Codex(56.8%)的进步微乎其微。

技术特性与用户差异

新模型配备的中途引导功能允许用户在模型思考过程中调整方向,配合更高效的思维链设计,可大幅减少任务所需的token数量。"GPT-5.4是我们迄今最高效的推理模型,解决问题所需token数显著低于GPT-5.2。"OpenAI在声明中强调。这对通过API按token用量计费的开发者构成直接利好。

目前该模型正逐步推送,多数用户仍在使用仅支持即时回复的GPT-5.3。依赖深度思考功能的复杂任务用户则停留在GPT-5.2版本——这意味着最可能挑战模型极限的用户群体反而最后获得升级。

企业级应用优势

文档密集型工作企业成为最直接受益者。在内部电子表格建模测试中,GPT-5.4取得87.3%的评分(GPT-5.2为68.4%)。法律研究机构报告其专业评估达91%准确率,而某运行于三万个财产税门户的智能体系统则实现95%首次尝试成功率,会话速度提升约3倍的同时减少70%token消耗。

此类效率提升虽能打动企业采购团队,但对正在权衡是否保留账户的个人用户而言,技术参数优势尚需转化为更直观的体验革新。

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻