核心亮点
合同修订促成战略转型
精简开发团队创造超常成果
微软发布了三款专有AI模型:MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2,现已可通过Microsoft Foundry访问。
MAI-Transcribe-1在25种语言上实现了卓越的准确率,在基准测试中超越了OpenAI的Whisper和Google Gemini Flash。
2025年末重新谈判达成的OpenAI协议,现允许微软独立开发前沿AI模型。
每个模型均由不到10名工程师的开发团队构建,所使用的GPU资源比竞争对手减少约50%。
微软AI首席执行官穆斯塔法·苏莱曼宣布有意创建一个前沿大型语言模型,以追求完全的AI自主权。
周三,微软在AI竞赛中执行了迄今为止最大胆的举措,发布了三款专有模型,将这家科技巨头定位为OpenAI、谷歌以及新兴AI公司的直接竞争对手。
新发布的三款模型——MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2——现在可以通过Microsoft Foundry和一个专用的MAI Playground进行访问。这些工具涵盖了语音识别、语音合成和视觉内容生成。微软AI首席执行官穆斯塔法·苏莱曼将此次发布形容为他仅六个月前成立的“超智能团队”的首个产品。
微软股价经历了自2008年以来最困难的季度,年初至今下跌约17%。此次模型发布标志着苏莱曼首次公开回应股东对巨额AI投资获得实质性回报的要求。
MAI-Transcribe-1是旗舰产品。它在FLEURS基准测试中,针对微软产品使用的25种主要语言,实现了最低的平均词错率,平均值为3.8%。公司宣称其在全部25种语言上均超越了OpenAI的Whisper-large-v3,并在25种语言中的22种上超越了Google的Gemini 3.1 Flash。该系统可处理高达200MB的MP3、WAV和FLAC文件,其批处理速度比当前的Azure解决方案快2.5倍。该模型已在Teams和Copilot Voice中开始测试。
MAI-Voice-1仅需一秒钟即可生成60秒逼真的音频输出,并能仅凭数秒的简短音频样本生成自定义语音。定价定为每百万字符22美元。MAI-Image-2在Arena.ai排行榜上位列前三,并正在整合到Bing和PowerPoint中,定价为每百万输入标记5美元,每百万图像输出标记33美元。WPP已成为早期大规模采用该技术的企业客户。
合同修订促成战略转型
此次产品发布在十二个月前不可能发生。截至2025年10月,根据其2019年与OpenAI的原始协议,微软面临合同限制,无法独立开发通用人工智能。
当OpenAI寻求除微软以外的额外计算资源——与软银等公司建立合作伙伴关系时,微软启动了合同重新谈判。更新后的协议允许微软开发专有的前沿模型,同时保留对OpenAI发展成果的许可权直至2032年。
苏莱曼向VentureBeat解释道:“去年九月,我们重新谈判了与OpenAI的合同,这使我们能够独立追求我们自己的超智能。”他强调与OpenAI的合作伙伴关系将持续到至少2032年。
精简开发团队创造超常成果
此次公告中最引人注目的披露之一是:每个模型均由不到10名工程师的开发团队创建。苏莱曼表示,音频模型团队由10人组成,性能提升来源于架构选择和数据整理,而非团队规模扩张。
“同样,我们的图像团队也不到10人,”他指出。这种方法与当前行业普遍做法形成鲜明对比,据称像Meta这样的组织为个别研究人员提供的薪酬方案高达1亿至2亿美元。
微软强调其有意制定具有竞争力的定价——旨在低于亚马逊和谷歌。苏莱曼称之为“所有超大规模提供商中最便宜的”。该组织已经在规划未来12至18个月内前沿规模的GPU集群部署。
苏莱曼证实,大型语言模型已出现在发展路线图上,并表示微软的目标是变得“完全独立”,同时交付“所有模态上的尖端模型”。


交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
去中心化交易所
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
ETF追踪
索拉纳ETF
瑞波币ETF
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
大额转账
链上异动
比特币回报率
稳定币市值
期权分析
新闻
文章
财经日历
专题
钱包
合约计算器
账号安全
资讯收藏
自选币种
我的关注