小米AI实验室开源多语言语音克隆TTS模型OmniVoice
该模型支持646种语言,采用极简单向与双向变换器架构。据相关报道,其在中文和英文环境中的合成质量与推理速度均优于现有模型。
训练数据与性能表现
OmniVoice基于约58万小时规模的50个开源数据集训练而成,并采用动态上采样策略以增强低资源语言的支持能力。在24种及102种语言的测试中,其语音相似度与清晰度均超越多个商用系统,部分指标接近甚至超过真实语音水平。
核心功能与应用
该模型支持跨语言语音克隆、用户自定义音色、带噪声参考音频适配、细粒度语言控制及发音校正等功能。其训练代码、推理代码与模型权重已在多个开源平台公开提供。

交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
去中心化交易所
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
ETF追踪
索拉纳ETF
瑞波币ETF
香港ETF
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
大额转账
链上异动
比特币回报率
稳定币市值
期权分析
新闻
文章
财经日历
专题
钱包
合约计算器
账号安全
资讯收藏
自选币种
我的关注