• 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

小米开源支持646种语言的语音克隆TTS模型'OmniVoice'

2026-05-07 18:41:23
收藏

小米AI实验室开源多语言语音克隆TTS模型OmniVoice

该模型支持646种语言,采用极简单向与双向变换器架构。据相关报道,其在中文和英文环境中的合成质量与推理速度均优于现有模型。

训练数据与性能表现

OmniVoice基于约58万小时规模的50个开源数据集训练而成,并采用动态上采样策略以增强低资源语言的支持能力。在24种及102种语言的测试中,其语音相似度与清晰度均超越多个商用系统,部分指标接近甚至超过真实语音水平。

核心功能与应用

该模型支持跨语言语音克隆、用户自定义音色、带噪声参考音频适配、细粒度语言控制及发音校正等功能。其训练代码、推理代码与模型权重已在多个开源平台公开提供。

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻
自选
我的自选
查看全部
市值 价格 24h%