MiniMax新一代语音模型Speech-02在Artificial Analysis榜单上超越OpenAI和ElevenLabs,在字错率和说话人相似度等指标上达到SOTA水平;Speech-02实现了真正的零样本语音克隆,并采用创新的Flow-VAE架构,只需几秒音频即可高度还原说话人音色、语调和节奏;该模型支持32种语言,可实现任意音色灵活控制和情感调节,成本仅为ElevenLabs竞品的1/4,标志着AI语音进入人格化时代。
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!
