-
播客神器:微软开源 VibeVoice-1.5B 音频模型,支持中文、可生成 90 分钟 4 人聊天语音
8 月 27 日消息,科技媒体 marktechpost 于 8 月 25 日发布博文,报道称微软发布开源文本转语音(TTS)模型 VibeVoice-1.5B,可一次生成最长 90 分钟、最多 4 位不同说话者的自然语音,并支持跨语言及歌声合成。 在架构方面,VibeVoice-1.5B 基于 1.5B 参数的 Qwen2.5 语言模型,结合声学(Acoustic)与语义(Semantic)双分…- 1.2k
-
速度最快:Stable Audio Open Small 端侧音频模型登场,手机上 8 秒内 AI生成 11 秒音频
5 月 15 日消息,科技媒体 TechCrunch 昨日(5 月 14 日)发布博文,报道称 AI 初创公司 Stability AI 推出 Stable Audio Open Small,号称是市场上速度最快的“立体声”音频生成 AI 模型,可在智能手机上运行。 相比较 Suno 和 Udio 等其他 AI 音频应用,Stable Audio Open Small 无需依赖云端处理,其高效设计…- 977
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!

