全部标签

音频模型

播客神器：微软开源 VibeVoice-1.5B 音频模型，支持中文、可生成 90 分钟 4 人聊天语音

8 月 27 日消息，科技媒体 marktechpost 于 8 月 25 日发布博文，报道称微软发布开源文本转语音（TTS）模型 VibeVoice-1.5B，可一次生成最长 90 分钟、最多 4 位不同说话者的自然语音，并支持跨语言及歌声合成。在架构方面，VibeVoice-1.5B 基于 1.5B 参数的 Qwen2.5 语言模型，结合声学（Acoustic）与语义（Semantic）双分…
资讯
- 3.6k
25年8月27日
速度最快：Stable Audio Open Small 端侧音频模型登场，手机上 8 秒内 AI生成 11 秒音频

5 月 15 日消息，科技媒体 TechCrunch 昨日（5 月 14 日）发布博文，报道称 AI 初创公司 Stability AI 推出 Stable Audio Open Small，号称是市场上速度最快的“立体声”音频生成 AI 模型，可在智能手机上运行。相比较 Suno 和 Udio 等其他 AI 音频应用，Stable Audio Open Small 无需依赖云端处理，其高效设计…
资讯
- 2.2k
25年5月15日

❯

搜索

幸运之星即将降临……

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠

_￥_優惠

使用時效：无法使用

使用時效：
之前

使用時效：预期有效

优惠编号：
×

限制以下商品使用：限制以下商品分类用途：不限制使用：

[{{ct.name}}]

所有商品及商品类型需求使用

没有优惠可用！

购物车

×

德

空空如也！

清空貨櫃前往

您的有新私信

没有新私信

写新私信查看全部