Stability AI加入音频赛道,联手Arm推出最快手机端免云模型

Stability AI与Arm合作推出Stable Audio Open Small音频生成模型,可在手机端离线运行,8秒内生成11秒音频,是目前最快的音频生成模型;该模型拥有3.41亿参数,专为生成短音频和音效设计,训练数据来自免版权的Free Music Archive和Freesound,但仅支持英文提示;模型对年收入低于100万美元的用户免费开放,但有一定局限性,如无法生成逼真人声和高质量歌曲,且在不同音乐类型表现不均衡。

搜索