据 TechCrunch 报道,9 月 13 日,Stability AI 宣布推出人工智能音乐生成器 Stable Audio。Stable 声称这是首款能够通过一种名为潜扩散的技术,为商业用途创建“高品质”44.1 kHz 音乐的工具。通过对音频元数据以及音频文件的时长和开始时间进行训练,Stability 公司表示,与之前发布的生成式音乐工具相比,Audio Diffusion 的底层模型大约有 12 亿个参数,可以对合成音频的内容和时长进行更好的控制。
一年前,Stability AI 悄然发布 Dance Diffusion,但随后 Stability 公司资助创建模型的研究机构 Harmonai 停止了对 Dance Diffusion 的更新。如今推出的 Stable Audio 并不是由 Harmonai 单独开发的。Stability 的音频团队于四月份正式成立,他们受 Dance Diffusion 的启发创建了一个新模型,作为 Stable Audio 的基础,然后由 Harmonai 对其进行训练。
目前,Stable Audio 只能通过网络应用程序使用。Stability 也没有宣布以开源方式发布 Stable Audio 背后模型的计划。
原文链接