Stability AI 宣布了文本音乐生成模型 Audio Diffusion,允许任何人用简单的文本去生成音乐片段。Stability AI表示会在未来发布基于 Audio Diffusion 的开源模型和训练代码,允许你训练自己的音乐生成模型。Audio Diffusion 使用了音频库 AudioSparks 中超过 80 万首授权音乐训练,大约有 12 亿个参数,与🔊早发布的图像生成模型 Stable Diffusion 相当。Audio Diffusion 有免费和付费方案,免费版本允许每月生成 20 首🔊长 20 秒的音乐,付费版本提高到 500 首🔊长 90 秒。
https://stability.ai/research/stable-audio-efficient-timing-latent-diffusion