Stable Audio Open

开源文本生成高质量短音频工具

13 浏览

2026年4月25日

Stable Audio Open介绍

Stable Audio Open 是一个开源免费的文本到音频生成工具，专注于快速生成高质量短音频样本，支持最长47秒、44.1kHz采样率的高保真输出。用户只需输入简洁描述（如“雨林鸟鸣”或“电子鼓节奏”），即可生成鼓点、乐器即兴、环境音效、拟音录音等多样化声音素材；它还支持对已有音频进行风格转换、批量生成同一提示下的多种变体，并允许开发者上传自有音频数据集进行模型微调。模型基于Stability AI技术训练，数据源自FreeSound等合法开放平台，可本地部署于Hugging Face，搭配ComfyUI插件轻松融入专业音视频工作流。

Stable Audio Open网站截图

Stable Audio Open的主要功能

文本生成高质量短音频（最长47秒，44.1kHz）
支持音频风格转换与多变体生成
提供开源模型权重，支持本地部署与自定义微调

Stable Audio Open如何使用

1访问官网体验基础生成功能
2从Hugging Face下载模型权重并本地部署
3输入描述性文本，调整参数后生成并导出音频

Stable Audio Open的应用场景

音乐制作人快速获取鼓点、旋律片段或环境音效
游戏与影视开发者定制角色动作音效或场景氛围声
声音设计师制作拟音效果（如脚步声、水流声）用于教学或后期

Stable Audio Open

Stable Audio Open介绍

Stable Audio Open网站截图

Stable Audio Open的主要功能

Stable Audio Open如何使用

Stable Audio Open的应用场景

标签

相关推荐

热门工具

最新收录

精选工具