阿里开源语音模型,深度融合文本理解和语音生成的新一代生成式语音合成大模型,CosyVoice即可生成模拟音色,甚至包括韵律、情感等细节,包括跨语种语音生成。功能众多,感兴趣的朋友快来本站下载体验 。
使用说明
1、选择推理模式
2、点击骰子按钮(可选),可以改变说话人的语调和韵律
3、按照提示步骤进行操作
稍微等待一下,程序就处理完毕了,可以在页面底部的输出音频界面播放和下载合成后的语音
注意事项
①项目安装路径不要包含中文
②推荐使用GTX1060以上显卡运行此项目
③使用过程中若不慎关闭软件后台,请重新打开,并刷新网页
1、新增手动选择参考音频列表
将需要克隆的参考音频拷贝到软件根目录下的 “参考音频” 文件夹,并将文件名改名为音频说话内容,如下图
点击“刷新参考音频”即可。
2、自定义音色保存
克隆音色生成后,在下方输入音色名称,保存即可。如上图。
比如我们将克隆后的“大幂幂”的音色保存下来,这里输入 大幂幂
保存后,点这里的“刷新新增音色”
即可在新增音色里找到我们刚才克隆的“大幂幂”的音色
后期需要使用这个音色生成音频,就直接在这里选择“大幂幂”即可。
12.40MB/2025-09-26
69KB/2025-09-26
42MB/2025-09-26
26.10MB/2025-09-26
2.29MB/2025-09-26
67.69MB/2025-09-26
44.73MB/2025-09-26
84.90MB/2025-09-26
6.03MB/2025-09-26
10.09MB/2025-09-26
41.80MB/2025-05-30
4.34MB/2025-06-24
3.10MB/2025-09-13
3.30MB/2025-01-18
15.30MB/2025-03-14
4.20MB/2025-07-30
3.15MB/2025-09-13
34.69MB/2025-09-25
28.19MB/2024-07-18
18.77MB/2025-04-02