人人都能玩转的声音克隆神器:clone-voice
又为大家找到一款 AI 声音克隆工具,它是一个 Web 版的声音克隆平台,名为“clone-voice”。
可以使用任何人类音色,把一段文字合成为运用该音色说话的声音,也可以将一个声音借助该音色转换为另一个声音。 这款基于 Web 界面的声音克隆工具,能够让你无需进行繁琐的配置,便能轻松地感受语音转换带来的乐趣。
项目介绍
“clone-voice”是一款基于 CoquiAI 技术得以实现的声音克隆工具。它可以依据你的声音样本或者其他任何声音样本,生成与样本声音极为相似的新声音。
“clone-voice”支持中文、英文、日文、韩文、法文、德文、意大利文等 16 种语言,能够在线从麦克风录制声音。
为确保合成效果良好,建议录制时长在 5 秒到 20 秒之间,发音要清晰准确,尽量不要有背景噪声。
主要功能
- • 声音克隆:根据声音样本或文字,生成与你声音高度相似的新声音。
- • 语调调整:可以调整语调、语速等参数,使生成的声音更加自然。
- • 个性化定制:可以根据用户需求,定制不同的声音风格,例如男性、女性、儿童等。
- • 多语言支持:支持 16 种语言,包括中文、英文、日语、韩语等。
- • 在线录音:通过麦克风直接录制声音,并以此为样本进行克隆。
- • 易于使用的 Web 界面:无需安装复杂的软件,鼠标点几下即可完成操作。
- • 无硬件门槛:不需要强大的 GPU 配置,即便没有显卡也能正常运行。
技术亮点
基于 Coqui AI 的 TTS 模型
clone-voice 使用领先的 Coqui AI TTS 模型,提供高质量的语音克隆与转换效果。
快速使用
预编译版
作者提供了 Windows 预编译版,下载预编译版本后,双击 app.exe
打开一个web界面,鼠标点点就能用。
本地部署
下载源码包,支持Linux、Mac、Windows等操作系统,需要自行编译安装。
源码版需要在 .env 中 HTTP_PROXY=设置代理,否则无法下载到模型文件。
写在最后
无论是出于工作需求,还是进行娱乐创作,“clone-voice” 都能够为你带来强大又便捷的声音克隆以及语音转换功能。它具备 16 种语言支持,使用体验门槛低。
但是与其他主流开源声音克隆模型相比,该工具确实存在一些欠缺之处。不过,应付常用场景还是足够的。
GitHub 项目地址:https://github.com/jianchang512/clone-voice
我用夸克网盘分享了「clone-voice」,点击链接即可保存。打开「夸克APP」,无需下载在线播放视频,畅享原画5倍速,支持电视投屏。
链接:https://pan.quark.cn/s/fe7e61b224c4
「clone-voice」来自UC网盘分享
https://drive.uc.cn/s/914fbd592a544?public=1