人人都能玩转的声音克隆神器：clone-voice

又为大家找到一款 AI 声音克隆工具，它是一个 Web 版的声音克隆平台，名为“clone-voice”。

可以使用任何人类音色，把一段文字合成为运用该音色说话的声音，也可以将一个声音借助该音色转换为另一个声音。这款基于 Web 界面的声音克隆工具，能够让你无需进行繁琐的配置，便能轻松地感受语音转换带来的乐趣。

项目介绍

“clone-voice”是一款基于 CoquiAI 技术得以实现的声音克隆工具。它可以依据你的声音样本或者其他任何声音样本，生成与样本声音极为相似的新声音。

“clone-voice”支持中文、英文、日文、韩文、法文、德文、意大利文等 16 种语言，能够在线从麦克风录制声音。

为确保合成效果良好，建议录制时长在 5 秒到 20 秒之间，发音要清晰准确，尽量不要有背景噪声。

主要功能

• 声音克隆：根据声音样本或文字，生成与你声音高度相似的新声音。
• 语调调整：可以调整语调、语速等参数，使生成的声音更加自然。
• 个性化定制：可以根据用户需求，定制不同的声音风格，例如男性、女性、儿童等。
• 多语言支持：支持 16 种语言，包括中文、英文、日语、韩语等。
• 在线录音：通过麦克风直接录制声音，并以此为样本进行克隆。
• 易于使用的 Web 界面：无需安装复杂的软件，鼠标点几下即可完成操作。
• 无硬件门槛：不需要强大的 GPU 配置，即便没有显卡也能正常运行。

技术亮点

基于 Coqui AI 的 TTS 模型

clone-voice 使用领先的 Coqui AI TTS 模型，提供高质量的语音克隆与转换效果。

快速使用

预编译版

作者提供了 Windows 预编译版，下载预编译版本后，双击 app.exe 打开一个web界面，鼠标点点就能用。

本地部署

下载源码包，支持Linux、Mac、Windows等操作系统，需要自行编译安装。

源码版需要在 .env 中 HTTP_PROXY=设置代理，否则无法下载到模型文件。

写在最后

无论是出于工作需求，还是进行娱乐创作，“clone-voice” 都能够为你带来强大又便捷的声音克隆以及语音转换功能。它具备 16 种语言支持，使用体验门槛低。
但是与其他主流开源声音克隆模型相比，该工具确实存在一些欠缺之处。不过，应付常用场景还是足够的。
GitHub 项目地址：https://github.com/jianchang512/clone-voice

我用夸克网盘分享了「clone-voice」，点击链接即可保存。打开「夸克APP」，无需下载在线播放视频，畅享原画5倍速，支持电视投屏。
链接：https://pan.quark.cn/s/fe7e61b224c4

「clone-voice」来自UC网盘分享
https://drive.uc.cn/s/914fbd592a544?public=1