Voicebox开源：本地克隆声音，给Claude Code配音，支持情绪标签-尧图网站设计

ElevenLabs 的声音克隆效果不错但每月几十刀加上音频数据要上传到他们服务器——这两道坎不小。Voicebox 是开源平替28000 Star核心是本地优先。几秒钟参考音频就能生成声音模型覆盖23种语言。内置7个TTS引擎各有侧重Chatterbox Turbo 支持 [laugh]、[sigh] 这类情绪标签让生成语音带真实情绪Qwen3-TTS 擅长多语言克隆还能听懂「慢一点说」「用耳语」这种自然语言指令没有显卡的可以选 Kokoro82M模型CPU就能跑。接入 Claude Code 只需一行claude mcp add voicebox --transport http --url http://127.0.0.1:17493/mcp接上之后Claude Code 能用你克隆的声音说「测试通过可以合并」。还能给不同 Agent 绑定不同声音听声音就能分辨是哪个 Agent 在汇报。还有一个「人格化」功能给声音绑一段人设描述比如「毒舌的代码审查官」之后所有输出文本都会先按人设改写再合成语音。说话风格也是你定的。macOS 和 Windows 都有安装包苹果 M 芯片上速度比通用方案快不少NVIDIA 显卡自动走 CUDA。缺点是 Qwen3-TTS 模型文件有几个 G首次下载得等。项目地址https://pan.quark.cn/s/6f22fd03bfd1GitHub 项目地址https://github.com/jamiepine/voicebox

Voicebox开源：本地克隆声音，给Claude Code配音，支持情绪标签

相关新闻

革命性Aspect-Based情感分析工具：deberta-v3-base-absa-v1.1模型全方位解析

ColBERTv1.9模型训练完全指南：如何定制化你的检索模型

别再只用Adam了！PyTorch中RMSProp优化器调参实战（附代码对比SGD）

AI工具如何3天重构薪酬体系：从数据孤岛到实时动态调薪的12步落地清单

实战指南：基于快马ai快速开发can总线监控与诊断上位机软件

AI驱动的智能培训体系构建全路径（2024唯一经工信部认证的整合框架）

调岗准确率从61%跃升至94.7%的关键转折点，你还在用Excel人工匹配？

实战指南：基于快马平台将Blueprint手工网站设计稿一键部署上线

基于Arduino的自动折纸机器人：机电一体化综合实践项目详解

MATLAB多用户MIMO下行预编码实现：块对角化干扰抑制方案

暗黑破坏神2终极优化指南：d2dx宽屏补丁让经典游戏焕发新生

深圳弱电箱生产厂家怎么选？采购前建议了解这几点

【英语学习笔记】基于“底层逻辑转换”与“去动词化”的英汉互译核心方法论及写作高分公式

终极视频下载解决方案：VideoDownloadHelper 完全指南

2026最新！AI论文写作工具测评：这几款知网都认可

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源