本地免费部署，B站的这款语音开源大模型确实不错-尧图网站设计

5秒克隆你的声音B站开源IndexTTS2语音合成迎来“情感可控”新时代小伙伴们今天给大家分享一款B站开源文本转语音大模型IndexTTS2就在不久前哔哩哔哩Index团队正式开源了IndexTTS2语音合成模型这个曾经在B站内部被称为“配音神器”的项目一经开源就引爆了整个技术圈。它完美解决了传统语音合成的两大痛点——机械感明显和无法精准控制语速。现在你只需要5秒的音频样本就能让AI完美复刻任何人的声音甚至连说话时的情绪起伏、停顿节奏都能精确掌控。无论是想要为自己的视频配上情感饱满的旁白还是需要制作与画面完美同步的配音IndexTTS2都能轻松搞定。更令人惊喜的是这个曾经需要付费使用的工业级工具现在完全免费向所有人开放IndexTTS2是哔哩哔哩B站Index团队开源的新一代语音合成模型它在传统自回归模型优越的自然度基础上成功攻克了精准时长控制和丰富情感表达两大技术难题将零样本语音合成技术推向了新的高度。技术框架接下来我们就来看看如何进行本地部署本地部署拉取源码git clone https://github.com/index-tts/index-tts.gitcd index-tts # 下载大文件 git lfs pull #安装uv pip install -U uv #安装依赖 uv sync --all-extras 可选功能 --all-extras安装全部可选功能。可去除自定义。 --extra webui安装WebUI支持推荐。 --extra deepspeed安装DeepSpeed加速。可使用镜像 uv sync --all-extras --default-index https://mirrors.aliyun.com/pypi/simple uv sync --all-extras --default-index https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple 这里我们选择 uv sync --extra webui --default-index https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple uv sync --extra webui --default-index https://mirrors.aliyun.com/pypi/simple安装完成后下载模型uv tool install huggingface-hub[cli,hf_xet]hf download IndexTeam/IndexTTS-2 --local-dircheckpointsweb演示uv run webui.py --fp16项目首次运行会自动下载部分模型如下载缓慢可设置环境变量下载完成打开链接http://127.0.0.1:7860选择音色参考音频输入一段文字点击生成语音生成完成后可直接下载我们来听下效果tts效果,小妖同学学AI,29秒当然我们也可在python中直接调用具体见github相关说明小妖这边就不一一列举了。from indextts.infer_v2 import IndexTTS2 tts IndexTTS2(cfg_pathcheckpoints/config.yaml, model_dircheckpoints, use_fp16False, use_cuda_kernelFalse, use_deepspeedFalse) text Translate for me, what is a surprise! tts.infer(spk_audio_promptexamples/voice_01.wav, texttext, output_pathgen.wav, verboseTrue)PyTorch GPU 加速检测可运行脚本检测机器是否有GPU以及是否安装了GPU版本的PyTorch。如PyTorch版本不对可能使用CPU启动推理会非常慢uv run tools/gpu_check.py感兴趣的小伙们可以行动起来了。感谢大家的点赞和关注我们下期见

本地免费部署，B站的这款语音开源大模型确实不错

相关新闻

一天一个开源项目（第54篇）：Supabase - 开源的 Postgres 开发平台，Firebase 替代方案

程序员必看：大模型参数高效微调(PEFT)全攻略，建议收藏

从0到1！我靠AI大模型应用开发成功转行，这份保姆级学习路线免费送！

5步打造终极ATX电源：让废弃服务器电源重获新生

如何用Translumo实现游戏屏幕实时翻译：5分钟快速上手指南

深度解析futurerestore：iOS设备固件降级与恢复的终极指南

Zed编辑器完全指南：3个核心功能让你告别传统开发工具

Nginx安全响应头配置实战：从原理到加固，彻底解决Web安全漏洞

stm32读取维特陀螺仪jy61p角度

中文大模型选型不是比参数，而是做工程化决策

React Server Components安全漏洞CVE-2025-55182深度剖析与防御实践

用C#编写语音自动朗读机器人

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

YOLO目标检测实战：从环境搭建到模型部署的保姆级教程

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

国产DSP FT-M6678 DDR3配置避坑指南：从PLL时钟到PHY寄存器，手把手调通你的第一块板

Coze与Dify对比指南：低代码AI应用开发从入门到实战