本地免费部署,B站的这款语音开源大模型确实不错

发布时间:2026/5/22 0:17:48

本地免费部署,B站的这款语音开源大模型确实不错 5秒克隆你的声音B站开源IndexTTS2语音合成迎来“情感可控”新时代小伙伴们今天给大家分享一款B站开源文本转语音大模型IndexTTS2就在不久前哔哩哔哩Index团队正式开源了IndexTTS2语音合成模型这个曾经在B站内部被称为“配音神器”的项目一经开源就引爆了整个技术圈。它完美解决了传统语音合成的两大痛点——机械感明显和无法精准控制语速。现在你只需要5秒的音频样本就能让AI完美复刻任何人的声音甚至连说话时的情绪起伏、停顿节奏都能精确掌控。无论是想要为自己的视频配上情感饱满的旁白还是需要制作与画面完美同步的配音IndexTTS2都能轻松搞定。更令人惊喜的是这个曾经需要付费使用的工业级工具现在完全免费向所有人开放IndexTTS2是哔哩哔哩B站Index团队开源的新一代语音合成模型它在传统自回归模型优越的自然度基础上成功攻克了精准时长控制和丰富情感表达两大技术难题将零样本语音合成技术推向了新的高度。技术框架接下来我们就来看看如何进行本地部署本地部署拉取源码git clone https://github.com/index-tts/index-tts.gitcd index-tts # 下载大文件 git lfs pull #安装uv pip install -U uv #安装依赖 uv sync --all-extras 可选功能 --all-extras安装全部可选功能。可去除自定义。 --extra webui安装WebUI支持推荐。 --extra deepspeed安装DeepSpeed加速。 可使用镜像 uv sync --all-extras --default-index https://mirrors.aliyun.com/pypi/simple uv sync --all-extras --default-index https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple 这里我们选择 uv sync --extra webui --default-index https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple uv sync --extra webui --default-index https://mirrors.aliyun.com/pypi/simple安装完成后下载模型uv tool install huggingface-hub[cli,hf_xet]hf download IndexTeam/IndexTTS-2 --local-dircheckpointsweb演示uv run webui.py --fp16项目首次运行会自动下载部分模型如下载缓慢可设置环境变量下载完成打开链接http://127.0.0.1:7860选择音色参考音频输入一段文字点击生成语音生成完成后可直接下载我们来听下效果tts效果,小妖同学学AI,29秒当然我们也可在python中直接调用具体见github相关说明小妖这边就不一一列举了。from indextts.infer_v2 import IndexTTS2 tts IndexTTS2(cfg_pathcheckpoints/config.yaml, model_dircheckpoints, use_fp16False, use_cuda_kernelFalse, use_deepspeedFalse) text Translate for me, what is a surprise! tts.infer(spk_audio_promptexamples/voice_01.wav, texttext, output_pathgen.wav, verboseTrue)PyTorch GPU 加速检测可运行脚本检测机器是否有GPU以及是否安装了GPU版本的PyTorch。如PyTorch版本不对可能使用CPU启动推理会非常慢uv run tools/gpu_check.py感兴趣的小伙们可以行动起来了。感谢大家的点赞和关注我们下期见

相关新闻