B站视频一键转结构化文档,这个 Claude Code Skill 太香了

发布时间:2026/7/5 3:47:44

B站视频一键转结构化文档,这个 Claude Code Skill 太香了 再也不用1小时视频肝3小时笔记了我有个习惯看到好的技术视频会做笔记。但常常一个 15 分钟的视频暂停、回退、打字愣是折腾 40 分钟。手酸眼酸不说还容易漏掉关键配置细节。上周刷到一个讲 SeaTunnel 的视频内容很扎实但字幕是碎片化的逐句文本直接复制过来乱成一团——时间戳、空行、断句满天飞根本没法用。于是写了一个 Claude Code 的 Skill叫bilibili-to-doc。效果出乎意料地好分享出来给有同样痛点的朋友。开源项目已开源在 GitHubMIT 协议随便用、随便改。 GitHub - programmerloverun/bilibili-to-doc: 哔哩哔哩视频转文档 | Claude Code Skill: 自动将B站视频AI字幕提取为结构化Markdown文档 · GitHub如果你觉得有用可以 Star 一下如果你有更好的想法比如支持多语言字幕、本地 Whisper 转写回退欢迎提 PR 一起完善。它做了什么拿这个 SeaTunnel 教程视频举例。输入一个 B 站链接Skill 会自动完成下载字幕— 通过 yt-dlp 拉取 B 站 AI 中文字幕清洗文本— 去掉时间戳、序号合并碎片句子结构化重组— AI 识别逻辑章节生成带目录、代码块、表格的 Markdown 文档输出到桌面— 一份可以直接用、可以搜、可以分享的文档输出的文档长这样# 【IT老齐772】ETL中间件 SeaTunnel 快速上手 ## 一、SeaTunnel 概述 ### 1.1 什么是 SeaTunnel SeaTunnel 是 Apache 孵化开源的 ETL 工具... ## 二、案例演示MySQL → Redis 准实时同步 ... ## 三、环境准备 ### 3.2 Docker Compose 编排 - 1 个主节点 2 个工作节点 MySQL Redis ## 四、任务配置HOCON 格式 hocon { source { MySQL-CDC { ... } } transform { Sql { ... } } sink { Redis { ... } } }第一步复制视频链接【【IT老齐772】ETL中间件SeaTunnel快速上手】https://www.bilibili.com/video/BV1v5TuzJE4v?vd_source86ceab86ae8b5c68f25b7b17bc8c83d5第二步在 Claude Code 里丢链接打开终端进入 Claude Code直接说人话不需要记命令不用传参数。第三步看看实际发生了什么Claude Code 收到指令后Skill 自动触发你会看到它在终端里一步步执行① 下载 AI 字幕约 2 秒$ yt-dlp --cookies-from-browser chrome \ https://www.bilibili.com/video/BV1v5TuzJE4v \ --write-subs --sub-lang ai-zh --skip-download \ -o /tmp/bilibili_output终端输出[BiliBili] Extracting URL: https://www.bilibili.com/video/BV1v5TuzJE4v [BiliBili] BV1v5TuzJE4v: Extracting subtitle info Extracting cookies from chrome [info] Writing video subtitles to: /tmp/bilibili_output.ai-zh.srt ✅拿到了标题【IT老齐772】ETL中间件SeaTunnel快速上手】② 解析 SRT 字幕约 1 秒这个 16 分钟的视频B 站 AI 字幕切成了 409 条片段。原始字幕长这样——时间戳叠时间戳根本没法读409 00:16:51,960 -- 00:16:54,480 今天呢咱们就做一个抛砖引玉Skill 内部用脚本先做一次清洗去掉序号、去掉时间戳、合并相邻碎片句。③ AI 重组内容约 10 秒这一步是核心。AI 通读完 409 条字幕的全部内容后识别出视频的逻辑结构6 个自然章节概述 → 案例 → 环境 → 配置 → 验证 → 总结2 处配置代码HOCON 任务配置 Docker 架构4 处适合用表格表达的内容组件角色、API 接口、模式对比、验证步骤多处需要提炼的关键概念streaming vs batch、checkpoint、MySQL-CDC 原理然后把碎片化的口语重新组织成书面表达。④ 写入桌面瞬间完成✅ /Users/leo/Desktop/【IT老齐772】ETL中间件SeaTunnel快速上手.md第四步打开看看成品双击打开桌面上的 md 文件你会看到一份这样的文档有目录层级— 一级标题 → 二级标题 → 三级要点有对比表格— 组件角色表、API 表、模式对比表、验证步骤表有代码块— HOCON 配置带注释可以直接复制改参数️有关键概念提炼— binlog 监听、CDC 连接器、数据流转方向有免责声明— 标注了AI 从字幕生成提醒结合原视频Before原始 srt 字幕vs After结构化文档对比原始字幕结构化文档格式时间戳 碎片句子章节标题 段落 代码块可读性需要逐句阅读可快速扫读定位检索无法搜索全文可 CtrlF分享无法直接分享可直接发博客/笔记代码口语描述参数完整 HOCON 配置代码块整个过程不到 20 秒你只做了一件事——贴了个链接。什么视频适合转适合不太适合技术教程、编程实战纯娱乐、Vlog架构讲解、方案对比音乐、舞蹈工具上手、操作演示纯画面内容无解说知识科普、行业分析直播回放互动太多核心要求就一个视频有 B 站 AI 字幕。目前大部分中文视频 B 站都会自动生成覆盖率很高。原理其实很简单整个流程四步拆开看都很朴实B站链接 │ ├─ yt-dlp 浏览器 Cookies → 下载 AI 字幕 (.srt) ├─ Python 解析 → 清洗时间戳和编号 ├─ AI 重组 → 识别章节 生成代码块/表格 └─ 写入桌面 → {标题}.md核心工作靠的是 Claude Code 的 Skill 机制——它把用 yt-dlp 下载字幕 → 读文件 → 让 AI 整理 → 写文件这个固定流程封装成可复用的技能每次触发的行为一致不会漏步骤也不会走样。最后作为程序员我们天然对自动化重复劳动有执念。把视频笔记这种机械操作交给工具省下的时间拿去真正写代码、看文档、或者干脆摸鱼——不香吗如果有任何问题或建议欢迎在 GitHub Issues 留言。

相关新闻