Skip to content

Latest commit

 

History

History
97 lines (69 loc) · 2.22 KB

File metadata and controls

97 lines (69 loc) · 2.22 KB

Video Parser Skill

B站/抖音视频字幕解析工具,支持视频搜索、字幕提取和时间戳定位。

功能

  • B站视频搜索 - 通过关键词搜索B站视频,获取视频信息
  • B站字幕提取 - 支持硬字幕和AI字幕(含时间戳)
  • 抖音视频下载 - 下载抖音视频并通过ASR转写
  • 时间戳定位 - 提取精确时间戳便于快速定位

目录结构

video-parser-skill/
├── SKILL.md              # 完整使用文档
├── requirements.txt      # Python依赖
├── scripts/
│   ├── search_bilibili.py  # B站视频搜索脚本
│   ├── parser.py           # B站字幕解析
│   └── dy_parser.py        # 抖音解析(需ffmpeg)
└── references/           # 参考资料

快速开始

1. 搜索B站视频

python scripts/search_bilibili.py "关键词" [页码] [数量] [最早日期]

示例:

# 搜索"Python教程",返回10个结果
python scripts/search_bilibili.py "Python教程"

# 搜索第2页,最多20个,最早不早于2024年
python scripts/search_bilibili.py "Python教程" 2 20 2024-01-01

2. 解析B站视频字幕

python scripts/parser.py <BV号或链接>

示例:

python scripts/parser.py BV1xx411c7mD
python scripts/parser.py https://www.bilibili.com/video/BV1xx411c7mD

3. 解析抖音视频

需要先配置火山引擎凭证,创建 VIDEO_PARSER_CONFIG.md

# 火山引擎ASR配置
VOLC_ACCESS_KEY=your_access_key
VOLC_SECRET_KEY=your_secret_key

然后运行:

python scripts/dy_parser.py <抖音链接>

配置

首次使用需要配置:

  1. B站配置:创建 VIDEO_PARSER_CONFIG.md,填入B站SESSDATA cookie
  2. 抖音配置:配置火山引擎ASR服务的Access Key和Secret Key

⚠️ 注意:VIDEO_PARSER_CONFIG.md 包含敏感凭证,不要提交到版本控制!

依赖

  • Python 3.8+
  • requests >= 2.28.0
  • ffmpeg(抖音视频解析需要)

安装依赖:

pip install -r requirements.txt

技术细节

  • B站字幕通过官方API获取
  • 抖音使用火山引擎ASR服务进行语音转文字
  • 支持多种字幕格式导出

License

MIT License