2025 / 本地效率工具

视频转字幕与批处理工具

用于把本地视频批量转成字幕文件,支持提取音频、识别文本、生成 SRT 和整理输出目录。

视频转字幕与批处理工具

技术栈

Python / Whisper / FFmpeg / CUDA / SRT / 批处理脚本

项目说明

项目背景

做视频资料整理时,经常需要把口播内容转成字幕。如果一个个手动处理会很慢,所以写了一个本地批处理工具。

功能模块

  • 扫描目录中的 mp4、mkv、mov 文件
  • 使用 FFmpeg 提取音频
  • 调用 Whisper 识别文字和时间轴
  • 生成 SRT 字幕文件
  • 记录成功、失败和耗时日志

处理流程

视频目录 -> 提取音频 -> Whisper 识别 -> 生成字幕 -> 输出日志

代码片段

from pathlib import Path

def collect_videos(folder: str):
    exts = {".mp4", ".mkv", ".mov"}
    return [p for p in Path(folder).rglob("*") if p.suffix.lower() in exts]

for video in collect_videos("videos"):
    print("processing", video.name)
    # extract_audio(video)
    # transcribe_to_srt(video)

收获

这个项目不算大型系统,但很能体现 Python 做自动化工具的价值:把重复操作变成脚本,再慢慢补配置、日志和异常处理。