2025 / 本地效率工具
视频转字幕与批处理工具
用于把本地视频批量转成字幕文件,支持提取音频、识别文本、生成 SRT 和整理输出目录。
技术栈
Python / Whisper / FFmpeg / CUDA / SRT / 批处理脚本
项目说明
项目背景
做视频资料整理时,经常需要把口播内容转成字幕。如果一个个手动处理会很慢,所以写了一个本地批处理工具。
功能模块
- 扫描目录中的 mp4、mkv、mov 文件
- 使用 FFmpeg 提取音频
- 调用 Whisper 识别文字和时间轴
- 生成 SRT 字幕文件
- 记录成功、失败和耗时日志
处理流程
视频目录 -> 提取音频 -> Whisper 识别 -> 生成字幕 -> 输出日志
代码片段
from pathlib import Path
def collect_videos(folder: str):
exts = {".mp4", ".mkv", ".mov"}
return [p for p in Path(folder).rglob("*") if p.suffix.lower() in exts]
for video in collect_videos("videos"):
print("processing", video.name)
# extract_audio(video)
# transcribe_to_srt(video)
收获
这个项目不算大型系统,但很能体现 Python 做自动化工具的价值:把重复操作变成脚本,再慢慢补配置、日志和异常处理。