AI 工具
视频转字幕 CUDA 工具
基于 Whisper 思路做的视频转字幕工具,用来把 mp4 提取成 srt 字幕文件,偏本地效率工具。
技术栈
Python / Whisper / CUDA / SRT 字幕 / 本地工具
项目说明
项目截图
项目背景
有些视频资料需要整理字幕,如果手动听写会非常慢。所以这个工具主要解决 mp4 转 srt 的效率问题,适合课程、录屏、访谈这类素材整理。页面里保留了本地视频路径、上传视频、哔哩哔哩链接三种入口,平时自己用本地路径最多,不需要先把视频传到别处。
技术猜测和实现
整体按 Python、Whisper、CUDA、本地文件处理来做。流程大概是读取视频、提取音频、调用模型识别,再把时间轴和文本整理成 srt 文件。界面里能选择模型、语言、设备、音频格式、输出格式和 B 站 Cookie,说明它不是单纯命令行脚本,而是把常用参数都放到了页面上。
我做的重点
本地运行流程、文件输入输出、CUDA 环境说明、字幕格式整理和异常情况处理。工具类项目不一定要页面很复杂,关键是能稳定处理文件,并且输出格式能直接使用。SRT 适合剪辑软件或播放器,TXT 适合后续整理笔记。
项目细节
这类工具最容易出问题的是路径、显卡环境和音频格式。比如本地路径里有中文或空格时要注意转义,CUDA 不可用时要能切换设备,长视频处理时也要给用户明确反馈。页面虽然简单,但这些选项能减少很多重复改命令的时间。
项目收获
这个项目让我更熟悉把 AI 模型能力放进日常工作流。它不是展示型项目,但实际很有用,也能说明我会把模型能力做成自己的效率工具。