Subtitle Edit:万能字幕编辑器
今天在听中岛美雪的演唱会时,发现视频里内置了字幕。相比我之前用 Whisper 转写出来的版本,原生字幕肯定要准确得多。于是我开始找工具,希望能把这些内嵌字幕提取出来。试了好几款之后,最终脱颖而出的是 —— Subtitle Edit。
Subtitle Edit 是一款功能强大的开源字幕编辑器,适用于字幕的提取、编辑、格式转换与翻译等多种场景。它支持多种视频与字幕格式,并内置 OCR 字符识别、语音转写、时间轴同步等实用功能。
你可以从其 GitHub 发布页 下载最新版本,支持 Windows 和部分 Linux 环境(通过 Mono)。
字幕提取
1. 打开视频文件
启动软件后,点击菜单栏的“文件”(File) -> “打开”(Open),选择你想提取字幕的视频文件。
2. 选择字幕轨道
如果视频中包含多个字幕轨道,Subtitle Edit 会弹出窗口供你选择需要提取的那一条。
3. (可选)进行 OCR 识别(适用于图像字幕)
若视频字幕为图像格式(如 DVD 的 VobSub 或蓝光的 PGS 字幕),软件会提示你进行“光学字符识别”(OCR)。此时建议选择 Paddle OCR 引擎,并根据字幕语言进行设置。点击「开始 OCR」后进行识别,完成后点击右侧的「确定」按钮。
🚀 小提示:对于中文、日文等非拉丁字符,Paddle OCR 的识别效果明显优于 Tesseract 等传统引擎;后者更适用于英文字幕。

4. 保存为所需格式
字幕提取后,你可以在主界面中查看字幕文本与对应的时间轴。点击“文件”(File) -> “另存为”(Save as),在保存类型中选择所需格式。
其他功能
除了基础的字幕提取功能,Subtitle Edit 还提供了丰富的扩展能力,适用于更复杂的字幕编辑与翻译需求。
语音转写
当视频中没有字幕轨道时,可以通过“工具”(Tools) -> “语音识别”(Audio to text)自动生成字幕。Subtitle Edit 支持多种识别引擎:
- Whisper(推荐,效果最优,支持多语言识别)
- Vosk(轻量级本地模型,适合资源受限环境)
用户可选择语言或启用自动识别,支持断点恢复、每句字幕自动分段等配置。
字幕翻译功能
在已有字幕的基础上,Subtitle Edit 支持一键翻译所有字幕内容,可通过“翻译”菜单调用主流翻译引擎,如:Google Translate、DeepL、Yandex 等。你还可以选择手动逐句翻译,适合需要逐句优化语序的场景。
如果你需要批量的字幕翻译体验或使用ai翻译字幕,可以使用我开源的 Subtitle Translator 工具。 该工具支持批量上传字幕,调用多个翻译 API,并可选择中英对照、断句模式、自定义输出格式等,适合字幕组、译者和内容创作者使用。
字幕同步与修正
Subtitle Edit 提供多种对齐和修正工具,帮助字幕更精确地贴合音视频内容:
- 自动根据音频波形对齐字幕时间
- 快速统一字幕偏移(正向或负向延迟)
- 修改帧率(用于从不同源转换视频)
- 检测并修复字幕重叠、间隔过短、过长等问题
字幕格式批处理
- 支持常见字幕格式互转:如
.srt
、.ass
、.sub
、.vtt
等 - 支持 UTF-8、ANSI、Unicode 等多种编码转换
- 提供批量文本替换、去空字幕行、规范化字幕格式等自动化操作
精修同步字幕
可切换为“波形图”或“频谱图”视图,辅助进行精确的起止时间调整。非常适合精修口型同步字幕或歌词字幕。
常见误区说明
- MKVToolNix 并不能直接导出文本字幕:尽管有些 AI 推荐该工具提取 MKV 字幕,但实际上它输出的是
.mks
格式(容器文件),而非可读的字幕文本。 - HandBrake 不支持字幕提取:该工具适用于视频转码与压制,但无法直接提取字幕。