从大学开始,我看日剧十几年了,但是日语毫无进步,只能听懂几句耳熟能详的句子,看国外电影必须靠字幕组。我曾经想过学日语,报了暑期班,但成绩被七岁的小妹妹同学吊打。这让我被自己的语言能力说服了,认为这辈子都离不开字幕组。这种情况一直持续着,直到我测试视频剪辑工具 AutoCut 时遇到了 Whisper。
Whisper 是今年 9 月被 OpenAI 开源的自动语音识别系统,除了可以用于语音识别,Whisper 还能实现多种语言的转录,并将这些语言翻译成英语。「语言识别」「转录」听起来很高级,但 transcribe(转录)指的是将语音转为文字,Whisper 会为音视频生成带时间轴的字幕文件,是支持 99 种语言 AI 字幕工具。
2022年11月18日...大约 12 分钟