今天在听中岛美雪的演唱会时,发现视频里内置了字幕。相比我之前用 Whisper 转写出来的版本,原生字幕肯定要准确得多。于是我开始找工具,希望能把这些内嵌字幕提取出来。试了好几款之后,最终脱颖而出的是 —— Subtitle Edit。
Subtitle Edit 是一款功能强大的开源字幕编辑器,适用于字幕的提取、编辑、格式转换与翻译等多种场景。它支持多种视频与字幕格式,并内置 OCR 字符识别、语音转写、时间轴同步等实用功能。
今天在听中岛美雪的演唱会时,发现视频里内置了字幕。相比我之前用 Whisper 转写出来的版本,原生字幕肯定要准确得多。于是我开始找工具,希望能把这些内嵌字幕提取出来。试了好几款之后,最终脱颖而出的是 —— Subtitle Edit。
Subtitle Edit 是一款功能强大的开源字幕编辑器,适用于字幕的提取、编辑、格式转换与翻译等多种场景。它支持多种视频与字幕格式,并内置 OCR 字符识别、语音转写、时间轴同步等实用功能。
HandBrake 是一款功能强大的开源视频转换工具,支持 Linux、macOS 和 Windows 系统。它可以将已有的视频文件转换为在手机、电视盒子、游戏机、电脑或浏览器等多种设备上兼容的格式。支持的视频格式广泛,包括普通摄像机拍摄、屏幕录制以及蓝光源等。
我个人收藏了不少蓝光电影资源,但在 Emby 中无法直接播放。将资源迁移至云盘后,更是连在线播放都成问题。因此,我决定使用 HandBrake 将这些资源重新压缩为支持软字幕的 MKV 格式,以便在不同设备间更好地播放和管理。
REAPER 是一款功能强大的数字音频工作站(DAW),广泛用于音乐制作、音频剪辑、声音设计等领域。对于播客创作者来说,借助专为播客制作设计的插件 Ultraschall,可以进一步提升录音与后期处理的效率与体验。
本文将带你从安装、设置到录制、剪辑和导出,全流程掌握使用 REAPER + Ultraschall 进行播客制作。
当我第一次接触 AI 生成图像时,我发现生成的图像往往与我想象的场景不符。原因大多是因为提示词描述不精准。作为非英语母语的人,我在描述场景时往往用母语的思维方式,但有时会导致完全不同的结果。因此,我设计了 IMGPrompt —— 帮助不懂英语的人也能精准地生成完美的 AI 图像,甚至 AI 视频。这个工具旨在让每个人,无论是什么语言背景,都能轻松创建 AI 作品!
IMGPrompt 是专为 Stable Diffusion、Midjourney、DALL·E 和 FLUX 打造的 AI 图像提示词编辑器,界面简洁直观,使用户能够轻松地查看并组合所需的提示词文本。每个提示词都附有中文翻译,用户仅需通过点击或输入关键词,即可快速选取或组合,从而大大简化了文生图提示词输入。
Markdown 是我日常使用最频繁的文本格式,但现有的翻译工具往往难以保持其原有格式。因此,我开发了 md-translator,一个专为 Markdown 优化的翻译工具,旨在 精准翻译文本的同时保持格式完整。其翻译机制类似于字幕翻译器,详细参数可参考 说明文档。
封面图片摄于法国南部的泉水镇 (Fontaine de Vaucluse),时间是二月。洞穴看似浅显,但深入镜头,可见泉水幽深无底。据说,历经十六次探测,仍未能精确测量出泉眼深度。
在处理文本时,经常需要用到简繁转换。然而,网络上排名前三的简繁转换工具均会将原文本发送至第三方服务商进行转换,这可能引发隐私问题。因此,我基于 opencc-js 构建了一个本地的简繁转换工具。相比之下, opencc无法在客户端运行,故未被选用。
近年来,随着在线视频的兴起,国外热门影视作品的翻译多由视频平台完成,而原本活跃的字幕组则逐渐淡出人们的视野。然而,对于冷门视频和自制视频的字幕需求却未能得到有效满足,导致未配字幕的视频数量持续增加。为解决这一问题,可以用 Whisper 工具为这些生肉视频自动生成字幕,并通过翻译接口将其翻译成中文。具体操作步骤可参考文章:找不到字幕?Whisper 让不懂外语的你也能看懂日剧。
封面图拍摄于四月的敦煌月牙泉。那里的沙子极为细软,攀登沙山非常不易,我登顶便直接躺下,不想再动。直到日落前夕,温度骤降,我们才不得不离开。
封面图拍摄于 2016 年巴塞罗那的一个夏日夜晚。当时,人们与手机的关系还没有现在这般密不可分。从照片中可以看到,只有不到 10% 的人在使用手机拍照。