WhisperDesktop 是一个基于微软 OpenAI Whisper 模型的音频转文本工具。它可以将音频或视频文件转换成 TXT 文本、SRT 字幕和 VTT 字幕。
下载软件和模型:
- 前往 WhisperDesktop 的 GitHub 项目地址 或直接复制以下链接下载软件:WhisperDesktop.zip
- 点击 Hugging Face 图标,进入模型下载页面。
- 选择适合的模型(通常使用
medium.bin
,如果显卡显存足够大,也可以使用 large
的模型)并下载到本地。
开始听译:
- 在 WhisperDesktop 中选择刚刚下载的模型文件(
xxxx.bin
)。
结果处理:
- 得到的字幕通常是日语的。你可以使用 PotPlayer 播放器实时翻译观看。
- 如果想翻译成中文,可以用谷歌浏览器打开 SRT 文件,点击“翻译成中文”,稍等几秒即可得到中文字幕。
关于长视频听译存在字幕重复的问题:
WhisperDesktop下载:程序,模型,补丁
https://www.alipan.com/s/rwNMgHi4sUF
补丁文件
Whisper_last_text_repeated_workaround
bug讨论地址
文本输出循环/重复(直到结束)
https://github.com/Const-me/Whisper/issues/26
模型文件
model
程序文件
WhisperDesktop