视频内容

下载地址

温馨提示

点击下载按钮右侧下拉箭头,可以选择软件资源下载!

文本内容

前几日,鼠标像往常一样,做完视频准备字幕识别,哎哟!某软件的字幕识别功能,竟然开始收费了,这波操作,着实有点骚啊!话说,我也只是用它来识别字幕,开个年度会员,有些得不偿失!好吧,你有张良计,我有过墙梯!大不了不用你了!下面鼠标就介绍下,我自己正在使用的,关于字幕识别的两种替代方法!

第一个,Buzz,基于 OpenAI Whisper 的免费开源,可离线的实时语音转文字工具。支持 Windows、macOS、Linux,它可以将麦克风的语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。

它的用法也非常简单,访问Github项目地址,或者鼠标的博客免费下载。下载好后,执行程序进行安装。首次使用,需要下载模型,Whisper模型从Tiny到Large3,级别越高,识别的准确性越好,相应的对CPU的需求就越高,耗费的时间越长!针对不能正常下载的同学,鼠标已经将全部Whisper模型打包,访问鼠标的博客免费下载使用。

模型下载好后,Buzz主界面,将我们需要识别文字的音视频文件,直接拖放到主窗口,此时,弹出设置窗口,模型下拉选择Whisper,具体模型下拉,鼠标建议使用Medium,在识别准确性和配置需求中,比较折中的一个方案!任务选择识别,语言选择中文,如果是字幕,勾选SRT,最后点击开始执行!过程的长短,和CPU的性能有直接关系!提示任务完成后,双击该条任务,弹出字幕预览窗口,可以看见,准确性甚至强于某映,针对识别不准确的部分,可以边听边修改,没问题后,点击Export导出即可!

Buzz是依靠CPU来运行识别的,如果你电脑有着较好的GPU,那么推荐下面这个方案!
第二个,WhisperDesktop,同样免费开源的离线语音转文字工具,模型也是使用OpenAI Whisper,不同的是,它使用Whisper ggml模型,依托GPU运算!

同样Github或者鼠标博客下载程序,WhisperDesktop免安装,下载下来后直接运行。软件主界面,点击这里下载模型,ggml模型也有多个级别,鼠标建议还是使用Medium模型,无法正常下载模型的同学,鼠标已经帮你打包好了,博客免费下载!模型下载好后,在WhisperDesktop主界面,这里选择模型的路径,这里下拉选择GPU,其他默认点击OK!加载好模型后,进入识别设置界面,语言下拉选择中文;第一个路径,选择你要识别的语音文件位置;第二个路径,是识别好的文件存放位置;中间下拉选项,可以选择导出文件类型。设置完毕后,点击英文的这个转录开始识别,明显这个识别速度要快于Buzz很多,同为Whisper模型,准确性自是不必多说!

以上,就是鼠标推荐的字幕识别方案,不能说是平替某映,在易用性和识别准确性上,甚至优于某映,况且完全免费!至于如何选择,还用鼠标多说吗?好了,本期视频就到这里,谢谢观看!建议收藏下本视频,别到用时找不到!