字幕识别都开始收费了？推荐两种完美免费替代方案效果甚至强于前者

视频内容

下载地址

点击下载按钮右侧下拉箭头，可以选择软件资源下载！

文本内容

前几日，鼠标像往常一样，做完视频准备字幕识别，哎哟！某软件的字幕识别功能，竟然开始收费了，这波操作，着实有点骚啊！话说，我也只是用它来识别字幕，开个年度会员，有些得不偿失！好吧，你有张良计，我有过墙梯！大不了不用你了！下面鼠标就介绍下，我自己正在使用的，关于字幕识别的两种替代方法！

第一个，Buzz，基于 OpenAI Whisper 的免费开源，可离线的实时语音转文字工具。支持 Windows、macOS、Linux，它可以将麦克风的语音实时转换为文字，也支持将视频、音频文件转换为文字、字幕。

它的用法也非常简单，访问Github项目地址，或者鼠标的博客免费下载。下载好后，执行程序进行安装。首次使用，需要下载模型，Whisper模型从Tiny到Large3，级别越高，识别的准确性越好，相应的对CPU的需求就越高，耗费的时间越长！针对不能正常下载的同学，鼠标已经将全部Whisper模型打包，访问鼠标的博客免费下载使用。

模型下载好后，Buzz主界面，将我们需要识别文字的音视频文件，直接拖放到主窗口，此时，弹出设置窗口，模型下拉选择Whisper，具体模型下拉，鼠标建议使用Medium，在识别准确性和配置需求中，比较折中的一个方案！任务选择识别，语言选择中文，如果是字幕，勾选SRT，最后点击开始执行！过程的长短，和CPU的性能有直接关系！提示任务完成后，双击该条任务，弹出字幕预览窗口，可以看见，准确性甚至强于某映，针对识别不准确的部分，可以边听边修改，没问题后，点击Export导出即可！

Buzz是依靠CPU来运行识别的，如果你电脑有着较好的GPU，那么推荐下面这个方案！
第二个，WhisperDesktop，同样免费开源的离线语音转文字工具，模型也是使用OpenAI Whisper，不同的是，它使用Whisper ggml模型，依托GPU运算！

同样Github或者鼠标博客下载程序，WhisperDesktop免安装，下载下来后直接运行。软件主界面，点击这里下载模型，ggml模型也有多个级别，鼠标建议还是使用Medium模型，无法正常下载模型的同学，鼠标已经帮你打包好了，博客免费下载！模型下载好后，在WhisperDesktop主界面，这里选择模型的路径，这里下拉选择GPU，其他默认点击OK！加载好模型后，进入识别设置界面，语言下拉选择中文；第一个路径，选择你要识别的语音文件位置；第二个路径，是识别好的文件存放位置；中间下拉选项，可以选择导出文件类型。设置完毕后，点击英文的这个转录开始识别，明显这个识别速度要快于Buzz很多，同为Whisper模型，准确性自是不必多说！

以上，就是鼠标推荐的字幕识别方案，不能说是平替某映，在易用性和识别准确性上，甚至优于某映，况且完全免费！至于如何选择，还用鼠标多说吗？好了，本期视频就到这里，谢谢观看！建议收藏下本视频，别到用时找不到！