温馨提示

点击下载按钮右侧下拉箭头,可以选择软件资源下载!用夸克移动端保存该资源,可以免费获取1TB存储空间!

引言

刚才演示的视频片段,字幕完全自动生成,并且由DeepSeek翻译,有没有惊艳到你?此刻的老司机,肯定心里窃喜,我的一众日语大片,终于有救了!

要实现这种自动识别翻译字幕的功能,我们用到新版的PotPlayer播放器。之前的视频,鼠标也推荐过这款播放器,免费且功能强大。近期更新的版本,增加了一个新功能,就是自动生成字幕,简单说就是AI语音转文字,而它使用的模型,正是大名鼎鼎的Wishper,OpenAI出的免费语音识别大模型。话不多说,开始实操!

下载&安装PotPlayer

鼠标博客或者官网下载PotPlayer,安装很简单,无脑执行下一步。期间,你可以更换默认安装路径,安装结束的时候,默认勾选安装额外解码器。安装好解码器后,PotPlayer的安装也就至此完成。

语音生成字幕

PotPlayer播放无字幕外语视频的时候,我们点击右键-字幕-生成有声字幕-生成有声字幕。在生成有声字幕界面,首先是转换引擎,如果你的电脑有N卡,那么建议下拉选择CUDA;没有或者不知道自己有没有,就建议使用这个WishperXXL。接着是型号选项,其实就是Wishper的识别模型,从上至下,依次是翻译效果更好,但同时翻译需要更久的时间。可以根据自己电脑的配置,以及实际需求来,我使用的是这个V2的模型。引擎和模型都选择好了,就可以直接使用了么?显然不行,我们还需要下载当前选择的引擎和模型。因为是国外软件的关系,如果没有特殊网络环境,基本上你是无法正常下载。咋??说了半天不能用?怎么会,鼠标贴心的给你们准备了一件安装包。

安装引擎&模型

在鼠标博客上,获取这个引擎模型包,一定要将这三个文件都下载。因为包含了全部的引擎和模型,安装包体积有些大,总共19个G多。下载好后,运行这个程序进行安装,无脑执行下一步,引擎选择界面,勾选你需要的引擎,可以多选;模型选择界面,勾选你需要的模型,也可以多选。过程中,需要解压文件,所以有些慢,耐心等待。安装完成后,引擎和模型文件,会自动释放到PotPlayer安装目录。

生成有声字幕

PotPlayer播放无字幕外语视频,再次打开生成有声字幕界面,下拉选择我们上一步安装的引擎和模型,语音下拉选择影片原始语言,勾选提取声音时候应用语音增强滤镜,以便更好的获取原声字幕,最后点击开始,耐心等会,过程的长短和引擎模型,以及电脑配置,都有直接关系。有声字幕生成后,在播放视频的时候,就会显示原声字幕,没显示的话,我们可以右键-字幕-显示字幕。有了原声字幕,但是我们还是看不懂啊?

字幕翻译

有了原声字幕,但是我们还是看不懂啊?没关系,我们可以使用翻译插件,进行实时字幕翻译。

在线实时翻译

PotPlayer内置了在线实时翻译插件,但是基本都收费,或者因为网络原因,不能正常使用。如果你有特殊网络环境,推荐使用Google翻译,无需填入账号或Key,可以直接使用。当然,这只是个例,普通用户,该如何使用在线实时字幕翻译?

插件获取安装

如果用当下火出圈的DeepSeek,进行实时翻译,想必是一个不错的方法。我们用到github上,这款免费开源项目,名字叫做PotPlayer Chatgpt Translate。鼠标博客,或者该项目地址可以获取插件安装包。你可以使用作者的一键安装包,但是需要手动输入PotPlayer安装路径,对于新手小白来说,不可避免会出现一些小问题。所以,鼠标重新制作了安装包,可以自动定位安装路径,就问你贴心不贴心?同样在鼠标博客免费获取。

插件配置使用

翻译插件安装好后,PotPlayer右键-字幕-实时字幕翻译-实时字幕翻译设置,就可以看见们安装的翻译插件。选中刚刚安装好的插件,也就是ChatGPT翻译,再点击账户设置,我们要接入的DeepSeekAPI,以硅基流动为例。登录硅基流动主页,左侧导航点击模型广场,选择DeepSeek V3模型,因为R1有思考过程,不适合翻译。复制模型名称、API地址以及Key等信息备用,回到PotPlayer实时字幕翻译设置界面,模型名称及API地址栏的格式为:模型名称|API地址,至于Key就直接粘贴在API密钥栏,最后点击确定,弹出可以正常处理提示。使用条件下拉,选择总是使用;翻译位置,根据自己喜好下拉选择;翻译引擎,下拉选择ChatGPT翻译;原始语言保持默认自动检查;目标语言,下拉选择简体中文。最后点击测试,弹出该内容,证明翻译插件已经正确配置了,确定保存配置。此时,我们继续播放无字幕的外语视频,欧吼!中文字幕这不就来了么!

本地实时翻译

如果你有本地部署大语言模型的经验,本地部署模型,譬如Qwen2.5等,进行实时翻译,也是个不错的选择!闲言少叙,上教程!

获取安装Ollama

鼠标博客或者官网下载Ollama,无脑下一步进行安装。考虑到部分同学没有特殊网络环境,无法正常下载Qwen2.5模型。鼠标制作了模型安装包,模型版本从0.5b到32B,至于70B太大了,一般的电脑配置也运行不了,所以就没有整合!模型包的安装非常简单,开始无脑下一步,模型选择界面,勾选你需要的模型,可以多选,接着选择路径,建议选择一个存储空间较大的位置,点击安装开始释放模型,过程可能会较长,请耐心等待。模型安装完成,重启下Ollama,可以看见模型都已经正常加载。

配置使用本地翻译

打开之前安装的插件配置界面,账户设置里的API地址,我们以这样格式填入信息,模型名|API地址|nullkey。模型名就是你部署在ollama的Qwen2.5的模型名,譬如:qwen2.5:7b;API地址,如果你Ollama部署在本机,默认就是这个(https://127.0.0.1:11434/v1/chat/completions),如果你部署在局域网,那么替换127.0.0.1部分即可;最后一个参数是固定的,就是无需填入Key的必要参数,之所以,我们的API密钥栏为空就好了。确认后弹出英文提示,不需理会。点击测试弹出中文提示,表示我们正确配置了ollama的Qwen2.5。播放一段视频测试下,翻译效果也是很不错,完全不用联网,本地实时翻译。

总结

以上,就是本期视频全部内容,介绍了PotPlayer的新功能,也就是生成有声字幕,同时我们可以搭配DeepSeek等,进行在线实时翻译;也可以直接本地部署Ollama,搭配一些主流大语言模型,进行本地实时翻译,同学们按需选择即可。视频中涉及的工具、资源,都可以在鼠标博客获取,关于博客地址,你可以仔细看看{时间}。好了,本期视频就到这里,赶脚有用,就关注点赞收藏下!我是鼠标,谢谢您的观看!