目录
环境配置
代码实现
****** 实现 .mp4转换为 .wav文件,识别后进行关键词匹配并输出关键词出现的次数
****** 完整代码实现请私信
环境配置
安装 ffmpeg
打开网址 https://github.com/BtbN/FFmpeg-Builds/releases 下载如下图所示的文件 下载后解压我的路径是G:\ffmpeg-master-latest-win64-gpl-shared\bin
找到自己的安装路径,进入到 bin 目录,复制这个路径
在我的电脑中添加环境变量右击 ---> 属性
高级系统设置
环境变量
找到 path,双击
新建 ---> 把刚刚的路径粘贴进来,确定
在搜索框中输入 cmd ,打开终端,输入 ffmpeg -version,显示如下则表示安装成功
安装 opencc库
pip install opencc -i https://pypi.tuna.tsinghua.edu.cn/simple
安装 torch
pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple
注:若运行时报关于 numpy 的错误,需要执行下面这个命令,更新 numpy 库
pip install numpy --upgrade
代码实现
只展示核心,完整的请关注并私信
# 利用训练好的模型进行识别
result = whisper_model.transcribe('录音.wav')