Whisper是 OpenAI 2022年发布的一款语音预训练大模型,集成了多语种ASR、语音翻译、语种识别的功能。
Whisper使用弱监督训练的方法,可以直接进行多任务的学习
1. 安装ffmpeg
1.1 更新yum
yum update
1.2 安装gcc
yum install gcc
1.3 在线安装ffmpeg
1.3.1 Install the EPEL repository
yum install epel-release
1.3.2 install ffmpeg
yum install ffmpeg
1.4 离线安装ffmpeg
1.4.1 安装yasm
# 下载
wget -c http://www.tortall.net/projects/yasm/releases/yasm-1.3.0.tar.gz
# 解压
tar -zxvf yasm-1.3.0.tar.gz
# 切换目录
cd yasm-1.3.0
# 执行配置
./configure
# 编译并安装
make && make install
1.4.2 安装FFmpeg
# 下载源码
git clone https://git.ffmpeg.org/ffmpeg.git ffmpeg