当前位置:AIGC资讯 > AIGC > 正文

本地部署whisper模型(语音转文字)

Whisper是 OpenAI 2022年发布的一款语音预训练大模型,集成了多语种ASR、语音翻译、语种识别的功能。
Whisper使用弱监督训练的方法,可以直接进行多任务的学习

1. 安装ffmpeg

1.1 更新yum

yum update

1.2 安装gcc

yum install gcc

1.3 在线安装ffmpeg

1.3.1 Install the EPEL repository
yum install epel-release
1.3.2 install ffmpeg
yum install ffmpeg

1.4 离线安装ffmpeg

1.4.1 安装yasm
# 下载
wget -c http://www.tortall.net/projects/yasm/releases/yasm-1.3.0.tar.gz

# 解压
tar -zxvf yasm-1.3.0.tar.gz

# 切换目录
cd yasm-1.3.0

# 执行配置
./configure

# 编译并安装
make && make install
1.4.2 安装FFmpeg
# 下载源码 
git clone https://git.ffmpeg.org/ffmpeg.git ffmpeg 

更新时间 2024-03-22