当前位置:AIGC资讯 > AIGC > 正文

Whisper 从0安装教程 windows

这里写自定义目录标题

Whisper 从0安装教程 windows 安装过程 安装python3.11 安装Anaconda 在Anaconda里面安装whisper 安装 ffmpeg 第一次运行whisper 检查GPU 一些弯路

Whisper 从0安装教程 windows

因为需要把语音变成文字稿,问了做语言相关的朋友,决定使用whisper来做这个工作
官方网站:https://github.com/ggerganov/whisper.cpp
但是官网的教程一般小白很难从0开始。我一共折腾了两天,找了不少教程,走了两次弯路终于搞定了。

安装过程

安装python3.11

因为看到Anaconda官网上最新的版本是基于python3.11的,但是我自己电脑上的版本是python3.10,为了避免我这种不太会搞环境的人不装错,还是先卸载3.10,装上3.11


在这里下载3.11最新版本,之后双击安装。

安装完成之后能够在开始菜单看到新安装的python3.11.

安装Anaconda

ref:https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf
在Anaconda官网下载

下载后双击安装,记住Anaconda的安装路径

之后一路默认选项直到安装完毕。

在Anaconda里面安装whisper

打开anaconda prompt

要以管理员权限打开,否则会装不上whisper
conda create --name whisper python=3.11

安装 ffmpeg

conda activate whisper
pip install ffmpeg-python
ffmpeg -version

检查一下whisper是不是装好了

第一次运行whisper

去到语音文件在的路径下,运行whisper,然后发现GPU没用上。

检查GPU

在任务管理器中检查GPU型号,这里可以看到这个gpu是6BG的。


然后就是检查cuda版本。

这里cuda版本是12.2

但是pytorch官方只有cuda12.1的版本的对应版本。但是不要担心,直接用这个就行,cuda12.2 对cuda12.1向下兼容。(我试了把指令里的12.1,改成12.2,然后没找到这个版本的pytorch)
安装

Check 是否能用GPU


运行:
后面加 --model medium可以用中等的模型(需要GPU在5G及以上)


然后就可以了!
会生成对应的字幕文件和txt文件

好像还可以指定语言
whisper xxxxx.mp4 --model medium --language Chinese

一些弯路

中间我用到的教程有:
https://zhuanlan.zhihu.com/p/595691785
这个教程是装在系统中运行的,我一开始是想按照这个教程来装的,但是我后来在anaconda里面装了pytorch,感觉都在anaconda里面搞算了,毕竟装到系统里面还要改环境变量啥的很麻烦。

https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf
这个是anaconda里面pytorch的安装,写得非常详细,我基本就是照这个装的pytorch,但是我后来发现我把pytorch装在了base里面。。。。。第一次运行的whisper只能用cpu,用不了gpu

https://medium.com/@steel540/whisper-teach-article-90a68687b912
最后用了这个教程,在anaconda里面装好了运行。

一些走弯路的时候的截图:







更新时间 2024-02-11