当前位置:AIGC资讯 > AIGC > 正文

在 Python 中使用 OpenAI 的新 Whisper API 进行语音转文本

您是否厌倦了手动转录数小时的录音?您想节省时间并提高工作效率吗?然后,您会很高兴听到 OpenAI 用于语音到文本转换的新 Whisper API!借助这项尖端的 AI 技术,您现在可以在 Python 程序中轻松地将音频文件转换为文本。让我们在下面探讨这是如何工作的!

创建一个新文件python-whisper-api.py并通过插入以下 python 代码行开始:

import os
import openai
openai.api_key = "[INSERT YOUR OPENAI API KEY HERE]"
audio_file = open("sample.mp3", "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)
print(transcript.text)

上面的 Python 代码是如何使用 OpenAI 的 Whisper API 来使用 Python 转录音频文件的示例。以下是每一行代码的作用的细分:

import os:这会导入内置的 os 模块,它允许我们与操作系统交互并执行打开文件等任务。

import openai:这将导入openai模块,该模块提供对 OpenAI 的 API 的访问。如果您尚未在本地 Python 开发环境中安装该模块,则需要使用以下命令进行安装:pip install openai

openai.api_key = "[INSERT YOUR OPENAI API KEY HERE]":这会设置 OpenAI API 的 API 密钥,这是进行 API 调用所必需的。

audio_file = open("sample.mp3", "rb"):这将以读取二进制模式打开音频文件“sample.mp3”并将其分配给变量audio_file。

transcript = openai.Audio.transcribe("whisper-1", audio_file):这是使用openai.Audio.transcribe()转录音频文件的方法。Screenpresso:强大的 Windows 屏幕捕获工具第一个参数是要使用的模型的名称(“whisper-1”),第二个参数是我们在第 4 步中打开的音频文件。该方法返回一个对象,我们将其分配transcribe()给Transcription变量transcript。

print(transcript.text):这会打印出text转录的,可通过对象的文本属性访问Transcription。

总之,此代码使用 OpenAI Whisper API 转录音频文件并打印出生成的文本转录。

让我们运行应用程序

让我们通过输入以下命令来运行 Python 应用程序:

$ python python-whisper-api.py

您需要确保已将音频文件存储在名称为 sample.mp3 的同一文件夹中。然后您将收到由 Whisper 提供的文本抄本:

结论

OpenAI 的 Whisper API 为 Python 编程中的语音到文本转换开辟了一个充满可能性的世界。通过利用这项新技术,您可以通过自动化转录过程来提高工作效率并节省时间。无论您是记者、研究人员,还是需要定期处理音频内容的人,Whisper API 都可以成为您的武器库中的宝贵工具。凭借其令人印象深刻的准确性和易用性,Whisper API 有望在未来彻底改变我们处理音频内容的方式。那为什么还要等?立即开始探索 Whisper API,发现您可以使用这项突破性技术实现的所有令人惊奇的事情。

更新时间 2023-11-23