最佳免费语音文本 AI – Whisper AI

工具软件3年前 (2023)发布 gpts

238 0 0

安装谷歌合作实验室

在 Google Colaboratory 中完成前面的步骤后，打开 Colaboratory。
将以下代码粘贴到 Colaboratory 编辑器中，以将 whisper 和 ffmpeg（支持音频和视频文件）安装到 Colaboratory：
!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg
选择“运行”图标以运行代码以安装 Whisper 和 ffmpeg。大约需要 20 秒。

在 Google Colaboratory 中完成前面的步骤后，打开 Colaboratory。
单击左侧导航菜单上的文件夹图标
拖放要转录的音频或视频。
弹出“提醒，回收此运行时将删除上传的文件”，点击“确定”。对话框。
该文件已上传，您应该会在左侧导航菜单的“文件夹”菜单下看到它。
单击代码菜单并粘贴以下代码以在文件上运行 Whisper：
!whisper "ENTER FILE NAME HERE" --model medium.en
- 将“ENTER FILE NAME HERE”替换为您要转录的文件的名称。
- 将 medium.en 替换为您想要使用的模型 – tiny、base、small、medium 或 large，其中 tiny 最快、最小且精度最低，而 large 需要更长的时间，是更大的文件和最高质量的模型。
单击“运行”图标以运行代码。
你可以看到成绩单。您还可以看到文件夹中添加了 3 个文件 – FILE.mp3.srt、FILE.mp3.txt 和 FILE.mp3.vtt 文件
- FILE.mp3.txt 包含音频中的所有文本
- FILE.mp3.vtt 和 FILE.mp3.srt 是带有时间戳的字幕格式
要下载文件，请将鼠标悬停在 FILE.mp3.* 上，选择省略号菜单并选择下载。