Buzz - 基于 OpenAI 的 Whisper 语音识别模型打造的声音转文本字幕工具,简单好用且免费开源

最近 AI 非常火爆,各种令人震惊、忧虑的工具层出不穷。今天介绍一款能提高我们效率的 AI 工具。

关于 Buzz

Buzz 是一款可以自动识别语音为文本字幕的软件工具,基于 OpenAI 开源的 Whisper 自动语音识别模型,可以批量将音频或者是视频中的内容自动转化为带有时间的字幕,速度非常快,是一款能极大提高效率的生产力小工具。

Buzz 软件界面
Buzz 简洁的软件界面

Buzz 语音转文字工具的特点

  • 高准确率:基于 OpenAI 开源的 Whisper 自动语音识别模型,这是一款非常强大的机器学习模型
  • 转换速度快:Buzz 的模型都离线存在本地,转换过程无需联网,因此转换速度很快,适合批量转换语音
  • 跨平台支持 Windows / macOs / Linux
  • 不仅支持中文,也支持很多个国家的语言,还能将结果翻译,不过只能翻译成英文

Buzz 上手使用体验

ChatGPT 自今年初火爆以来,至今热度不止,不光是 ChatGPT,AI 内容和工具也非常火热。今年给大家推荐的这款效率软件,就是基于开发了 ChatGPT 的人工智能公司「 OpenAI」 开源的 Whisper 模型做的软件 Buzz,能高效地将视频和音频自动转化为文本

初次打开 Buzz, 会把 AI 模型下载到本地,下载完成后所有的语音转录文字过程都在自己的电脑运行,转换速度很快。

Buzz 初次打开下载模型
Buzz 初次打开下载模型

Buzz 的软件界面很简洁,软件只有英文界面,不过屈指可数的几个功能按钮,完全不影响使用。

mac 版本的 Buzz 为例,打开软件后,我们可以点击「+」选择文件,然后选择语言(也可以使用默认的自动识别),就会自动转录,等进度为 100% 后,双击就会看到识别的内容,支持将结果导出为 TXT 格式的纯文本或者是通用的 SRT 字幕文件,非常方便。

Buzz 转录结果导出
Buzz 转录结果导出

之前向大家推荐过飞书秒记这款在线工具,虽然也很好用,但不能批量转换,而且音频文件需要在线上传,依赖网络,十分影响效率。

免费下载使用和开源说明

Buzz 是一款免费开源的软件,可以自动识别语音为文本字幕,基于 OpenAIWhisper 语音识别模型,这款 AI 模型同样也是免费开源的,大家可以放心下载 Buzz 来使用。

需要注意的是,在 mac 的 AppStore 上,Buzz 也推出了进阶版本 Buzz Captions,这是一款软件完成度相对较高,但是需要付费的软件,请大家注意区分。

Buzz 本身没有官网,源码和软件包只在 Github 项目主页提供下载,对于非开发人员,获取软件包比较费劲,我整理了 macwindows 的软件包放在网盘,方便大家来「那些免费的砖」网站上下载。至于 Linux 版本为什么不放,因为对于用 Linux 系统的用户来说,上 Github 一点也不难。