做短视频最麻烦的一步是什么?可能就是给视频配音了。今天推荐一个免费的在线文字转语音工具 TikTok Voice,支持几十种热门AI音色,一键生成配音。
TikTok Voice 介绍
TikTok Voice 是一个免费的在线文字转语音工具,专门为短视频创作者打造,可以将你输入的文字快速转换成语音,并提供几十种风格各异的 AI 配音音色可选。
我很早之前就在用这个网站,当时域名还是 tiktokvoice.net,现在跳转到了 mogofun 。域名变了,核心功能还是一样的 —— 免费、高效、音色丰富。

值得推荐的理由
- 完全免费:无需注册账号,打开网页就能用
- 音色丰富:提供几十种热门 AI 音色,包括经典的”小帅”、”猴哥”、”熊二”、”紫薇”等中文音色,还有 Jessie、Deep Voice、C3PO 等国际版音色
- 操作简单:输入文字 → 选择音色 → 点击生成,三步搞定
- 导出方便:生成后可以直接播放,也可以下载为 MP3 格式
上手使用体验
界面和使用流程
打开网站后,界面非常简洁 —— 没有广告,没有注册入口,直接就是核心功能区。顶部是语言选择,支持中文界面,中间大字是文本输入框,下方是音色选择区,最底下就是生成按钮。
整体使用流程很清晰:选语言 → 输文字 → 选音色 → 点生成 → 下载。整个过程不到一分钟。
生成速度
实测输入一段 100 字左右的中文文本,选择”小帅”音色,生成大约需要 10 秒左右。生成英文内容会更快一些。生成的 MP3 文件大小适中,一段 300 字的内容大约 1-2MB。
音质效果
说实话,TikTok Voice 的音质只是能用的级别,还不能和专业配音比,这也是为什么我只推荐作为短视频配音来用,至少比有些合成听起来像机器人的 TTS 好很多。
几个热门中文音色(猴哥、小帅、熊二)听起来比较自然,都是在短视频平台上能听到的几个声音,适合搞笑、娱乐类内容。国际版音色里,Deep Voice 适合做故事叙述类的沉稳风格,GHOSTFACE 适合做恐怖或搞笑内容。
与剪映的对比
剪映自带的文字转语音功能也很方便,但我更推荐 TikTok Voice,因为:
- 音色更多:剪映只有几种基础音色,TikTok Voice 有几十种可选
- 可下载 MP3:TikTok Voice 可以直接导出音频文件,不依赖特定编辑软件
- 跨平台使用:下载的 MP3 可以用到任何视频编辑工具里
当然,如果你的视频直接在剪映里编辑,用剪映自带的 TTS 更省事,不用再导入音频。
生成与下载
生成完成后,界面会显示音频播放器,可以直接在线播放试听。确认没问题后,点击下载按钮即可将 MP3 文件保存到本地。下载的文件会按照”语言+音色名+时间戳”命名,方便管理。

吐槽一下,之前我使用是可以直接下载音频文件,现在发现需要用 Google 账号登录,体验大打折扣。作为开发者,教大家一个用浏览器开发者工具下载 MP3 文件的方法:
- 生成语音后,打开浏览器的 开发者工具(F12 或右键 → 检查)
- 切换到 Network(网络) 标签
- 在 filters 框中输入
.mp3过滤请求 - 点击播放按钮,刷新出来的请求就是 MP3 文件
- 右键该请求 → Copy → Copy link address,粘贴到新标签页即可下载
这个方法不需要登录,直接抓网络请求即可。
适用场景
TikTok Voice 特别适合以下场景:
- 短视频配音:不想自己出声,又需要配音,直接用 AI 生成
- 多语言内容:做海外 TikTok 或 YouTube 视频,需要多语种配音
- 有声内容:制作有声小说、播客片段时,用来快速生成 demo
- 测试和原型:视频制作前期,用 AI 配音快速确认节奏和效果
免费使用说明
TikTok Voice 网站的底部其实有 QA,其中明确地说明,这是一款完全免费的文字转语音工具,不需要花一分钱就可以使用。需要注意的是,TikTok Voice 专门用来生成夸张搞笑的语音,使用免费,而 mogofun 官网的 TTS 功能则是有限免费使用,高阶功能付费。
总结
总的来说,TikTok Voice 是一个简单好用的免费文字转搞笑语音工具,音色丰富、操作便捷,非常适合短视频创作者使用。做视频不想自己配音,或者需要多语言配音时,这是一个值得收藏的工具。之前我也推荐过一些免费的 TTS 工具,可以去翻翻看,比如 TTS Omni、d1tools TTS。



