← 返回资讯
产品发布 @xai 2026-05-01

xAI:语音克隆功能正式上线 API

xAI 宣布 Voice Cloning 通过 API 开放,用户可在 2 分钟内创建定制语音,也可从 28 种语言、80+ 内置语音库中选择,用于语音助手、有声书及游戏角色等场景。

查看原文
TL;DR · 产品解读

xAI 上线语音克隆 API,2 分钟可定制语音,覆盖 28 种语言、80+ 内置选项。这是 xAI 在多模态能力上的重要补全,对需要快速集成语音能力的开发者有吸引力,但克隆质量、稳定性和定价策略仍是关键悬念。

深度解读

产品是什么

Voice Cloning API 是 xAI 推出的语音克隆解决方案,提供两种获取方式:快速克隆(上传音频样本,2 分钟内完成)和语音库选择(28 种语言、80+ 预设语音)。API 已正式开放。

解决什么问题

传统 TTS 定制需要大量录音数据和复杂的调参流程。xAI 这次将门槛大幅降低——开发者只需几MB音频样本即可在2分钟内获得可用语音。目标场景明确:语音助手(客服/个人助理)、有声书/播客制作、游戏角色配音、无障碍应用等。

相比竞品的变化

核心卖点是"速度"和"Grok 生态协同"。2 分钟克隆在业内属于较快水平,但并非独家——ElevenLabs 的即时克隆已成熟运营多年。xAI 的差异化在于与 Grok 聊天机器人的深度集成,开发者可以一站式构建"对话+语音"的 AI 应用闭环。

定价与可用性

截至发布时,xAI 尚未公开 Voice Cloning 的具体定价(API 定价页未列出)。考虑到 xAI 一直走"低价高配额"路线(Grok 2.5 mini 性价比显著),语音克隆的定价可能对中小开发者友好,但需等官方确认。

参考来源
  1. xAI 官方公告 · 2026-05-01
  2. ElevenLabs Voice Library · 2026-04-20
  3. OpenAI TTS API Documentation · 2026-03-15
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。