# ElevenLabs 语音模型特点

已发布 2026-01-15

# Eleven v3 (alpha) - 最新旗舰模型

Eleven v3是最新发布的最具表现力的AI文本到语音模型,支持70多种语言,具有以下特点:

  • 高级音频标签:支持 [excited][whispers][sighs] 等情感标签
  • 对话模式:支持自然的多说话者对话
  • 极高表现力:输出效果令人惊叹,但需要更多提示工程,延迟较高,不适合实时和对话用例
  • 多语言支持:支持74种语言

# Multilingual v2 - 情感表现最佳

Multilingual v2是最逼真、情感最丰富的模型,最适合配音、有声书和内容创作

  • 高质量音频:提供最高质量的音频输出
  • 情感细腻度:在情感表达方面表现出色
  • 数字标准化:在数字标准化方面表现更好,推荐用于电话号码等需要数字标准化的场景
  • 成本:1个字符消耗1个积分

# Turbo v2.5 - 低延迟多语言

Turbo 2.5支持印地语、法语、西班牙语、普通话等32种语言,速度提升3倍

  • 极低延迟:Flash v2.5提供超低75ms延迟
  • 多语言支持:比Multilingual v2快得多,现在支持越南语、匈牙利语和挪威语等新语言
  • 适用场景:最适合需要快速、自然语音的多语言开发者
  • 成本优势:Turbo V2和V2.5模型现在便宜50%

# Turbo v2 - 英语专用快速模型

生成语音延迟约400ms,比V1模型快两倍以上,质量与Multilingual V2相当

  • 专注英语:专门针对英语,非常适合速度至关重要的纯英语用例
  • 低延迟:针对低延迟应用优化,不牺牲声音性能
  • 稳定性:英语专用,非常稳定