# ElevenLabs 语音模型特点

已发布 2026-01-15

# Eleven v3 (alpha) - 最新旗舰模型

Eleven v3是最新发布的最具表现力的AI文本到语音模型，支持70多种语言，具有以下特点：

高级音频标签：支持 [excited]、[whispers]、[sighs] 等情感标签
对话模式：支持自然的多说话者对话
极高表现力：输出效果令人惊叹，但需要更多提示工程，延迟较高，不适合实时和对话用例
多语言支持：支持74种语言

# Multilingual v2 - 情感表现最佳

Multilingual v2是最逼真、情感最丰富的模型，最适合配音、有声书和内容创作

高质量音频：提供最高质量的音频输出
情感细腻度：在情感表达方面表现出色
数字标准化：在数字标准化方面表现更好，推荐用于电话号码等需要数字标准化的场景
成本：1个字符消耗1个积分

# Turbo v2.5 - 低延迟多语言

Turbo 2.5支持印地语、法语、西班牙语、普通话等32种语言，速度提升3倍

极低延迟：Flash v2.5提供超低75ms延迟
多语言支持：比Multilingual v2快得多，现在支持越南语、匈牙利语和挪威语等新语言
适用场景：最适合需要快速、自然语音的多语言开发者
成本优势：Turbo V2和V2.5模型现在便宜50%

# Turbo v2 - 英语专用快速模型

生成语音延迟约400ms，比V1模型快两倍以上，质量与Multilingual V2相当

专注英语：专门针对英语，非常适合速度至关重要的纯英语用例
低延迟：针对低延迟应用优化，不牺牲声音性能
稳定性：英语专用，非常稳定