# Doubao（豆包/火山/字节跳动）

已发布 2025-05-06

# 1. Doubao-1.5-pro

专业版定位： 面向对话和内容生成中的高精度要求，通常具有较高参数规模（如1.5B级别）和更多深度优化。
高质量输出： 侧重准确性和丰富细节，适合企业、专业应用以及需要严谨语言表达的场景。
扩展上下文与语言理解： 经过充分训练，在处理复杂上下文、领域专业术语和细腻语感方面表现出色，尤其在中文对话中拥有明显优势。

# 2. Doubao-1.5-lite

轻量版设计： 采用较少参数和计算资源，优化模型体积，响应速度更快，更适合资源受限的设备部署。
平衡性能与效率： 在保持基本语言理解和生成能力的同时，进一步降低延迟和运行成本，适合移动设备或大规模实时服务。
便携应用： 虽然是轻量级，但依然能够应对日常问答和普通对话，对于不需要专业级深度输出的场景足够使用。

# 3. DeepSeek-V3

旗舰大模型： 采用混合专家（MoE）架构，总参数量达671B，其中约37B参数在每次推理中被激活，支持高效计算。
长上下文支持： 具有极长的上下文窗口（可达128K tokens），适合处理长文档、复杂对话以及代码和数学任务。
高性价比与开放性： 在成本和训练效率上具有优势，同时开放源代码便于研究和企业应用，适合广泛的语言理解和生成任务。

# 4. DeepSeek-R1

专注推理能力： 主打“reasoning-first”，通过强化学习训练生成链式思考（Chain-of-Thought），展示详细的推理过程。
高精度逻辑推理： 在数学问题、代码生成和复杂逻辑题上表现优异，可与顶尖的推理模型（如OpenAI的o1）媲美。
透明思考过程： 用户可以看到模型在生成最终答案前的思路和自我校验过程，有助于理解和调试模型输出，适合对结果解释性有要求的应用。

# 5. DeepSeek-R1-Distill-Qwen

蒸馏版本： 采用蒸馏技术将DeepSeek-R1的高级推理能力提炼到基于Qwen架构的更小模型上，从而在参数量更低的情况下依然保持出色性能。
高效推理与低资源占用： 设计上兼顾推理效果和运行效率，既能完成复杂数学和编程任务，又适合在资源受限环境中部署。
实用性增强： 使开发者可以以更低成本获得近似R1水准的推理能力，对于要求高响应和成本敏感的商业应用非常合适。