# OpenRouter

已发布 2025-05-06

# 1. Llama3 70B Instruct:

  • Meta 发布的 Llama 3 系列中的 70B 参数指令微调模型,优化用于对话场景,在多个行业基准测试中表现优异。

# 2. Llama3 8B Instruct:

  • Llama 3 系列的 8B 参数版本,适用于资源受限的环境,支持指令微调,适合轻量级应用。

# 3. Llama3.1 405B:

  • Llama 3.1 系列中的超大模型,拥有 405B 参数,支持多语言和长上下文处理,适用于复杂任务。

# 4. Llama2 70B Chat:

  • Meta 的 Llama 2 系列中的 70B 参数对话优化模型,专为聊天应用设计,提升了对话质量和安全性。

# 5. Llama Guard 3 8B:

  • Llama 3.1 系列的 8B 参数模型,专注于内容安全分类,可用于输入和输出的内容审核。

# 6. Mistral Large:

  • istral AI 提供的大型语言模型,具体参数未公开,强调高性能和高吞吐量,适合商业级部署。

# 7. Mixtral 8x22B:

  • Mistral AI 的 Mixtral 模型,采用稀疏专家混合架构(SMoE),总参数为 141B,每次推理激活 39B 参数,实现高效推理。

# 8. Codestral 2501:

  • Mistral AI 的代码生成模型,优化了架构和分词器,代码生成速度提高约两倍,在 FIM(Fill-in-the-Middle)任务中表现出色。

# 9. Mistral 7B Instruct:

  • Mistral 7B 的指令微调版本,支持 32K 上下文窗口,适用于需要长上下文处理的任务。

  • DeepSeek 的旗舰模型,采用混合专家架构,总参数 671B,每次推理激活 37B 参数,支持超长上下文处理,适合复杂任务。

# 11. DeepSeek R1:

  • DeepSeek 的 R1 模型,专注于数学、代码和复杂推理任务,采用强化学习训练,开源且成本效益高。

# 12. Qwen2.5 72B Instruct:

  • 通义千问系列的 72B 参数指令微调模型,适用于复杂指令执行和多领域应用。

# 13. Qwen-Turbo/Plus/Max:

  • 通义千问系列的三个变体:Turbo 强调速度,Plus 提供平衡性能,Max 支持更长上下文和复杂任务,适用于不同需求。

# 14. Gemini Pro 1.0:

  • Google DeepMind 的 Gemini Pro 模型,支持多模态输入,具备强大的推理和编码能力,适合复杂任务。

# 15. Gemma 2 27B:

  • Google 发布的开源模型,参数为 27B,旨在为开发者和研究人员提供高性能的语言模型。

# 16. Command R+:

  • Command 系列的增强版模型,强调命令执行、任务规划和多步推理,适用于企业自动化等应用。

# 17. Command R:

  • Command 系列的基础版模型,用于命令执行和简单推理,适合一般任务和低延时需求场景。

# 18. GPT-4/GPT-4 Turbo:

  • OpenAI 的 GPT-4 系列模型,支持多模态输入,GPT-4 Turbo 为优化版本,具有更低延迟和更大上下文窗口。

# 19. GPT-3.5 Turbo:

  • OpenAI 的 GPT-3.5 系列中的高速、经济版本,主要用于实时对话和简单任务。

# 20. Claude v2.1/v2:

  • Anthropic 推出的 Claude 系列模型,重点关注安全性和输出对齐,提供柔和、礼貌的对话体验。

# 21. Grok 3 Beta:

  • xAI 推出的 Grok 3 Beta 模型,处于测试阶段,以其独特的幽默和个性化回复著称,具备一定图像生成能力。

# 22. TheDrummer: Anubis Pro 105B:

  • 参数规模为 105B 的大型模型,定位为专业版,适用于复杂和高精度的大规模任务。

# 23. Goliath 120B:

  • 超大规模的 120B 参数模型,提供顶级通用语言理解与生成能力,适合企业级和高要求应用。

# 24. Llama3.3 Euryale 70B:

  • Llama 3.3 系列中的 70B 参数模型,经过进一步优化,提升了推理能力和对话质量。

# 25. NeverSleep: Lumimaid v0.2 70B:

  • NeverSleep 推出的 Lumimaid v0.2 模型,拥有 70B 参数,专注于持续对话和多轮交互,适用于长时间对话任务。

# 26. Nous: Hermes 3 405B Instruct:

  • Nous Research 发布的 Hermes 3 系列中的 405B 参数指令微调模型,强调高质量指令跟随和多语言支持,适用于复杂任务。