客服场景榜
N=10 · 多轮约束 + 知识库 · 2026-05-20
| # | 模型 | 得分 |
|---|---|---|
| 1 | Qwen2.5-Max | 4.40 |
| 2 | Claude 3.5 Sonnet | 4.38 |
| 3 | GLM-4-Plus | 4.35 |
| 4 | Kimi 最新档 | 4.32 |
| 5 | GPT-4o | 4.30 |
| 6 | 豆包 Pro | 4.25 |
| 7 | Qwen-Plus | 4.22 |
| 8 | DeepSeek-V3 | 4.20 |
| 9 | 文心 ERNIE 4.0 | 4.15 |
| 10 | Hunyuan-Pro | 4.12 |
| 11 | 讯飞星火 Max | 4.10 |
| 12 | GPT-4o-mini | 3.95 |
| 13 | Baichuan4 | 3.90 |