客服场景榜

N=10 · 多轮约束 + 知识库 · 2026-05-20

#模型得分
1Qwen2.5-Max4.40
2Claude 3.5 Sonnet4.38
3GLM-4-Plus4.35
4Kimi 最新档4.32
5GPT-4o4.30
6豆包 Pro4.25
7Qwen-Plus4.22
8DeepSeek-V34.20
9文心 ERNIE 4.04.15
10Hunyuan-Pro4.12
11讯飞星火 Max4.10
12GPT-4o-mini3.95
13Baichuan43.90