大模型多维对比

在一张页里切换场景分、速度、价格、上下文、性价比,快速找到「谁更强、谁更快、谁更省」。方法论与 Artificial Analysis 的 Intelligence / Speed / Price 维度类似,但评测集与货币针对中国用户。

89 个模型💡 = 推理模型评分方法论 →

一眼看懂:谁强、谁快、谁便宜

参考 Artificial Analysis 的多维对比思路;本站用人民币价 + 中文场景分,更适合国内选型。

打开对比总览 →

中文场景分

电商文案实测 · 越高越好

Claude Opus 4.7 领先(4.75/5),其次 GPT-5.5、Claude 4 Opus。

输出速度

tokens/s 中位数 · 越高越好

Yi-Lightning 领先(92 tok/s),其次 Gemini 2.5 Flash、Gemini 2.0 Flash。

输出价格

最低渠道 ¥/M · 越低越好

Baichuan4 输出价最低(¥1.90),其次 GLM-4-Flash、Llama 3.3 70B Instruct。

上下文窗口

Context tokens · 越大越好

Llama 4 Scout 上下文最大(10.0M),其次 【历史参考】Gemini 1.5 Pro、GPT-5.5。

CN 性价比

场景分 − 0.4×log(价) · 越高越好

Claude 4 Opus 领先(0.81),其次 GPT-5、Claude 4 Sonnet。

中文场景分

电商文案实测 · 越高越好

  1. 1💡Claude Opus 4.74.75/5
  2. 2💡GPT-5.54.72/5
  3. 3💡Claude 4 Opus4.70/5
  4. 4💡DeepSeek-V4-Pro4.68/5
  5. 5💡Claude Sonnet 4.74.66/5
  6. 6💡Claude 3.7 Sonnet4.65/5
  7. 7💡Claude Sonnet 4.64.64/5
  8. 8GPT-4.14.60/5
  9. 9💡GPT-54.58/5
  10. 10💡o34.56/5
  11. 11💡Qwen3-Max4.55/5
  12. 12💡o44.54/5
  13. 13💡Claude 4 Sonnet4.53/5
  14. 14💡Claude Sonnet 44.52/5
  15. 15GPT-4o4.48/5
  16. 16💡Qwen2.5-Max4.45/5
  17. 17💡GLM-4-Plus4.42/5
  18. 18DeepSeek-V3.24.40/5

场景分 vs 输出价

右上象限:高分且相对不贵 · 点击圆点新标签打开详情

和 Artificial Analysis 有何不同?

  • AA 用英文综合 Intelligence Index(多评测加权);本站主榜为中文电商文案等场景实测。
  • 本站价格为人民币 ¥/M,含国内云渠道示意价。
  • AA 覆盖 500+ 模型;本站聚焦国内选型常用档,更新节奏见 changelog。