大模型多维对比

在一张页里切换场景分、速度、价格、上下文、性价比，快速找到「谁更强、谁更快、谁更省」。方法论与 Artificial Analysis 的 Intelligence / Speed / Price 维度类似，但评测集与货币针对中国用户。

89 个模型💡 = 推理模型评分方法论 →

一眼看懂：谁强、谁快、谁便宜

参考 Artificial Analysis 的多维对比思路；本站用人民币价 + 中文场景分，更适合国内选型。

电商文案实测 · 越高越好

Claude Opus 4.7 领先（4.75/5），其次 GPT-5.5、Claude 4 Opus。

tokens/s 中位数 · 越高越好

Yi-Lightning 领先（92 tok/s），其次 Gemini 2.5 Flash、Gemini 2.0 Flash。

最低渠道 ¥/M · 越低越好

Baichuan4 输出价最低（¥1.90），其次 GLM-4-Flash、Llama 3.3 70B Instruct。

Context tokens · 越大越好

Llama 4 Scout 上下文最大（10.0M），其次【历史参考】Gemini 1.5 Pro、GPT-5.5。

场景分 − 0.4×log(价) · 越高越好

Claude 4 Opus 领先（0.81），其次 GPT-5、Claude 4 Sonnet。

电商文案实测 · 越高越好

右上象限：高分且相对不贵 · 点击圆点新标签打开详情

类似 Intelligence vs Price 象限 · 右上 = 高分且相对不贵 · 电商文案场景