大模型多维对比
在一张页里切换场景分、速度、价格、上下文、性价比,快速找到「谁更强、谁更快、谁更省」。方法论与 Artificial Analysis 的 Intelligence / Speed / Price 维度类似,但评测集与货币针对中国用户。
一眼看懂:谁强、谁快、谁便宜
参考 Artificial Analysis 的多维对比思路;本站用人民币价 + 中文场景分,更适合国内选型。
中文场景分
电商文案实测 · 越高越好
Claude Opus 4.7 领先(4.75/5),其次 GPT-5.5、Claude 4 Opus。
输出速度
tokens/s 中位数 · 越高越好
Yi-Lightning 领先(92 tok/s),其次 Gemini 2.5 Flash、Gemini 2.0 Flash。
输出价格
最低渠道 ¥/M · 越低越好
Baichuan4 输出价最低(¥1.90),其次 GLM-4-Flash、Llama 3.3 70B Instruct。
上下文窗口
Context tokens · 越大越好
Llama 4 Scout 上下文最大(10.0M),其次 【历史参考】Gemini 1.5 Pro、GPT-5.5。
CN 性价比
场景分 − 0.4×log(价) · 越高越好
Claude 4 Opus 领先(0.81),其次 GPT-5、Claude 4 Sonnet。
中文场景分
电商文案实测 · 越高越好
场景分 vs 输出价
右上象限:高分且相对不贵 · 点击圆点新标签打开详情
场景分 vs 输出价格(¥/M)
类似 Intelligence vs Price 象限 · 右上 = 高分且相对不贵 · 电商文案场景
和 Artificial Analysis 有何不同?
- AA 用英文综合 Intelligence Index(多评测加权);本站主榜为中文电商文案等场景实测。
- 本站价格为人民币 ¥/M,含国内云渠道示意价。
- AA 覆盖 500+ 模型;本站聚焦国内选型常用档,更新节奏见 changelog。