🌙 深色模式
🤖 主流AI模型能力对比
基于真实使用体验的多维度AI模型能力评估
📂 GitHub 仓库
1️⃣ 选择对比版本
免费版
付费版
2️⃣ 评估维度选择(请至少选择三项)
3️⃣ 模型选择(按各家最强模型)
📊 统计信息
🏆 综合分析结果
模型官网:
GPT (OpenAI)
Claude (Anthropic)
Gemini (Google)
Grok (xAI)
Perplexity
DeepSeek
Doubao (字节跳动)
测试数据来源:
MLCommons
Stanford HELM
LMSYS Chatbot Arena
Papers With Code