Ir para o conteúdo principal
Voltar para Explorar

Grok 2 (Dec '24)

xAI·Lançado em 2024-12-12
Multimodal

Benchmarks

MMLU-Pro
70.9%
GPQA Diamond
51.0%
HLE
3.8%
LiveCodeBench
26.7%
SciCode
28.5%
TerminalBench HardNão avaliado
MATH-500
77.8%
AIME
13.3%
AIME 2025Não avaliado
IFBenchNão avaliado
Long Context RecallNão avaliado
Tau2Não avaliado
Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos