Ir para o conteúdo principal
Voltar para Explorar

Claude 2.1

Anthropic·Lançado em 2023-11-21
Multimodal

Benchmarks

MMLU-Pro
49.5%
GPQA Diamond
31.9%
HLE
4.2%
LiveCodeBench
19.5%
SciCode
18.4%
TerminalBench HardNão avaliado
MATH-500
37.4%
AIME
3.3%
AIME 2025Não avaliado
IFBenchNão avaliado
Long Context RecallNão avaliado
Tau2Não avaliado
Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos