Ir para o conteúdo principal
Voltar para Explorar

Llama 3.1 Tulu3 405B

Allen AI·Lançado em 2025-01-30
Open Source

Benchmarks

MMLU-Pro
71.6%
GPQA Diamond
51.6%
HLE
3.5%
LiveCodeBench
29.1%
SciCode
30.2%
TerminalBench HardNão avaliado
MATH-500
77.8%
AIME
13.3%
AIME 2025Não avaliado
IFBenchNão avaliado
Long Context RecallNão avaliado
Tau2Não avaliado
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos