Voltar para Explorar

Llama 3.1 Tulu3 405B

Allen AI·Lançado em 2025-01-30

Open Source

Benchmarks

MMLU-Pro

71.6%

GPQA Diamond

51.6%

HLE

3.5%

LiveCodeBench

29.1%

SciCode

30.2%

TerminalBench HardNão avaliado

MATH-500

77.8%

AIME

13.3%

AIME 2025Não avaliado

IFBenchNão avaliado

Long Context RecallNão avaliado

Tau2Não avaliado

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Claude 3.5 Sonnet (June '24)

Anthropic

LFM2.5-8B-A1B

Liquid AI

Qwen: Qwen3 VL 8B Instruct

Alibaba

Q: 8.4$0.18/1M256K ctx

Qwen3 4B (Reasoning)

Alibaba

Ring-flash-2.0

InclusionAI

GPT-4o (ChatGPT)

OpenAI

Comparar todos os 7 modelos