Ir para o conteúdo principal
Voltar para Explorar

Llama 3.1 Instruct 405B

Meta·Lançado em 2024-07-23
Open SourceMultimodal

Preços

Entrada

$2.75

por 1M tokens

Saída

$6.50

por 1M tokens

Combinado

$3.69

por 1M tokens

Mais barato que 15% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$3.69

Mensal

$110.64

vs. Modelos Similares

Llama 3.3 Instruct 70BQ:+0.1
$0.61-83%
Mistral Small 3.1Q:+0.1
$0.14-96%
OpenAI: GPT-4o (2024-05-13)Q:+0.1
$7.50+103%
Qwen3 32B (Non-reasoning)Q:+0.1
$0.26-93%

Desempenho

81

tokens/seg

Mais rápido que 41% dos modelos

0.73

segundos

Mais rápido que 70% dos modelos

0.73

segundos

Mais rápido que 79% dos modelos

Mediana do Mercado

94 tok/s

14% mais lento

TTFT Mediano

1.10s

34% mais rápido

Vazão/Dólar

22

tok/s por $/1M

Comparação de Velocidade

Llama 3 Instruct 8B
81 tok/s+0%
DeepSeek V3.2 Exp (Non-reasoning)
80 tok/s-0%
DeepSeek: DeepSeek V3.2
80 tok/s-0%

Benchmarks

MMLU-Pro
73.2%
GPQA Diamond
51.5%
HLE
4.2%
LiveCodeBench
30.5%
SciCode
29.9%
TerminalBench Hard
6.8%
MATH-500
70.3%
AIME
21.3%
AIME 2025
3.0%
IFBench
39.0%
Long Context Recall
24.3%
Tau2
19.0%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos