Meta: Llama 4 Maverick

Meta·Lançado em 2025-04-05

Open Source1.0M ctxMultimodal

Sobre

Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward...

Modelos Relacionados

Meta: Llama Guard 4 12B2025-04-30 Meta: Llama Guard 4 12B (free)2025-04-30 Meta: Llama 4 Scout2025-04-05 Llama 4 Scout 17B 16E Instruct2025-04-02 Llama Guard 3 8B2025-02-12 Llama 3.3 Instruct 70B2024-12-06 Meta: Llama 3.3 70B Instruct2024-12-06 Meta: Llama 3.3 70B Instruct (free)2024-12-06

Índice de Qualidade

14.3

258th de 537

Top 49%

Índice de Código

16.3

264th de 447

Top 59%

Índice de Matemática

19.3

211th de 269

Top 78%

Preço/1M

$0.26

240th mais barato

52% abaixo da mediana

Top 36%

Velocidade

100 tok/s

Top 47%

TTFT

0.67s

Janela de Contexto

1.0M

17th maior

Top 10%

Posição no Mercado

Meta: Llama 4 MaverickMédia do Mercado

Preços

Entrada

$0.15

por 1M tokens

Saída

$0.60

por 1M tokens

Combinado

$0.26

por 1M tokens

Mais barato que 64% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.26

Mensal

$7.87

vs. Modelos Similares

Qwen: Qwen3 VL 235B A22B InstructQ:0.0

$0.37+41%

GPT-5 mini (minimal)Q:0.0

$0.69+162%

gpt-oss-20B (low)Q:0.0

$0.10-64%

Nova 2.0 Pro Preview (Non-reasoning)Q:+0.1

$3.44+1210%

Desempenho

100

tokens/seg

Mais rápido que 53% dos modelos

0.67

segundos

Mais rápido que 73% dos modelos

0.67

segundos

Mais rápido que 81% dos modelos

Mediana do Mercado

94 tok/s

6% mais rápido

TTFT Mediano

1.11s

40% mais rápido

Vazão/Dólar

383

tok/s por $/1M

Comparação de Velocidade

GPT-5 mini (minimal)

101 tok/s+1%

OpenAI: GPT-5.3-Codex

100 tok/s-1%

GPT-5.1 (Non-reasoning)

101 tok/s+1%

Janela de Contexto

1.0M

tokens

Maior que 90% dos modelos

Saída Máxima

16K

tokens

2% do contexto

Benchmarks

MMLU-Pro

80.9%

GPQA Diamond

67.1%

HLE

4.8%

LiveCodeBench

39.7%

SciCode

33.1%

TerminalBench Hard

6.8%

MATH-500

88.9%

AIME

39.0%

AIME 2025

19.3%

IFBench

43.0%

Long Context Recall

46.0%

Tau2

17.8%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Qwen: Qwen3 VL 235B A22B Instruct

Alibaba

Q: 14.3$0.37/1M262K ctx

Mais lento: 50%Mais caro: 41%

gpt-oss-20B (low)

OpenAI

Q: 14.3$0.10/1M

Mais rápido: 163%Mais barato: 64%

GPT-5 mini (minimal)

OpenAI

Q: 14.3$0.69/1M

Mais caro: 162%Código: +5.6

Nova 2.0 Pro Preview (Non-reasoning)

Amazon

Q: 14.4$3.44/1M

Mais rápido: 61%Mais caro: 1210%

MiniMax M1 40k

MiniMax

Q: 14.4N/A/1M

NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)

NVIDIA

Q: 14.2$0.10/1M

Mais lento: 32%Mais barato: 63%

Comparar todos os 7 modelos