Ir para o conteúdo principal
Voltar para Explorar

Meta: Llama 4 Maverick

Meta·Lançado em 2025-04-05
Open Source1.0M ctxMultimodal

Sobre

Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward...

Preços

Entrada

$0.15

por 1M tokens

Saída

$0.60

por 1M tokens

Combinado

$0.26

por 1M tokens

Mais barato que 64% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.26

Mensal

$7.87

vs. Modelos Similares

Qwen: Qwen3 VL 235B A22B InstructQ:0.0
$0.37+41%
GPT-5 mini (minimal)Q:0.0
$0.69+162%
gpt-oss-20B (low)Q:0.0
$0.10-64%
Nova 2.0 Pro Preview (Non-reasoning)Q:+0.1
$3.44+1210%

Desempenho

100

tokens/seg

Mais rápido que 53% dos modelos

0.67

segundos

Mais rápido que 73% dos modelos

0.67

segundos

Mais rápido que 81% dos modelos

Mediana do Mercado

94 tok/s

6% mais rápido

TTFT Mediano

1.11s

40% mais rápido

Vazão/Dólar

383

tok/s por $/1M

Comparação de Velocidade

GPT-5 mini (minimal)
101 tok/s+1%
OpenAI: GPT-5.3-Codex
100 tok/s-1%
GPT-5.1 (Non-reasoning)
101 tok/s+1%

Janela de Contexto

1.0M

tokens

Maior que 90% dos modelos

Saída Máxima

16K

tokens

2% do contexto

Benchmarks

MMLU-Pro
80.9%
GPQA Diamond
67.1%
HLE
4.8%
LiveCodeBench
39.7%
SciCode
33.1%
TerminalBench Hard
6.8%
MATH-500
88.9%
AIME
39.0%
AIME 2025
19.3%
IFBench
43.0%
Long Context Recall
46.0%
Tau2
17.8%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos