Modelos Relacionados
Preços
Entrada
$2.75
por 1M tokens
Saída
$8.10
por 1M tokens
Combinado
$4.09
por 1M tokens
Mais barato que 15% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Tokens por dia1M
100K100M
Diário
$4.09
Mensal
$122.64
vs. Modelos Similares
GPT-3.5 TurboQ:0.0
$0.75-82%
Mistral Small (Feb '24)Q:0.0
$1.50-63%
Llama 3 Instruct 70BQ:-0.1
$1.18-71%
Gemma 3 12B InstructQ:-0.2
$0.14-97%
Desempenho
94
tokens/seg
Mais rápido que 50% dos modelos
0.59
segundos
Mais rápido que 78% dos modelos
0.59
segundos
Mais rápido que 85% dos modelos
Mediana do Mercado
94 tok/s
0% mais rápido
TTFT Mediano
1.10s
47% mais rápido
Vazão/Dólar
23
tok/s por $/1M
Comparação de Velocidade
Qwen3 32B (Reasoning)
94 tok/s+0%
GPT-5 (low)
94 tok/s-0%
OpenAI: GPT-5.1
94 tok/s-0%
Benchmarks
MMLU-Pro
49.1%
GPQA Diamond
34.9%
HLE
3.4%
LiveCodeBench
9.9%
SciCode
11.8%
TerminalBench HardNão avaliado
MATH-500
40.5%
AIME
3.7%
AIME 2025Não avaliado
IFBenchNão avaliado
Long Context RecallNão avaliado
Tau2Não avaliado
Média do MercadoMelhor Score