Modelos Relacionados
Preços
Entrada
$0.10
por 1M tokens
Saída
$0.23
por 1M tokens
Combinado
$0.14
por 1M tokens
Mais barato que 78% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Tokens por dia1M
100K100M
Diário
$0.14
Mensal
$4.14
vs. Modelos Similares
Llama 3.3 Instruct 70BQ:0.0
$0.61+343%
OpenAI: GPT-4o (2024-05-13)Q:0.0
$7.50+5335%
Qwen3 32B (Non-reasoning)Q:0.0
$0.26+88%
Llama Nemotron Super 49B v1.5 (Non-reasoning)Q:+0.1
$0.17+27%
Desempenho
141
tokens/seg
Mais rápido que 70% dos modelos
0.54
segundos
Mais rápido que 83% dos modelos
0.54
segundos
Mais rápido que 89% dos modelos
Mediana do Mercado
94 tok/s
51% mais rápido
TTFT Mediano
1.10s
51% mais rápido
Vazão/Dólar
1023
tok/s por $/1M
Comparação de Velocidade
Qwen3.5 9B (Non-reasoning)
141 tok/s+0%
Google: Gemini 2.5 Pro
141 tok/s-0%
OpenAI: o1
140 tok/s-1%
Benchmarks
MMLU-Pro
65.9%
GPQA Diamond
45.4%
HLE
4.8%
LiveCodeBench
21.2%
SciCode
26.5%
TerminalBench Hard
7.6%
MATH-500
70.7%
AIME
9.3%
AIME 2025
3.7%
IFBench
29.9%
Long Context Recall
19.7%
Tau2
25.1%
Média do MercadoMelhor Score