Modelos Relacionados
NVIDIA: Nemotron 3 Ultra2026-06-04NVIDIA: Nemotron 3 Ultra (free)2026-06-04NVIDIA: Nemotron 3.5 Content Safety (free)2026-06-04Nemotron 3 Nano Omni 30B A3B Reasoning2026-04-29NVIDIA: Nemotron 3 Nano Omni (free)2026-04-28Nemotron Cascade 2 30B A3B2026-03-19NVIDIA: Nemotron 3 Super2026-03-11NVIDIA: Nemotron 3 Super (free)2026-03-11
Preços
Entrada
$0.37
por 1M tokens
Saída
$1.08
por 1M tokens
Combinado
$0.55
por 1M tokens
Mais barato que 50% dos modelos. Preço mediano é $0.56/1M tokens.
Calculadora de Custo
Tokens por dia1M
100K100M
Diário
$0.55
Mensal
$16.41
vs. Modelos Similares
GPT-5.1 (high)Q:0.0
$3.44+529%
GPT-5.4 (low)Q:+0.2
$5.63+928%
Gemini 3 Pro Preview (high)Q:+0.7
$4.50+723%
Grok 4.20 0309 (Reasoning)Q:+0.8
$3.00+448%
Desempenho
390
tokens/seg
Mais rápido que 98% dos modelos
0.50
segundos
Mais rápido que 85% dos modelos
6.33
segundos
Mais rápido que 42% dos modelos
Mediana do Mercado
89 tok/s
338% mais rápido
TTFT Mediano
1.13s
55% mais rápido
Vazão/Dólar
713
tok/s por $/1M
Comparação de Velocidade
Step 3.7 Flash
400 tok/s+2%
Qwen3.5 2B
364 tok/s-7%
gpt-oss-120b (low)
363 tok/s-7%
Benchmarks
MMLU-ProNão avaliado
GPQA Diamond
86.7%
HLE
26.6%
LiveCodeBenchNão avaliado
SciCode
39.9%
TerminalBench Hard
36.4%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
81.4%
Long Context Recall
67.0%
Tau2
83.3%
Média do MercadoMelhor Score