Modelos Relacionados
Nemotron 3 Ultra 550B A55B (Reasoning)2026-06-04NVIDIA: Nemotron 3 Ultra2026-06-04NVIDIA: Nemotron 3 Ultra (free)2026-06-04NVIDIA: Nemotron 3.5 Content Safety (free)2026-06-04NVIDIA: Nemotron 3 Nano Omni (free)2026-04-28Nemotron Cascade 2 30B A3B2026-03-19NVIDIA: Nemotron 3 Super2026-03-11NVIDIA: Nemotron 3 Super (free)2026-03-11
Preços
Entrada
$0.07
por 1M tokens
Saída
$0.30
por 1M tokens
Combinado
$0.13
por 1M tokens
Mais barato que 80% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Tokens por dia1M
100K100M
Diário
$0.13
Mensal
$3.93
vs. Modelos Similares
OpenAI: gpt-oss-20bQ:0.0
$0.06-57%
Mistral: Mistral Medium 3.1Q:-0.1
$0.80+511%
Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)Q:+0.2
$0.17+34%
GPT-5 (ChatGPT)Q:+0.4
$3.44+2524%
Desempenho
298
tokens/seg
Mais rápido que 96% dos modelos
0.59
segundos
Mais rápido que 78% dos modelos
7.30
segundos
Mais rápido que 43% dos modelos
Mediana do Mercado
94 tok/s
216% mais rápido
TTFT Mediano
1.11s
47% mais rápido
Vazão/Dólar
2274
tok/s por $/1M
Comparação de Velocidade
Llama 3.1 Nemotron Instruct 70B
301 tok/s+1%
OpenAI: gpt-oss-120b
307 tok/s+3%
Nova Micro
289 tok/s-3%
Benchmarks
MMLU-ProNão avaliado
GPQA Diamond
46.9%
HLE
5.3%
LiveCodeBenchNão avaliado
SciCode
27.8%
TerminalBench Hard
8.3%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
63.2%
Long Context Recall
35.7%
Tau2
45.3%
Média do MercadoMelhor Score