Ir para o conteúdo principal
Voltar para Explorar

Nemotron 3 Ultra 550B A55B (Reasoning)

NVIDIA·Lançado em 2026-06-04
Open Source

Preços

Entrada

$0.37

por 1M tokens

Saída

$1.08

por 1M tokens

Combinado

$0.55

por 1M tokens

Mais barato que 50% dos modelos. Preço mediano é $0.56/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.55

Mensal

$16.41

vs. Modelos Similares

GPT-5.1 (high)Q:0.0
$3.44+529%
GPT-5.4 (low)Q:+0.2
$5.63+928%
Gemini 3 Pro Preview (high)Q:+0.7
$4.50+723%
Grok 4.20 0309 (Reasoning)Q:+0.8
$3.00+448%

Desempenho

390

tokens/seg

Mais rápido que 98% dos modelos

0.50

segundos

Mais rápido que 85% dos modelos

6.33

segundos

Mais rápido que 42% dos modelos

Mediana do Mercado

89 tok/s

338% mais rápido

TTFT Mediano

1.13s

55% mais rápido

Vazão/Dólar

713

tok/s por $/1M

Comparação de Velocidade

Step 3.7 Flash
400 tok/s+2%
Qwen3.5 2B
364 tok/s-7%
gpt-oss-120b (low)
363 tok/s-7%

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
86.7%
HLE
26.6%
LiveCodeBenchNão avaliado
SciCode
39.9%
TerminalBench Hard
36.4%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
81.4%
Long Context Recall
67.0%
Tau2
83.3%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos