Nemotron 3 Nano Omni 30B A3B Reasoning

NVIDIA·Lançado em 2026-04-29

Open Source

Modelos Relacionados

Nemotron 3 Ultra 550B A55B (Reasoning)2026-06-04 NVIDIA: Nemotron 3 Ultra2026-06-04 NVIDIA: Nemotron 3 Ultra (free)2026-06-04 NVIDIA: Nemotron 3.5 Content Safety (free)2026-06-04 NVIDIA: Nemotron 3 Nano Omni (free)2026-04-28 Nemotron Cascade 2 30B A3B2026-03-19 NVIDIA: Nemotron 3 Super2026-03-11 NVIDIA: Nemotron 3 Super (free)2026-03-11

Índice de Qualidade

14.9

253rd de 537

Top 47%

Índice de Código

14.8

279th de 447

Top 62%

Preço/1M

$0.13

139th mais barato

76% abaixo da mediana

Top 20%

Velocidade

298 tok/s

Top 4%

TTFT

0.59s

Posição no Mercado

Nemotron 3 Nano Omni 30B A3B ReasoningMédia do Mercado

Preços

Entrada

$0.07

por 1M tokens

Saída

$0.30

por 1M tokens

Combinado

$0.13

por 1M tokens

Mais barato que 80% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.13

Mensal

$3.93

vs. Modelos Similares

OpenAI: gpt-oss-20bQ:0.0

$0.06-57%

Mistral: Mistral Medium 3.1Q:-0.1

$0.80+511%

Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)Q:+0.2

$0.17+34%

GPT-5 (ChatGPT)Q:+0.4

$3.44+2524%

Desempenho

298

tokens/seg

Mais rápido que 96% dos modelos

0.59

segundos

Mais rápido que 78% dos modelos

7.30

segundos

Mais rápido que 43% dos modelos

Mediana do Mercado

94 tok/s

216% mais rápido

TTFT Mediano

1.11s

47% mais rápido

Vazão/Dólar

2274

tok/s por $/1M

Comparação de Velocidade

Llama 3.1 Nemotron Instruct 70B

301 tok/s+1%

OpenAI: gpt-oss-120b

307 tok/s+3%

Nova Micro

289 tok/s-3%

Benchmarks

MMLU-ProNão avaliado

GPQA Diamond

46.9%

HLE

5.3%

LiveCodeBenchNão avaliado

SciCode

27.8%

TerminalBench Hard

8.3%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025Não avaliado

IFBench

63.2%

Long Context Recall

35.7%

Tau2

45.3%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

OpenAI: gpt-oss-20b

OpenAI

Q: 14.9$0.06/1M131K ctx

Mais lento: 22%Mais barato: 57%

Mistral: Mistral Medium 3.1

Mistral

Q: 14.8$0.80/1M131K ctx

Mais lento: 71%Mais caro: 511%

Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)

Google

Q: 15.1$0.17/1M

Mais rápido: 16%Mais caro: 34%

Solar Open 100B (Reasoning)

Upstage

Q: 15.1N/A/1M

Código: -4.3

Grok 3 Reasoning Beta

xAI

Q: 15.1N/A/1M

GPT-5 (ChatGPT)

OpenAI

Q: 15.3$3.44/1M

Mais lento: 33%Mais caro: 2524%

Comparar todos os 7 modelos