Ir para o conteúdo principal
Voltar para Explorar

Nemotron 3 Nano Omni 30B A3B Reasoning

NVIDIA·Lançado em 2026-04-29
Open Source

Preços

Entrada

$0.07

por 1M tokens

Saída

$0.30

por 1M tokens

Combinado

$0.13

por 1M tokens

Mais barato que 80% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.13

Mensal

$3.93

vs. Modelos Similares

OpenAI: gpt-oss-20bQ:0.0
$0.06-57%
Mistral: Mistral Medium 3.1Q:-0.1
$0.80+511%
Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)Q:+0.2
$0.17+34%
GPT-5 (ChatGPT)Q:+0.4
$3.44+2524%

Desempenho

298

tokens/seg

Mais rápido que 96% dos modelos

0.59

segundos

Mais rápido que 78% dos modelos

7.30

segundos

Mais rápido que 43% dos modelos

Mediana do Mercado

94 tok/s

216% mais rápido

TTFT Mediano

1.11s

47% mais rápido

Vazão/Dólar

2274

tok/s por $/1M

Comparação de Velocidade

Llama 3.1 Nemotron Instruct 70B
301 tok/s+1%
OpenAI: gpt-oss-120b
307 tok/s+3%
Nova Micro
289 tok/s-3%

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
46.9%
HLE
5.3%
LiveCodeBenchNão avaliado
SciCode
27.8%
TerminalBench Hard
8.3%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
63.2%
Long Context Recall
35.7%
Tau2
45.3%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos