Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

NVIDIA·Lançado em 2025-04-07

Open Source

Modelos Relacionados

NVIDIA: Llama 3.3 Nemotron Super 49B V1.52025-10-10 Llama Nemotron Super 49B v1.5 (Reasoning)2025-07-25 Llama Nemotron Super 49B v1.5 (Non-reasoning)2025-07-25 Llama 3.1 Nemotron Nano VL 8B V12025-06-03 Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)2025-05-20 NVIDIA: Llama 3.1 Nemotron Ultra 253B v12025-04-08 Llama 3.3 Nemotron Super 49B v1 (Reasoning)2025-03-18 Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)2025-03-18

Índice de Qualidade

9.1

346th de 537

Top 65%

Índice de Código

13.1

315th de 447

Top 71%

Índice de Matemática

63.7

108th de 269

Top 41%

Preço/1M

$0.90

425th mais barato

66% acima da mediana

Top 62%

Velocidade

52 tok/s

Top 82%

TTFT

0.71s

Posição no Mercado

Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)Média do Mercado

Preços

Entrada

$0.60

por 1M tokens

Saída

$1.80

por 1M tokens

Combinado

$0.90

por 1M tokens

Mais barato que 38% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.90

Mensal

$27.00

vs. Modelos Similares

GLM-4.5V (Reasoning)Q:0.0

$0.900%

Mistral Large 2 (Nov '24)Q:0.0

$3.00+233%

Mistral Small 3.2Q:0.0

$0.13-86%

Qwen3 30B A3B 2507 InstructQ:0.0

$0.21-76%

Desempenho

tokens/seg

Mais rápido que 18% dos modelos

0.71

segundos

Mais rápido que 70% dos modelos

39.30

segundos

Mais rápido que 11% dos modelos

Mediana do Mercado

94 tok/s

45% mais lento

TTFT Mediano

1.11s

36% mais rápido

Vazão/Dólar

tok/s por $/1M

Comparação de Velocidade

Qwen: Qwen3.5 397B A17B

52 tok/s+0%

Claude 4.5 Sonnet (Reasoning)

52 tok/s-0%

Ling-flash-2.0

52 tok/s+0%

Benchmarks

MMLU-Pro

82.5%

GPQA Diamond

72.8%

HLE

8.1%

LiveCodeBench

64.1%

SciCode

34.7%

TerminalBench Hard

2.3%

MATH-500

95.2%

AIME

74.7%

AIME 2025

63.7%

IFBench

38.2%

Long Context Recall

7.3%

Tau2

11.4%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Mistral Large 2 (Nov '24)

Mistral

Q: 9.1$3.00/1M

Mais caro: 233%

Mistral Small 3.2

Mistral

Q: 9.1$0.13/1M

Mais rápido: 193%Mais barato: 86%

GLM-4.5V (Reasoning)

Z AI

Q: 9.1$0.90/1M

Qwen3 30B A3B 2507 Instruct

Alibaba

Q: 9.1$0.21/1M

Mais rápido: 221%Mais barato: 76%

ERNIE 4.5 300B A47B

Baidu

Q: 9.0$0.48/1M131K ctx

Mais lento: 54%Mais barato: 46%

Ministral 3 8B

Mistral

Q: 9.0$0.15/1M

Mais rápido: 60%Mais barato: 83%

Comparar todos os 7 modelos