Ir para o conteúdo principal
Voltar para Explorar

Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

NVIDIA·Lançado em 2025-04-07
Open Source

Preços

Entrada

$0.60

por 1M tokens

Saída

$1.80

por 1M tokens

Combinado

$0.90

por 1M tokens

Mais barato que 38% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.90

Mensal

$27.00

vs. Modelos Similares

GLM-4.5V (Reasoning)Q:0.0
$0.900%
Mistral Large 2 (Nov '24)Q:0.0
$3.00+233%
Mistral Small 3.2Q:0.0
$0.13-86%
Qwen3 30B A3B 2507 InstructQ:0.0
$0.21-76%

Desempenho

52

tokens/seg

Mais rápido que 18% dos modelos

0.71

segundos

Mais rápido que 70% dos modelos

39.30

segundos

Mais rápido que 11% dos modelos

Mediana do Mercado

94 tok/s

45% mais lento

TTFT Mediano

1.11s

36% mais rápido

Vazão/Dólar

58

tok/s por $/1M

Comparação de Velocidade

Qwen: Qwen3.5 397B A17B
52 tok/s+0%
Claude 4.5 Sonnet (Reasoning)
52 tok/s-0%
Ling-flash-2.0
52 tok/s+0%

Benchmarks

MMLU-Pro
82.5%
GPQA Diamond
72.8%
HLE
8.1%
LiveCodeBench
64.1%
SciCode
34.7%
TerminalBench Hard
2.3%
MATH-500
95.2%
AIME
74.7%
AIME 2025
63.7%
IFBench
38.2%
Long Context Recall
7.3%
Tau2
11.4%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos