Llama Nemotron Super 49B v1.5 (Non-reasoning)

NVIDIA·Lançado em 2025-07-25

Open Source

Modelos Relacionados

NVIDIA: Llama 3.3 Nemotron Super 49B V1.52025-10-10 Llama Nemotron Super 49B v1.5 (Reasoning)2025-07-25 Llama 3.1 Nemotron Nano VL 8B V12025-06-03 Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)2025-05-20 NVIDIA: Llama 3.1 Nemotron Ultra 253B v12025-04-08 Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)2025-04-07 Llama 3.3 Nemotron Super 49B v1 (Reasoning)2025-03-18 Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)2025-03-18

Índice de Qualidade

8.7

363rd de 537

Top 68%

Índice de Código

10.5

347th de 447

Top 78%

Índice de Matemática

8.0

235th de 269

Top 87%

Preço/1M

$0.17

178th mais barato

68% abaixo da mediana

Top 28%

Velocidade

52 tok/s

Top 79%

TTFT

0.26s

Posição no Mercado

Llama Nemotron Super 49B v1.5 (Non-reasoning)Média do Mercado

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.17

por 1M tokens

Mais barato que 72% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.17

Mensal

$5.25

vs. Modelos Similares

Llama 3.3 Instruct 70BQ:-0.1

$0.61+250%

Mistral Small 3.1Q:-0.1

$0.14-21%

OpenAI: GPT-4o (2024-05-13)Q:-0.1

$7.50+4186%

Qwen3 32B (Non-reasoning)Q:-0.1

$0.26+49%

Desempenho

tokens/seg

Mais rápido que 21% dos modelos

0.26

segundos

Mais rápido que 98% dos modelos

0.26

segundos

Mais rápido que 100% dos modelos

Mediana do Mercado

94 tok/s

44% mais lento

TTFT Mediano

1.10s

77% mais rápido

Vazão/Dólar

298

tok/s por $/1M

Comparação de Velocidade

Llama Nemotron Super 49B v1.5 (Reasoning)

52 tok/s-0%

Qwen: Qwen3.5 397B A17B

52 tok/s-0%

MiniMax M2.7

52 tok/s+0%

Benchmarks

MMLU-Pro

69.2%

GPQA Diamond

48.1%

HLE

4.3%

LiveCodeBench

29.0%

SciCode

23.8%

TerminalBench Hard

3.8%

MATH-500

77.0%

AIME

13.7%

AIME 2025

8.0%

IFBench

32.9%

Long Context Recall

22.0%

Tau2

25.1%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

OpenAI: GPT-4o (2024-05-13)

OpenAI

Q: 8.6$7.50/1M128K ctx

Mais rápido: 108%Mais caro: 4186%

Llama 3.3 Instruct 70B