Llama 3.1 Nemotron Instruct 70B

NVIDIA·Lançado em 2024-10-15

Open Source

Modelos Relacionados

NVIDIA: Llama 3.3 Nemotron Super 49B V1.52025-10-10 Llama Nemotron Super 49B v1.5 (Reasoning)2025-07-25 Llama Nemotron Super 49B v1.5 (Non-reasoning)2025-07-25 Llama 3.1 Nemotron Nano VL 8B V12025-06-03 Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)2025-05-20 NVIDIA: Llama 3.1 Nemotron Ultra 253B v12025-04-08 Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)2025-04-07 Llama 3.3 Nemotron Super 49B v1 (Reasoning)2025-03-18

Índice de Qualidade

7.6

391st de 537

Top 73%

Índice de Código

10.8

342nd de 447

Top 77%

Índice de Matemática

11.0

230th de 269

Top 86%

Preço/1M

$1.20

456th mais barato

121% acima da mediana

Top 67%

Velocidade

301 tok/s

Top 4%

TTFT

4.06s

Posição no Mercado

Llama 3.1 Nemotron Instruct 70BMédia do Mercado

Preços

Entrada

$1.20

por 1M tokens

Saída

$1.20

por 1M tokens

Combinado

$1.20

por 1M tokens

Mais barato que 33% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$1.20

Mensal

$36.00

vs. Modelos Similares

Cohere: Command AQ:+0.1

$4.38+265%

Nova ProQ:+0.1

$1.40+17%

Gemma 3 27B InstructQ:-0.2

$0.14-88%

NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)Q:-0.2

$0.09-93%

Desempenho

301

tokens/seg

Mais rápido que 96% dos modelos

4.06

segundos

Mais rápido que 18% dos modelos

4.06

segundos

Mais rápido que 48% dos modelos

Mediana do Mercado

94 tok/s

219% mais rápido

TTFT Mediano

1.11s

265% mais lento

Vazão/Dólar

251

tok/s por $/1M

Comparação de Velocidade

Nemotron 3 Nano Omni 30B A3B Reasoning

298 tok/s-1%

OpenAI: gpt-oss-120b

307 tok/s+2%

Nova Micro

289 tok/s-4%

Benchmarks

MMLU-Pro

69.0%

GPQA Diamond

46.5%

HLE

4.6%

LiveCodeBench

16.9%

SciCode

23.3%

TerminalBench Hard

4.5%

MATH-500

73.3%

AIME

24.7%

AIME 2025

11.0%

IFBench

30.7%

Long Context Recall

7.0%

Tau2

23.1%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Grok Beta

xAI

Q: 7.5N/A/1M

Qwen2.5 Instruct 32B

Alibaba

Q: 7.5N/A/1M

Cohere: Command A

Cohere

Q: 7.7$4.38/1M256K ctx

Mais lento: 79%Mais caro: 265%

Nova Pro

Amazon

Q: 7.7$1.40/1M

Mais caro: 17%

Gemma 3 27B Instruct

Google

Q: 7.4$0.14/1M

Mais lento: 88%Mais barato: 88%

NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

NVIDIA

Q: 7.4$0.09/1M

Mais lento: 72%Mais barato: 93%

Comparar todos os 7 modelos