Ir para o conteúdo principal
Voltar para Explorar

Llama Nemotron Super 49B v1.5 (Non-reasoning)

NVIDIA·Lançado em 2025-07-25
Open Source

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.17

por 1M tokens

Mais barato que 72% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.17

Mensal

$5.25

vs. Modelos Similares

Llama 3.3 Instruct 70BQ:-0.1
$0.61+250%
Mistral Small 3.1Q:-0.1
$0.14-21%
OpenAI: GPT-4o (2024-05-13)Q:-0.1
$7.50+4186%
Qwen3 32B (Non-reasoning)Q:-0.1
$0.26+49%

Desempenho

52

tokens/seg

Mais rápido que 21% dos modelos

0.26

segundos

Mais rápido que 98% dos modelos

0.26

segundos

Mais rápido que 100% dos modelos

Mediana do Mercado

94 tok/s

44% mais lento

TTFT Mediano

1.10s

77% mais rápido

Vazão/Dólar

298

tok/s por $/1M

Comparação de Velocidade

Llama Nemotron Super 49B v1.5 (Reasoning)
52 tok/s-0%
Qwen: Qwen3.5 397B A17B
52 tok/s-0%
MiniMax M2.7
52 tok/s+0%

Benchmarks

MMLU-Pro
69.2%
GPQA Diamond
48.1%
HLE
4.3%
LiveCodeBench
29.0%
SciCode
23.8%
TerminalBench Hard
3.8%
MATH-500
77.0%
AIME
13.7%
AIME 2025
8.0%
IFBench
32.9%
Long Context Recall
22.0%
Tau2
25.1%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos