Voltar para Explorar
NVIDIA: Llama 3.3 Nemotron Super 49B V1.5
NVIDIA·Lançado em 2025-10-10
Open Source49B131K ctxother
Sobre
Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...
Modelos Relacionados
Llama Nemotron Super 49B v1.5 (Reasoning)2025-07-25Llama Nemotron Super 49B v1.5 (Non-reasoning)2025-07-25Llama 3.1 Nemotron Nano VL 8B V12025-06-03Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)2025-05-20NVIDIA: Llama 3.1 Nemotron Ultra 253B v12025-04-08Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)2025-04-07Llama 3.3 Nemotron Super 49B v1 (Reasoning)2025-03-18Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)2025-03-18
Preços
Entrada
$0.40
por 1M tokens
Saída
$0.40
por 1M tokens
Combinado
$0.40
por 1M tokens
Mais barato que 55% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Tokens por dia1M
100K100M
Diário
$0.40
Mensal
$12.00
vs. Modelos Similares
Meta: Llama 3.1 70B Instruct
$0.400%
TheDrummer: UnslopNemo 12B
$0.400%
Qwen3 4B (Reasoning)
$0.40-0%
Qwen3 1.7B (Reasoning)
$0.40-0%
Desempenho
Janela de Contexto
131K
tokens
Maior que 27% dos modelos
Saída Máxima
16K
tokens
13% do contexto
Comparação de Janela de Contexto
DeepSeek: DeepSeek V3.2
131KIgual
OpenAI: gpt-oss-120b
131KIgual
MoonshotAI: Kimi K2 0711
131KIgual
Open Source
other49BGGUF / GPTQ / AWQ
Downloads
821.3K
Curtidas
233
VRAM (FP16)
48-80 GB
GPU
A100 80GB