Ir para o conteúdo principal
Voltar para Explorar

Llama 3.2 Instruct 3B

Meta·Lançado em 2024-09-25
Open SourceMultimodal

Preços

Entrada

$0.15

por 1M tokens

Saída

$0.15

por 1M tokens

Combinado

$0.15

por 1M tokens

Mais barato que 75% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.15

Mensal

$4.50

vs. Modelos Similares

Llama 2 Chat 7BQ:+0.1
$0.10-33%
Reka Flash 3Q:-0.1
$0.13-17%
Mistral LargeQ:+0.2
$3.00+1900%
Qwen3.5 0.8B (Non-reasoning)Q:+0.2
$0.02-87%

Desempenho

52

tokens/seg

Mais rápido que 19% dos modelos

0.62

segundos

Mais rápido que 75% dos modelos

0.62

segundos

Mais rápido que 83% dos modelos

Mediana do Mercado

94 tok/s

45% mais lento

TTFT Mediano

1.11s

44% mais rápido

Vazão/Dólar

347

tok/s por $/1M

Comparação de Velocidade

Llama Nemotron Super 49B v1.5 (Non-reasoning)
52 tok/s+0%
MoonshotAI: Kimi K2.7 Code
52 tok/s-0%
Ling-flash-2.0
52 tok/s-0%

Benchmarks

MMLU-Pro
34.7%
GPQA Diamond
25.5%
HLE
5.2%
LiveCodeBench
8.3%
SciCode
5.2%
TerminalBench HardNão avaliado
MATH-500
48.9%
AIME
6.7%
AIME 2025
3.3%
IFBench
26.2%
Long Context Recall
2.0%
Tau2
21.1%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos