Ir para o conteúdo principal
Voltar para Explorar

Llama 3.2 Instruct 3B

Meta·Lançado em 2024-09-25
Open SourceMultimodal

Preços

Entrada

$0.15

por 1M tokens

Saída

$0.15

por 1M tokens

Combinado

$0.15

por 1M tokens

Mais barato que 75% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.15

Mensal

$4.50

vs. Modelos Similares

Llama 2 Chat 7BQ:+0.1
$0.10-33%
Reka Flash 3Q:-0.1
$0.13-17%
Mistral LargeQ:+0.2
$3.00+1900%
Qwen3.5 0.8B (Non-reasoning)Q:+0.2
$0.02-87%

Desempenho

52

tokens/seg

Mais rápido que 17% dos modelos

0.59

segundos

Mais rápido que 77% dos modelos

0.59

segundos

Mais rápido que 83% dos modelos

Mediana do Mercado

97 tok/s

47% mais lento

TTFT Mediano

1.12s

48% mais rápido

Vazão/Dólar

346

tok/s por $/1M

Comparação de Velocidade

Qwen3.5 397B A17B (Non-reasoning)
52 tok/s-0%
Qwen: Qwen3.6 Plus
52 tok/s-1%
Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)
52 tok/s+1%

Benchmarks

MMLU-Pro
34.7%
GPQA Diamond
25.5%
HLE
5.2%
LiveCodeBench
8.3%
SciCode
5.2%
TerminalBench HardNão avaliado
MATH-500
48.9%
AIME
6.7%
AIME 2025
3.3%
IFBench
26.2%
Long Context Recall
2.0%
Tau2
21.1%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos