Llama 3.2 Instruct 3B

Meta·Lançado em 2024-09-25

Open SourceMultimodal

Modelos Relacionados

Meta: Llama Guard 4 12B2025-04-30 Meta: Llama Guard 4 12B (free)2025-04-30 Meta: Llama 4 Maverick2025-04-05 Meta: Llama 4 Scout2025-04-05 Llama 4 Scout 17B 16E Instruct2025-04-02 Llama Guard 3 8B2025-02-12 Llama 3.3 Instruct 70B2024-12-06 Meta: Llama 3.3 70B Instruct2024-12-06

Índice de Qualidade

4.2

462nd de 537

Top 86%

Índice de Matemática

3.3

253rd de 269

Top 95%

Preço/1M

$0.15

159th mais barato

72% abaixo da mediana

Top 25%

Velocidade

52 tok/s

Top 81%

TTFT

0.62s

Posição no Mercado

Llama 3.2 Instruct 3BMédia do Mercado

Preços

Entrada

$0.15

por 1M tokens

Saída

$0.15

por 1M tokens

Combinado

$0.15

por 1M tokens

Mais barato que 75% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.15

Mensal

$4.50

vs. Modelos Similares

Llama 2 Chat 7BQ:+0.1

$0.10-33%

Reka Flash 3Q:-0.1

$0.13-17%

Mistral LargeQ:+0.2

$3.00+1900%

Qwen3.5 0.8B (Non-reasoning)Q:+0.2

$0.02-87%

Desempenho

tokens/seg

Mais rápido que 19% dos modelos

0.62

segundos

Mais rápido que 75% dos modelos

0.62

segundos

Mais rápido que 83% dos modelos

Mediana do Mercado

94 tok/s

45% mais lento

TTFT Mediano

1.11s

44% mais rápido

Vazão/Dólar

347

tok/s por $/1M

Comparação de Velocidade

Llama Nemotron Super 49B v1.5 (Non-reasoning)

52 tok/s+0%

MoonshotAI: Kimi K2.7 Code

52 tok/s-0%

Ling-flash-2.0

52 tok/s-0%

Benchmarks

MMLU-Pro

34.7%

GPQA Diamond

25.5%

HLE

5.2%

LiveCodeBench

8.3%

SciCode

5.2%

TerminalBench HardNão avaliado

MATH-500

48.9%

AIME

6.7%

AIME 2025

3.3%

IFBench

26.2%

Long Context Recall

2.0%

Tau2

21.1%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

MiniCPM-V 4.6 1.3B

OpenBMB

Q: 4.2N/A/1M

Llama 2 Chat 7B