Llama 3.2 Instruct 3B

Meta·Released 2024-09-25

Open SourceMultimodal

Compare

Quality Index

4.2

462nd of 537

Top 86%

Math Index

3.3

253rd of 269

Top 95%

Price/1M

$0.15

159th cheapest

72% below median

Top 25%

Speed

52 tok/s

Top 80%

TTFT

0.63s

Market Position

Llama 3.2 Instruct 3BMarket Average

Pricing

Input

$0.15

per 1M tokens

Output

$0.15

per 1M tokens

Blended

$0.15

per 1M tokens

Cheaper than 75% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.15

Monthly

$4.50

vs. Similar Models

Llama 2 Chat 7BQ:+0.1

$0.10-33%

Reka Flash 3Q:-0.1

$0.13-17%

Mistral LargeQ:+0.2

$3.00+1900%

Qwen3.5 0.8B (Non-reasoning)Q:+0.2

$0.02-87%

Performance

tokens/sec

Faster than 20% of models

0.63

seconds

Faster than 74% of models

0.63

seconds

Faster than 82% of models

Market Median

94 tok/s

45% slower

Median TTFT

1.10s

43% faster

Throughput/Dollar

346

tok/s per $/1M

Speed Comparison

Qwen3.5 397B A17B (Non-reasoning)

52 tok/s-0%

Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

52 tok/s-0%

Claude 4.5 Sonnet (Non-reasoning)

52 tok/s-0%

Benchmarks

MMLU-Pro

34.7%

GPQA Diamond

25.5%

HLE

5.2%

LiveCodeBench

8.3%

SciCode

5.2%

TerminalBench HardNot evaluated

MATH-500

48.9%

AIME

6.7%

AIME 2025

3.3%

IFBench

26.2%

Long Context Recall

2.0%

Tau2

21.1%

Market AverageTop Score

Open Source

Quick Compare

Similar Models

MiniCPM-V 4.6 1.3B

OpenBMB

Q: 4.2N/A/1M

Llama 2 Chat 7B

Llama 3.2 Instruct 3B

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position