Meta: Llama 4 Scout

Meta·Released 2025-04-05

Open Source328K ctxMultimodal

About

Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B. It supports native multimodal input...

Quality Index

13.5

359th of 507

Top 71%

Coding Index

6.7

359th of 417

Top 87%

Math Index

14.0

221st of 269

Top 83%

Price/1M

$0.14

132nd cheapest

76% below median

Top 21%

Speed

123 tok/s

Top 33%

TTFT

0.56s

Context Window

328K

87th largest

Top 21%

Market Position

Meta: Llama 4 ScoutMarket Average

Pricing

Input

$0.08

per 1M tokens

Output

$0.30

per 1M tokens

Blended

$0.14

per 1M tokens

Cheaper than 79% of models. Median price is $0.56/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.14

Monthly

$4.05

vs. Similar Models

Cohere: Command AQ:0.0

$4.38+3141%

Nova ProQ:0.0

$1.40+937%

Llama 3.1 Nemotron Instruct 70BQ:-0.1

$1.20+789%

OpenAI: GPT-4 TurboQ:+0.2

$15.00+11011%

Performance

123

tokens/sec

Faster than 67% of models

0.56

seconds

Faster than 77% of models

0.56

seconds

Faster than 84% of models

Market Median

86 tok/s

43% faster

Median TTFT

1.07s

47% faster

Throughput/Dollar

912

tok/s per $/1M

Speed Comparison

OpenAI: GPT-5 Nano

123 tok/s+0%

Google: Gemini 2.5 Pro

124 tok/s+0%

NVIDIA Nemotron Nano 9B V2 (Reasoning)

124 tok/s+1%

Context Window

328K

tokens

Larger than 79% of models

Max Output

16K

tokens

5% of context

Benchmarks

MMLU-Pro

75.2%

GPQA Diamond

58.7%

HLE

4.3%

LiveCodeBench

29.9%

SciCode

17.0%

TerminalBench Hard

1.5%

MATH-500

84.4%

AIME

28.3%

AIME 2025

14.0%

IFBench

39.5%

Long Context Recall

25.8%

Tau2

15.5%

Market AverageTop Score

Open Source

Quick Compare

Similar Models

Cohere: Command A

Cohere

Q: 13.5$4.38/1M256K ctx

Slower: 65%Pricier: 3141%

Nova Pro

Amazon

Q: 13.5$1.40/1M

Pricier: 937%Coding: +4.3

Solar Pro 2 (Non-reasoning)

Upstage

Q: 13.6N/A/1M

Coding: +4.6

Llama 3.1 Nemotron Instruct 70B

NVIDIA

Q: 13.4$1.20/1M

Faster: 130%Pricier: 789%

OpenAI: GPT-4 Turbo

OpenAI

Q: 13.7$15.00/1M128K ctx

Slower: 74%Pricier: 11011%

Grok Beta

xAI

Q: 13.3N/A/1M

Compare all 7 models

Quality Index

13.5

359th of 507

Top 71%

Coding Index

6.7

359th of 417

Top 87%

Math Index

14.0

221st of 269

Top 83%

Price/1M

$0.14

132nd cheapest

76% below median

Top 21%

Speed

123 tok/s

Top 33%

TTFT

0.56s

Context Window

328K

87th largest

Top 21%

Market Position

Meta: Llama 4 ScoutMarket Average

Meta: Llama 4 Scout

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position