Meta: Llama 4 Scout

Meta·Lançado em 2025-04-05

Open Source10.0M ctxMultimodal

Sobre

Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B. It supports native multimodal input...

Modelos Relacionados

Meta: Llama Guard 4 12B2025-04-30 Meta: Llama Guard 4 12B (free)2025-04-30 Meta: Llama 4 Maverick2025-04-05 Llama 4 Scout 17B 16E Instruct2025-04-02 Llama Guard 3 8B2025-02-12 Llama 3.3 Instruct 70B2024-12-06 Meta: Llama 3.3 70B Instruct2024-12-06 Meta: Llama 3.3 70B Instruct (free)2024-12-06

Índice de Qualidade

10.0

326th de 537

Top 61%

Índice de Código

8.2

374th de 447

Top 84%

Índice de Matemática

14.0

221st de 269

Top 83%

Preço/1M

$0.15

159th mais barato

72% abaixo da mediana

Top 25%

Velocidade

109 tok/s

Top 42%

TTFT

0.61s

Janela de Contexto

10.0M

1st maior

Top 0%

Posição no Mercado

Meta: Llama 4 ScoutMédia do Mercado

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.30

por 1M tokens

Combinado

$0.15

por 1M tokens

Mais barato que 75% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.15

Mensal

$4.50

vs. Modelos Similares

Qwen: Qwen3 VL 30B A3B InstructQ:0.0

$0.23+52%

Hermes 4 - Llama-3.1 70B (Reasoning)Q:0.0

$0.20+32%

Qwen3 14B (Reasoning)Q:+0.1

$0.73+387%

Claude 3.5 Sonnet (Oct '24)Q:-0.1

$6.00+3900%

Desempenho

109

tokens/seg

Mais rápido que 58% dos modelos

0.61

segundos

Mais rápido que 76% dos modelos

0.61

segundos

Mais rápido que 83% dos modelos

Mediana do Mercado

94 tok/s

16% mais rápido

TTFT Mediano

1.11s

45% mais rápido

Vazão/Dólar

730

tok/s por $/1M

Comparação de Velocidade

Llama 3.2 Instruct 11B (Vision)

110 tok/s+0%

GPT-5.4 (low)

109 tok/s-0%

Kwaipilot: KAT-Coder-Pro V2

109 tok/s-0%

Janela de Contexto

10.0M

tokens

Maior que 100% dos modelos

Saída Máxima

16K

tokens

0% do contexto

Benchmarks

MMLU-Pro

75.2%

GPQA Diamond

58.7%

HLE

4.3%

LiveCodeBench

29.9%

SciCode

17.0%

TerminalBench Hard

1.5%

MATH-500

84.4%

AIME

28.3%

AIME 2025

14.0%

IFBench

39.5%

Long Context Recall

25.8%

Tau2

15.5%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Qwen: Qwen3 VL 30B A3B Instruct

Alibaba

Q: 10.0$0.23/1M262K ctx

Mais caro: 52%Código: +6.1

Hermes 4 - Llama-3.1 70B (Reasoning)

Nous Research

Q: 10.0$0.20/1M

Mais lento: 17%Mais caro: 32%

Gemini 1.5 Pro (Sep '24)

Google

Q: 10.0N/A/1M

Código: +15.4

Solar Pro 2 (Preview) (Non-reasoning)

Upstage

Q: 10.0N/A/1M

DeepSeek: R1 Distill Llama 70B

DeepSeek

Q: 9.9$0.80/1M128K ctx

Mais lento: 39%Mais caro: 433%

Nanbeige4.1-3B

Nanbeige

Q: 10.1N/A/1M

Comparar todos os 7 modelos