Llama 3.3 Instruct 70B

Meta·Lançado em 2024-12-06

Open SourceMultimodal

Modelos Relacionados

Meta: Llama Guard 4 12B2025-04-30 Meta: Llama Guard 4 12B (free)2025-04-30 Meta: Llama 4 Maverick2025-04-05 Meta: Llama 4 Scout2025-04-05 Llama 4 Scout 17B 16E Instruct2025-04-02 Llama Guard 3 8B2025-02-12 Meta: Llama 3.3 70B Instruct2024-12-06 Meta: Llama 3.3 70B Instruct (free)2024-12-06

Índice de Qualidade

8.6

364th de 537

Top 69%

Índice de Código

10.7

344th de 447

Top 77%

Índice de Matemática

7.7

236th de 269

Top 88%

Preço/1M

$0.61

353rd mais barato

13% acima da mediana

Top 52%

Velocidade

86 tok/s

Top 54%

TTFT

0.66s

Posição no Mercado

Llama 3.3 Instruct 70BMédia do Mercado

Preços

Entrada

$0.58

por 1M tokens

Saída

$0.71

por 1M tokens

Combinado

$0.61

por 1M tokens

Mais barato que 48% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.61

Mensal

$18.36

vs. Modelos Similares

Mistral Small 3.1Q:0.0

$0.14-77%

OpenAI: GPT-4o (2024-05-13)Q:0.0

$7.50+1125%

Qwen3 32B (Non-reasoning)Q:0.0

$0.26-58%

Llama Nemotron Super 49B v1.5 (Non-reasoning)Q:+0.1

$0.17-71%

Desempenho

tokens/seg

Mais rápido que 46% dos modelos

0.66

segundos

Mais rápido que 73% dos modelos

0.66

segundos

Mais rápido que 81% dos modelos

Mediana do Mercado

94 tok/s

8% mais lento

TTFT Mediano

1.10s

41% mais rápido

Vazão/Dólar

140

tok/s por $/1M

Comparação de Velocidade

MiMo-V2-Omni

86 tok/s-0%

Llama 3.2 Instruct 1B

86 tok/s+0%

Ring-flash-2.0

86 tok/s+1%

Benchmarks

MMLU-Pro

71.3%

GPQA Diamond

49.8%

HLE

4.0%

LiveCodeBench

28.8%

SciCode

26.0%

TerminalBench Hard

3.0%

MATH-500

77.3%

AIME

30.0%

AIME 2025

7.7%

IFBench

47.1%

Long Context Recall

15.0%

Tau2

26.6%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

OpenAI: GPT-4o (2024-05-13)

OpenAI

Q: 8.6$7.50/1M128K ctx

Mais rápido: 26%Mais caro: 1125%

K2-V2 (low)

MBZUAI

Q: 8.6N/A/1M

Gemini 2.0 Flash-Lite (Preview)

Google

Q: 8.6N/A/1M

Mistral Small 3.1

Mistral

Q: 8.6$0.14/1M

Mais rápido: 64%Mais barato: 77%

Qwen3 32B (Non-reasoning)

Alibaba

Q: 8.6$0.26/1M

Mais barato: 58%

Llama 3.1 Instruct 405B