Llama 3.1 Instruct 70B

Meta·Lançado em 2024-07-23

Open SourceMultimodal

Modelos Relacionados

Meta: Llama Guard 4 12B2025-04-30 Meta: Llama Guard 4 12B (free)2025-04-30 Meta: Llama 4 Maverick2025-04-05 Meta: Llama 4 Scout2025-04-05 Llama 4 Scout 17B 16E Instruct2025-04-02 Llama Guard 3 8B2025-02-12 Llama 3.3 Instruct 70B2024-12-06 Meta: Llama 3.3 70B Instruct2024-12-06

Índice de Qualidade

6.8

410th de 537

Top 77%

Índice de Código

10.9

340th de 447

Top 76%

Índice de Matemática

4.0

251st de 269

Top 93%

Preço/1M

$0.56

346th mais barato

3% acima da mediana

Top 51%

Velocidade

35 tok/s

Top 96%

TTFT

0.58s

Posição no Mercado

Llama 3.1 Instruct 70BMédia do Mercado

Preços

Entrada

$0.56

por 1M tokens

Saída

$0.56

por 1M tokens

Combinado

$0.56

por 1M tokens

Mais barato que 49% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.56

Mensal

$16.80

vs. Modelos Similares

Ministral 3 3BQ:0.0

$0.10-82%

Qwen3 30B A3B (Non-reasoning)Q:0.0

$0.13-76%

Qwen3 4B (Non-reasoning)Q:0.0

$0.19-66%

IBM: Granite 4.1 8BQ:-0.1

$0.06-89%

Desempenho

tokens/seg

Mais rápido que 4% dos modelos

0.58

segundos

Mais rápido que 79% dos modelos

0.58

segundos

Mais rápido que 85% dos modelos

Mediana do Mercado

94 tok/s

63% mais lento

TTFT Mediano

1.11s

48% mais rápido

Vazão/Dólar

tok/s por $/1M

Comparação de Velocidade

Kimi K2.5 (Non-reasoning)

35 tok/s+0%

Claude 4 Opus (Non-reasoning)

35 tok/s+1%

Gemma 4 31B (Reasoning)

35 tok/s+1%

Benchmarks

MMLU-Pro

67.6%

GPQA Diamond

40.9%

HLE

4.6%

LiveCodeBench

23.2%

SciCode

26.7%

TerminalBench Hard

3.0%

MATH-500

64.9%

AIME

17.3%

AIME 2025

4.0%

IFBench

34.4%

Long Context Recall

6.3%

Tau2

15.2%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Ministral 3 3B

Mistral

Q: 6.8$0.10/1M

Mais rápido: 378%Mais barato: 82%

DeepSeek-V2.5 (Dec '24)

DeepSeek

Q: 6.8N/A/1M

Qwen3 4B (Non-reasoning)

Alibaba

Q: 6.8$0.19/1M

Mais rápido: 197%Mais barato: 66%

Qwen3 30B A3B (Non-reasoning)

Alibaba

Q: 6.8$0.13/1M

Mais rápido: 218%Mais barato: 76%

IBM: Granite 4.1 8B

IBM

Q: 6.7$0.06/1M131K ctx

Mais rápido: 278%Mais barato: 89%

Google: Gemini 2.5 Flash Lite

Google

Q: 6.9$0.17/1M1.0M ctx

Mais rápido: 501%Mais barato: 69%

Comparar todos os 7 modelos