Ir para o conteúdo principal
Voltar para Explorar

Llama 3.1 Instruct 70B

Meta·Lançado em 2024-07-23
Open SourceMultimodal

Preços

Entrada

$0.56

por 1M tokens

Saída

$0.56

por 1M tokens

Combinado

$0.56

por 1M tokens

Mais barato que 49% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.56

Mensal

$16.80

vs. Modelos Similares

Ministral 3 3BQ:0.0
$0.10-82%
Qwen3 30B A3B (Non-reasoning)Q:0.0
$0.13-76%
Qwen3 4B (Non-reasoning)Q:0.0
$0.19-66%
IBM: Granite 4.1 8BQ:-0.1
$0.06-89%

Desempenho

34

tokens/seg

Mais rápido que 4% dos modelos

0.59

segundos

Mais rápido que 78% dos modelos

0.59

segundos

Mais rápido que 85% dos modelos

Mediana do Mercado

94 tok/s

63% mais lento

TTFT Mediano

1.10s

46% mais rápido

Vazão/Dólar

61

tok/s por $/1M

Comparação de Velocidade

Gemma 3 4B Instruct
34 tok/s-0%
Claude 4 Opus (Reasoning)
34 tok/s+0%
OpenAI: GPT-4
34 tok/s-1%

Benchmarks

MMLU-Pro
67.6%
GPQA Diamond
40.9%
HLE
4.6%
LiveCodeBench
23.2%
SciCode
26.7%
TerminalBench Hard
3.0%
MATH-500
64.9%
AIME
17.3%
AIME 2025
4.0%
IFBench
34.4%
Long Context Recall
6.3%
Tau2
15.2%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos