Ir para o conteúdo principal
Voltar para Explorar

DeepSeek: R1 Distill Llama 70B

DeepSeek·Lançado em 2025-01-23
Open Source128K ctxMoE

Sobre

DeepSeek R1 Distill Llama 70B is a distilled large language model based on [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across...

Preços

Entrada

$0.80

por 1M tokens

Saída

$0.80

por 1M tokens

Combinado

$0.80

por 1M tokens

Mais barato que 43% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.80

Mensal

$24.00

vs. Modelos Similares

Claude 3.5 Sonnet (Oct '24)Q:0.0
$6.00+650%
Qwen: Qwen3 VL 30B A3B InstructQ:+0.1
$0.23-72%
Hermes 4 - Llama-3.1 70B (Reasoning)Q:+0.1
$0.20-75%
Meta: Llama 4 ScoutQ:+0.1
$0.15-81%

Desempenho

62

tokens/seg

Mais rápido que 31% dos modelos

0.43

segundos

Mais rápido que 93% dos modelos

32.55

segundos

Mais rápido que 15% dos modelos

Mediana do Mercado

94 tok/s

34% mais lento

TTFT Mediano

1.10s

61% mais rápido

Vazão/Dólar

78

tok/s por $/1M

Comparação de Velocidade

GPT-5.5 (Non-reasoning)
62 tok/s+0%
Qwen3 14B (Reasoning)
62 tok/s-0%
GLM-5.1 (Non-reasoning)
62 tok/s-1%

Janela de Contexto

128K

tokens

Maior que 16% dos modelos

Saída Máxima

8K

tokens

6% do contexto

Benchmarks

MMLU-Pro
79.5%
GPQA Diamond
40.2%
HLE
6.1%
LiveCodeBench
26.6%
SciCode
31.3%
TerminalBench Hard
1.5%
MATH-500
93.5%
AIME
67.0%
AIME 2025
53.7%
IFBench
27.6%
Long Context Recall
11.0%
Tau2
21.9%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos