DeepSeek: R1 Distill Llama 70B — DeepSeek | FindLLM

DeepSeek: R1 Distill Llama 70B

DeepSeek·Lançado em 2025-01-23

Open Source131K ctxMoE

Sobre

DeepSeek R1 Distill Llama 70B is a distilled large language model based on [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across...

Índice de Qualidade

16.0

302nd de 507

Top 60%

Índice de Código

11.4

300th de 417

Top 72%

Índice de Matemática

53.7

133rd de 269

Top 50%

Preço/1M

$0.72

346th mais barato

29% acima da mediana

Top 54%

Velocidade

44 tok/s

Top 85%

TTFT

0.38s

Janela de Contexto

131K

201st maior

Top 67%

Posição no Mercado

DeepSeek: R1 Distill Llama 70BMédia do Mercado

Preços

Entrada

$0.70

por 1M tokens

Saída

$0.80

por 1M tokens

Combinado

$0.72

por 1M tokens

Mais barato que 46% dos modelos. Preço mediano é $0.56/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.72

Mensal

$21.75

vs. Modelos Similares

Hermes 4 - Llama-3.1 70B (Reasoning)Q:0.0

$0.20-73%

Ministral 3 14BQ:0.0

$0.20-72%

Claude 3.5 Sonnet (Oct '24)Q:-0.1

$6.56+805%

Qwen: Qwen3 VL 30B A3B InstructQ:+0.1

$0.23-69%

Desempenho

tokens/seg

Mais rápido que 15% dos modelos

0.38

segundos

Mais rápido que 92% dos modelos

45.45

segundos

Mais rápido que 11% dos modelos

Mediana do Mercado

86 tok/s

48% mais lento

TTFT Mediano

1.07s

65% mais rápido

Vazão/Dólar

tok/s por $/1M

Comparação de Velocidade

Microsoft: Phi 4 Mini Instruct

45 tok/s+0%

Qwen3 Max Thinking (Preview)

45 tok/s+1%

Qwen: Qwen3 Max Thinking

44 tok/s-2%

Janela de Contexto

131K

tokens

Maior que 33% dos modelos

Saída Máxima

16K

tokens

13% do contexto

Benchmarks

MMLU-Pro

79.5%

GPQA Diamond

40.2%

HLE

6.1%

LiveCodeBench

26.6%

SciCode

31.2%

TerminalBench Hard

1.5%

MATH-500

93.5%

AIME

67.0%

AIME 2025

53.7%

IFBench

27.6%

Long Context Recall

11.0%

Tau2

21.9%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Ministral 3 14B

Mistral

Q: 16.0$0.20/1M

Mais rápido: 229%Mais barato: 72%

Hermes 4 - Llama-3.1 70B (Reasoning)

Nous Research

Q: 16.0$0.20/1M

Mais rápido: 76%Mais barato: 73%

Gemini 1.5 Pro (Sep '24)

Google

Q: 16.0N/A/1M

Código: +12.2

Solar Pro 2 (Preview) (Non-reasoning)

Upstage

Q: 16.0N/A/1M

Claude 3.5 Sonnet (Oct '24)

Anthropic

Q: 15.9$6.56/1M

Mais caro: 805%Código: +18.8

Qwen: Qwen3 VL 30B A3B Instruct

Alibaba

Q: 16.1$0.23/1M131K ctx

Mais rápido: 180%Mais barato: 69%

Comparar todos os 7 modelos