DeepSeek R1 Distill Qwen 32B

DeepSeek·Lançado em 2025-01-20

Open Source32B128K ctxMITMoE

Comparar Testar modelo Ver repositório do modelo

Sobre

DeepSeek R1 Distill Qwen 32B is a distilled large language model based on [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new...

Modelos Relacionados

DeepSeek: DeepSeek V4 Pro2026-04-24 DeepSeek V4 Pro (Reasoning, High Effort)2026-04-24 DeepSeek: DeepSeek V4 Flash2026-04-24 DeepSeek V4 Flash (Reasoning, High Effort)2026-04-24 DeepSeek V4 Pro (Non-reasoning)2026-04-24 DeepSeek V4 Flash (Non-reasoning)2026-04-24 DeepSeek: DeepSeek V4 Flash (free)2026-04-24 DeepSeek V3.2 (Reasoning)2025-12-01

Índice de Qualidade

11.0

311th de 537

Top 58%

Índice de Matemática

63.0

111th de 269

Top 41%

Preço/1M

$0.29

254th mais barato

47% abaixo da mediana

Top 37%

Velocidade

43 tok/s

Top 91%

TTFT

0.45s

Janela de Contexto

128K

329th maior

Top 84%

Posição no Mercado

DeepSeek R1 Distill Qwen 32BMédia do Mercado

Preços

Entrada

$0.29

por 1M tokens

Saída

$0.29

por 1M tokens

Combinado

$0.29

por 1M tokens

Mais barato que 63% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.29

Mensal

$8.70

vs. Modelos Similares

Z.ai: GLM 4.6VQ:0.0

$0.45+55%

Qwen: Qwen3 VL 32B InstructQ:+0.1

$0.18-37%

Ministral 3 14BQ:+0.1

$0.20-31%

Qwen3 235B A22B (Non-reasoning)Q:-0.1

$0.79+171%

Desempenho

tokens/seg

Mais rápido que 9% dos modelos

0.45

segundos

Mais rápido que 91% dos modelos

47.11

segundos

Mais rápido que 7% dos modelos

Mediana do Mercado

94 tok/s

55% mais lento

TTFT Mediano

1.11s

60% mais rápido

Vazão/Dólar

148

tok/s por $/1M

Comparação de Velocidade

QwQ 32B-Preview

43 tok/s+1%

Claude Opus 4.7 (Non-reasoning, High Effort)

42 tok/s-2%

OpenAI: GPT-4

42 tok/s-2%

Janela de Contexto

128K

tokens

Maior que 16% dos modelos

Saída Máxima

33K

tokens

26% do contexto

Benchmarks

MMLU-Pro

73.9%

GPQA Diamond

61.5%

HLE

5.5%

LiveCodeBench

27.0%

SciCode

37.6%

TerminalBench HardNão avaliado

MATH-500

94.1%

AIME

68.7%

AIME 2025

63.0%

IFBench

22.9%

Long Context Recall

9.7%

Tau2Não avaliado

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

mit32BGGUF / GPTQ / AWQ

Downloads

843.8K

Curtidas

1.6K

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

Z.ai: GLM 4.6V

Z AI

Q: 11.0$0.45/1M131K ctx

Mais caro: 55%

Qwen: Qwen3 VL 32B Instruct

Alibaba

Q: 11.1$0.18/1M262K ctx

Mais rápido: 68%Mais barato: 37%

Ministral 3 14B

Mistral

Q: 11.1$0.20/1M

Mais rápido: 100%Mais barato: 31%

Qwen3 235B A22B (Non-reasoning)

Alibaba

Q: 10.9$0.79/1M

Mais rápido: 45%Mais caro: 171%

OpenAI: GPT-4o

OpenAI

Q: 11.2$4.38/1M128K ctx

Mais rápido: 419%Mais caro: 1409%

Magistral Small 1.2

Mistral

Q: 11.3$0.75/1M

Mais rápido: 88%Mais caro: 159%

Comparar todos os 7 modelos