Ir para o conteúdo principal
Voltar para Explorar

DeepSeek R1 Distill Qwen 32B

DeepSeek·Lançado em 2025-01-20
Open Source32B128K ctxMITMoE

Sobre

DeepSeek R1 Distill Qwen 32B is a distilled large language model based on [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new...

Preços

Entrada

$0.29

por 1M tokens

Saída

$0.29

por 1M tokens

Combinado

$0.29

por 1M tokens

Mais barato que 63% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.29

Mensal

$8.70

vs. Modelos Similares

Z.ai: GLM 4.6VQ:0.0
$0.45+55%
Qwen: Qwen3 VL 32B InstructQ:+0.1
$0.18-37%
Ministral 3 14BQ:+0.1
$0.20-31%
Qwen3 235B A22B (Non-reasoning)Q:-0.1
$0.79+171%

Desempenho

43

tokens/seg

Mais rápido que 11% dos modelos

0.45

segundos

Mais rápido que 91% dos modelos

47.11

segundos

Mais rápido que 8% dos modelos

Mediana do Mercado

94 tok/s

54% mais lento

TTFT Mediano

1.10s

60% mais rápido

Vazão/Dólar

148

tok/s por $/1M

Comparação de Velocidade

MiMo-V2-Pro
43 tok/s-1%
QwQ 32B-Preview
43 tok/s+1%
Xiaomi: MiMo-V2.5-Pro
43 tok/s+1%

Janela de Contexto

128K

tokens

Maior que 16% dos modelos

Saída Máxima

33K

tokens

26% do contexto

Benchmarks

MMLU-Pro
73.9%
GPQA Diamond
61.5%
HLE
5.5%
LiveCodeBench
27.0%
SciCode
37.6%
TerminalBench HardNão avaliado
MATH-500
94.1%
AIME
68.7%
AIME 2025
63.0%
IFBench
22.9%
Long Context Recall
9.7%
Tau2Não avaliado
Média do MercadoMelhor Score
mit32BGGUF / GPTQ / AWQ
Downloads

843.8K

Curtidas

1.6K

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos