Ir para o conteúdo principal
Voltar para Explorar

QwQ 32B

Alibaba·Lançado em 2025-03-05
Open Source131K ctx

Sobre

QwQ is the reasoning model of the Qwen series. Compared with conventional instruction-tuned models, QwQ, which is capable of thinking and reasoning, can achieve significantly enhanced performance in downstream tasks,...

Modelos Relacionados

Preços

Entrada

$0.66

por 1M tokens

Saída

$1.00

por 1M tokens

Combinado

$0.74

por 1M tokens

Mais barato que 45% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.74

Mensal

$22.35

vs. Modelos Similares

Qwen3 235B A22B (Reasoning)Q:0.0
$2.63+252%
Qwen3 VL 30B A3B (Reasoning)Q:-0.1
$0.34-55%
Qwen: Qwen3 Coder 30B A3B InstructQ:+0.2
$0.12-84%
Gemma 4 12B (Non-reasoning)Q:-0.2
$0.15-80%

Desempenho

32

tokens/seg

Mais rápido que 3% dos modelos

0.45

segundos

Mais rápido que 91% dos modelos

77.89

segundos

Mais rápido que 3% dos modelos

Mediana do Mercado

94 tok/s

66% mais lento

TTFT Mediano

1.10s

59% mais rápido

Vazão/Dólar

43

tok/s por $/1M

Comparação de Velocidade

Devstral Medium
33 tok/s+1%
OpenAI: o3 Pro
34 tok/s+4%
OpenAI: GPT-4
34 tok/s+6%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

131K

tokens

100% do contexto

Benchmarks

MMLU-Pro
76.4%
GPQA Diamond
59.3%
HLE
8.2%
LiveCodeBench
63.1%
SciCode
35.8%
TerminalBench HardNão avaliado
MATH-500
95.7%
AIME
78.0%
AIME 2025
29.0%
IFBench
38.8%
Long Context Recall
25.0%
Tau2Não avaliado
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos