QwQ 32B

Alibaba·Lançado em 2025-03-05

Open Source131K ctx

Sobre

QwQ is the reasoning model of the Qwen series. Compared with conventional instruction-tuned models, QwQ, which is capable of thinking and reasoning, can achieve significantly enhanced performance in downstream tasks,...

Modelos Relacionados

QwQ 32B-Preview2024-11-27

Índice de Qualidade

13.4

272nd de 537

Top 51%

Índice de Matemática

29.0

188th de 269

Top 70%

Preço/1M

$0.74

377th mais barato

37% acima da mediana

Top 55%

Velocidade

32 tok/s

Top 98%

TTFT

0.47s

Janela de Contexto

131K

236th maior

Top 73%

Posição no Mercado

QwQ 32BMédia do Mercado

Preços

Entrada

$0.66

por 1M tokens

Saída

$1.00

por 1M tokens

Combinado

$0.74

por 1M tokens

Mais barato que 45% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.74

Mensal

$22.35

vs. Modelos Similares

Qwen3 235B A22B (Reasoning)Q:0.0

$2.63+252%

Qwen3 VL 30B A3B (Reasoning)Q:-0.1

$0.34-55%

Qwen: Qwen3 Coder 30B A3B InstructQ:+0.2

$0.12-84%

Gemma 4 12B (Non-reasoning)Q:-0.2

$0.15-80%

Desempenho

tokens/seg

Mais rápido que 2% dos modelos

0.47

segundos

Mais rápido que 90% dos modelos

77.77

segundos

Mais rápido que 2% dos modelos

Mediana do Mercado

94 tok/s

66% mais lento

TTFT Mediano

1.11s

58% mais rápido

Vazão/Dólar

tok/s por $/1M

Comparação de Velocidade

Qwen3.5 0.8B (Non-reasoning)

30 tok/s-6%

OpenAI: o3 Pro

34 tok/s+6%

Gemma 3 4B Instruct

34 tok/s+6%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

131K

tokens

100% do contexto

Benchmarks

MMLU-Pro

76.4%

GPQA Diamond

59.3%

HLE

8.2%

LiveCodeBench

63.1%

SciCode

35.8%

TerminalBench HardNão avaliado

MATH-500

95.7%

AIME

78.0%

AIME 2025

29.0%

IFBench

38.8%

Long Context Recall

25.0%

Tau2Não avaliado

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Qwen3 235B A22B (Reasoning)

Alibaba

Q: 13.4$2.63/1M

Mais rápido: 105%Mais caro: 252%

Gemini 2.0 Flash Thinking Experimental (Jan '25)

Google

Q: 13.3N/A/1M

Qwen3 VL 30B A3B (Reasoning)

Alibaba

Q: 13.3$0.34/1M

Mais rápido: 286%Mais barato: 55%

Qwen: Qwen3 Coder 30B A3B Instruct

Alibaba

Q: 13.6$0.12/1M160K ctx

Mais rápido: 244%Mais barato: 84%

Tri-21B-think Preview

Trillion Labs

Q: 13.6N/A/1M

GPT-4.5 (Preview)

OpenAI

Q: 13.6N/A/1M

Comparar todos os 7 modelos