Qwen3 32B (Non-reasoning)

Alibaba·Lançado em 2025-04-28

Open Source

Modelos Relacionados

Qwen: Qwen3.7 Plus2026-06-03 Qwen: Qwen3.7 Max2026-05-21 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22 Qwen3.6 27B2026-04-21 Qwen3.6 Max Preview2026-04-20

Índice de Qualidade

8.6

364th de 537

Top 69%

Índice de Matemática

19.7

210th de 269

Top 78%

Preço/1M

$0.26

235th mais barato

52% abaixo da mediana

Top 34%

Velocidade

91 tok/s

Top 52%

TTFT

1.33s

Posição no Mercado

Qwen3 32B (Non-reasoning)Média do Mercado

Preços

Entrada

$0.15

por 1M tokens

Saída

$0.59

por 1M tokens

Combinado

$0.26

por 1M tokens

Mais barato que 66% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.26

Mensal

$7.80

vs. Modelos Similares

Llama 3.3 Instruct 70BQ:0.0

$0.61+135%

Mistral Small 3.1Q:0.0

$0.14-47%

OpenAI: GPT-4o (2024-05-13)Q:0.0

$7.50+2785%

Llama Nemotron Super 49B v1.5 (Non-reasoning)Q:+0.1

$0.17-33%

Desempenho

tokens/seg

Mais rápido que 48% dos modelos

1.33

segundos

Mais rápido que 40% dos modelos

1.33

segundos

Mais rápido que 60% dos modelos

Mediana do Mercado

94 tok/s

3% mais lento

TTFT Mediano

1.10s

21% mais lento

Vazão/Dólar

350

tok/s por $/1M

Comparação de Velocidade

Hermes 4 - Llama-3.1 70B (Non-reasoning)

90 tok/s-0%

Qwen3.5 27B (Non-reasoning)

90 tok/s-1%

Grok 4 Fast (Reasoning)

90 tok/s-1%

Benchmarks

MMLU-Pro

72.7%

GPQA Diamond

53.5%

HLE

4.3%

LiveCodeBench

28.8%

SciCode

28.0%

TerminalBench HardNão avaliado

MATH-500

86.9%

AIME

30.3%

AIME 2025

19.7%

IFBench

31.5%

Long Context Recall

0.0%

Tau2Não avaliado

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

OpenAI: GPT-4o (2024-05-13)

OpenAI

Q: 8.6$7.50/1M128K ctx

Mais rápido: 19%Mais caro: 2785%

Llama 3.3 Instruct 70B