Qwen: Qwen3 VL 32B Instruct

Alibaba·Lançado em 2025-10-23

Open Source32B262K ctxApache 2.0Multimodal

Comparar Testar modelo Ver repositório do modelo

Sobre

Qwen3-VL-32B-Instruct is a large-scale multimodal vision-language model designed for high-precision understanding and reasoning across text, images, and video. With 32 billion parameters, it combines deep visual perception with advanced text...

Modelos Relacionados

Qwen: Qwen3.7 Plus2026-06-03 Qwen: Qwen3.7 Max2026-05-21 Qwen: Qwen3.6 27B2026-04-27 Qwen: Qwen3.6 35B A3B2026-04-27 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22

Índice de Qualidade

11.1

309th de 537

Top 58%

Índice de Código

15.6

273rd de 447

Top 61%

Índice de Matemática

68.3

100th de 269

Top 37%

Preço/1M

$0.18

195th mais barato

67% abaixo da mediana

Top 29%

Velocidade

69 tok/s

Top 65%

TTFT

1.13s

Janela de Contexto

262K

110th maior

Top 38%

Posição no Mercado

Qwen: Qwen3 VL 32B InstructMédia do Mercado

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.42

por 1M tokens

Combinado

$0.18

por 1M tokens

Mais barato que 71% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.18

Mensal

$5.46

vs. Modelos Similares

Ministral 3 14BQ:0.0

$0.20+10%

OpenAI: GPT-4oQ:+0.1

$4.38+2304%

DeepSeek R1 Distill Qwen 32BQ:-0.1

$0.29+59%

Z.ai: GLM 4.6VQ:-0.1

$0.45+147%

Desempenho

tokens/seg

Mais rápido que 35% dos modelos

1.13

segundos

Mais rápido que 48% dos modelos

1.13

segundos

Mais rápido que 64% dos modelos

Mediana do Mercado

94 tok/s

26% mais lento

TTFT Mediano

1.10s

3% mais lento

Vazão/Dólar

380

tok/s por $/1M

Comparação de Velocidade

Apriel-v1.6-15B-Thinker

69 tok/s-1%

GPT-5.5 (low)

69 tok/s-1%

Cohere: Command A

70 tok/s+1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

33K

tokens

13% do contexto

Benchmarks

MMLU-Pro

79.1%

GPQA Diamond

67.1%

HLE

6.3%

LiveCodeBench

51.4%

SciCode

30.1%

TerminalBench Hard

8.3%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

68.3%

IFBench

39.2%

Long Context Recall

31.3%

Tau2

29.2%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.032BGGUF / GPTQ / AWQ

Downloads

5.6M

Curtidas

207

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

Ministral 3 14B

Mistral

Q: 11.1$0.20/1M

Mais rápido: 21%

Z.ai: GLM 4.6V

Z AI

Q: 11.0$0.45/1M131K ctx

Mais lento: 32%Mais caro: 147%

DeepSeek R1 Distill Qwen 32B

DeepSeek

Q: 11.0$0.29/1M128K ctx

Mais lento: 38%Mais caro: 59%

OpenAI: GPT-4o

OpenAI

Q: 11.2$4.38/1M128K ctx

Mais rápido: 214%Mais caro: 2304%

Qwen3 235B A22B (Non-reasoning)

Alibaba

Q: 10.9$0.79/1M

Mais caro: 332%

Gemini 2.5 Flash-Lite (Reasoning)

Google

Q: 11.4$0.17/1M

Mais rápido: 290%Código: -6.1

Comparar todos os 7 modelos