Qwen: Qwen3.5-9B

Alibaba·Lançado em 2026-03-10

Open Source9B262K ctxApache 2.0Multimodal

Comparar Testar modelo Ver repositório do modelo

Sobre

Qwen3.5-9B is a multimodal foundation model from the Qwen3.5 family, designed to deliver strong reasoning, coding, and visual understanding in an efficient 9B-parameter architecture. It uses a unified vision-language design...

Modelos Relacionados

Qwen: Qwen3.7 Plus2026-06-03 Qwen: Qwen3.7 Max2026-05-21 Qwen: Qwen3.6 27B2026-04-27 Qwen: Qwen3.6 35B A3B2026-04-27 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22

Índice de Qualidade

25.0

147th de 537

Top 28%

Índice de Código

28.7

161st de 447

Top 36%

Preço/1M

$0.11

123rd mais barato

79% abaixo da mediana

Top 18%

Velocidade

58 tok/s

Top 73%

TTFT

0.72s

Janela de Contexto

262K

110th maior

Top 38%

Posição no Mercado

Qwen: Qwen3.5-9BMédia do Mercado

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.15

por 1M tokens

Combinado

$0.11

por 1M tokens

Mais barato que 82% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.11

Mensal

$3.37

vs. Modelos Similares

Google: Gemini 3.1 Flash Lite PreviewQ:0.0

$0.56+400%

Qwen3 Max Thinking (Preview)Q:0.0

$2.40+2033%

GLM-4.6 (Reasoning)Q:+0.1

$0.96+756%

Gemma 4 31B (Non-reasoning)Q:-0.2

$0.20+82%

Desempenho

tokens/seg

Mais rápido que 27% dos modelos

0.72

segundos

Mais rápido que 70% dos modelos

35.12

segundos

Mais rápido que 14% dos modelos

Mediana do Mercado

94 tok/s

38% mais lento

TTFT Mediano

1.10s

35% mais rápido

Vazão/Dólar

517

tok/s por $/1M

Comparação de Velocidade

Gemma 4 31B (Non-reasoning)

58 tok/s-0%

Qwen3 VL 235B A22B (Reasoning)

59 tok/s+1%

Anthropic: Claude Opus 4.8

57 tok/s-1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

262K

tokens

100% do contexto

Benchmarks

MMLU-ProNão avaliado

GPQA Diamond

80.6%

HLE

13.3%

LiveCodeBenchNão avaliado

SciCode

27.5%

TerminalBench Hard

24.2%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025Não avaliado

IFBench

66.7%

Long Context Recall

59.0%

Tau2

86.8%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.09BGGUF / GPTQ / AWQ

Downloads

9.4M

Curtidas

1.6K

VRAM (FP16)

16-24 GB

GPU

RTX 4090 / M2 Max

Comparação Rápida

Modelos Similares

Google: Gemini 3.1 Flash Lite Preview

Google

Q: 25.0$0.56/1M1.0M ctx

Mais rápido: 457%Mais caro: 400%

Qwen3 Max Thinking (Preview)

Alibaba

Q: 25.0$2.40/1M

Mais caro: 2033%Código: -4.2

GLM-4.6 (Reasoning)

Z AI

Q: 25.1$0.96/1M

Mais caro: 756%

Gemma 4 31B (Non-reasoning)

Google

Q: 24.8$0.20/1M

Mais caro: 82%Código: +5.2

Grok 4.3 (Non-reasoning)

xAI

Q: 24.8$1.56/1M

Mais rápido: 108%Mais caro: 1289%

Inception: Mercury 2

Inception

Q: 25.3$0.38/1M128K ctx

Mais rápido: 1687%Mais caro: 233%

Comparar todos os 7 modelos