Ir para o conteúdo principal
Voltar para Explorar

Qwen: Qwen3.5-9B

Alibaba·Lançado em 2026-03-10
Open Source9B262K ctxApache 2.0Multimodal

Sobre

Qwen3.5-9B is a multimodal foundation model from the Qwen3.5 family, designed to deliver strong reasoning, coding, and visual understanding in an efficient 9B-parameter architecture. It uses a unified vision-language design...

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.15

por 1M tokens

Combinado

$0.11

por 1M tokens

Mais barato que 82% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.11

Mensal

$3.37

vs. Modelos Similares

Google: Gemini 3.1 Flash Lite PreviewQ:0.0
$0.56+400%
Qwen3 Max Thinking (Preview)Q:0.0
$2.40+2033%
GLM-4.6 (Reasoning)Q:+0.1
$0.96+756%
Gemma 4 31B (Non-reasoning)Q:-0.2
$0.20+82%

Desempenho

58

tokens/seg

Mais rápido que 27% dos modelos

0.72

segundos

Mais rápido que 70% dos modelos

35.12

segundos

Mais rápido que 14% dos modelos

Mediana do Mercado

94 tok/s

38% mais lento

TTFT Mediano

1.10s

35% mais rápido

Vazão/Dólar

517

tok/s por $/1M

Comparação de Velocidade

Gemma 4 31B (Non-reasoning)
58 tok/s-0%
Qwen3 VL 235B A22B (Reasoning)
59 tok/s+1%
Anthropic: Claude Opus 4.8
57 tok/s-1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

262K

tokens

100% do contexto

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
80.6%
HLE
13.3%
LiveCodeBenchNão avaliado
SciCode
27.5%
TerminalBench Hard
24.2%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
66.7%
Long Context Recall
59.0%
Tau2
86.8%
Média do MercadoMelhor Score
apache-2.09BGGUF / GPTQ / AWQ
Downloads

9.4M

Curtidas

1.6K

VRAM (FP16)

16-24 GB

GPU

RTX 4090 / M2 Max

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos