Qwen: Qwen3.6 35B A3B

Alibaba·Lançado em 2026-04-27

Open Source35B262K ctxApache 2.0Multimodal

Comparar Testar modelo Ver repositório do modelo

Sobre

Qwen3.6-35B-A3B is an open-weight multimodal model from Alibaba Cloud with 35 billion total parameters and 3 billion active parameters per token. It uses a hybrid sparse mixture-of-experts architecture combining Gated...

Modelos Relacionados

Qwen: Qwen3.7 Plus2026-06-03 Qwen: Qwen3.7 Max2026-05-21 Qwen: Qwen3.6 27B2026-04-27 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22 Qwen3.6 Max Preview2026-04-20

Índice de Qualidade

31.6

93rd de 537

Top 17%

Índice de Código

41.9

67th de 447

Top 15%

Preço/1M

$0.35

282nd mais barato

35% abaixo da mediana

Top 42%

Velocidade

147 tok/s

Top 27%

TTFT

1.36s

Janela de Contexto

262K

110th maior

Top 38%

Posição no Mercado

Qwen: Qwen3.6 35B A3BMédia do Mercado

Preços

Entrada

$0.14

por 1M tokens

Saída

$1.00

por 1M tokens

Combinado

$0.35

por 1M tokens

Mais barato que 58% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.35

Mensal

$10.65

vs. Modelos Similares

Qwen: Qwen3 Max ThinkingQ:+0.1

$1.56+339%

MiniMax: MiniMax M2.1Q:-0.2

$0.45+28%

Qwen3.5 397B A17B (Non-reasoning)Q:+0.4

$1.35+280%

DeepSeek V4 Pro (Non-reasoning)Q:-0.4

$0.54+53%

Desempenho

147

tokens/seg

Mais rápido que 73% dos modelos

1.36

segundos

Mais rápido que 38% dos modelos

38.03

segundos

Mais rápido que 12% dos modelos

Mediana do Mercado

94 tok/s

56% mais rápido

TTFT Mediano

1.11s

23% mais lento

Vazão/Dólar

414

tok/s por $/1M

Comparação de Velocidade

GPT-3.5 Turbo

147 tok/s-0%

GLM-4.7-Flash (Non-reasoning)

148 tok/s+0%

Mistral Small 3

146 tok/s-1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

262K

tokens

100% do contexto

Benchmarks

MMLU-ProNão avaliado

GPQA Diamond

84.1%

HLE

20.2%

LiveCodeBenchNão avaliado

SciCode

35.8%

TerminalBench Hard

34.8%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025Não avaliado

IFBench

64.4%

Long Context Recall

63.7%

Tau2

95.3%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.035BGGUF / GPTQ / AWQ

Downloads

5.6M

Curtidas

2.3K

VRAM (FP16)

48-80 GB

GPU

A100 80GB

Comparação Rápida

Modelos Similares

Qwen: Qwen3 Max Thinking

Alibaba

Q: 31.7$1.56/1M262K ctx

Mais lento: 70%Mais caro: 339%

MiniMax: MiniMax M2.1

MiniMax

Q: 31.4$0.45/1M205K ctx

Mais rápido: 53%Mais caro: 28%

Qwen3.5 397B A17B (Non-reasoning)

Alibaba

Q: 32.0$1.35/1M

Mais lento: 64%Mais caro: 280%

GPT-5 (low)

OpenAI

Q: 31.2$3.44/1M

Mais lento: 46%Mais caro: 868%

MiMo-V2-Flash (Reasoning)

Xiaomi

Q: 31.2$0.15/1M

Mais lento: 38%Mais barato: 58%

DeepSeek V4 Pro (Non-reasoning)

DeepSeek

Q: 31.2$0.54/1M

Mais lento: 43%Mais caro: 53%

Comparar todos os 7 modelos