Qwen: Qwen3.5-35B-A3B

Alibaba·Lançado em 2026-02-25

Open Source35B262K ctxApache 2.0Multimodal

Comparar Testar modelo Ver repositório do modelo

Sobre

The Qwen3.5 Series 35B-A3B is a native vision-language model designed with a hybrid architecture that integrates linear attention mechanisms and a sparse mixture-of-experts model, achieving higher inference efficiency. Its overall...

Modelos Relacionados

Qwen: Qwen3.7 Plus2026-06-03 Qwen: Qwen3.7 Max2026-05-21 Qwen: Qwen3.6 27B2026-04-27 Qwen: Qwen3.6 35B A3B2026-04-27 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22

Índice de Qualidade

29.3

114th de 537

Top 22%

Índice de Código

30.3

146th de 447

Top 33%

Preço/1M

$0.35

282nd mais barato

35% abaixo da mediana

Top 42%

Velocidade

163 tok/s

Top 22%

TTFT

1.17s

Janela de Contexto

262K

110th maior

Top 38%

Posição no Mercado

Qwen: Qwen3.5-35B-A3BMédia do Mercado

Preços

Entrada

$0.14

por 1M tokens

Saída

$1.00

por 1M tokens

Combinado

$0.35

por 1M tokens

Mais barato que 58% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.35

Mensal

$10.65

vs. Modelos Similares

Claude 4.5 Sonnet (Non-reasoning)Q:0.0

$6.00+1590%

Qwen3.5 27B (Non-reasoning)Q:0.0

$0.88+146%

Qwen3.6 27B (Non-reasoning)Q:0.0

$1.35+280%

Gemma 4 31B (Reasoning)Q:+0.1

$0.20-42%

Desempenho

163

tokens/seg

Mais rápido que 78% dos modelos

1.17

segundos

Mais rápido que 46% dos modelos

13.43

segundos

Mais rápido que 36% dos modelos

Mediana do Mercado

95 tok/s

72% mais rápido

TTFT Mediano

1.11s

6% mais lento

Vazão/Dólar

460

tok/s por $/1M

Comparação de Velocidade

GPT-5.4 mini (Non-Reasoning)

162 tok/s-0%

OpenAI: GPT-5.4 Nano

164 tok/s+0%

MiniMax: MiniMax M2.5

164 tok/s+1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

82K

tokens

31% do contexto

Benchmarks

MMLU-ProNão avaliado

GPQA Diamond

84.5%

HLE

19.7%

LiveCodeBenchNão avaliado

SciCode

37.7%

TerminalBench Hard

26.5%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025Não avaliado

IFBench

72.5%

Long Context Recall

62.7%

Tau2

89.2%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.035BGGUF / GPTQ / AWQ

Downloads

2.1M

Curtidas

1.4K

VRAM (FP16)

48-80 GB

GPU

A100 80GB

Comparação Rápida

Modelos Similares

Qwen3.5 27B (Non-reasoning)

Alibaba

Q: 29.3$0.88/1M

Mais lento: 45%Mais caro: 146%

Claude 4.5 Sonnet (Non-reasoning)

Anthropic

Q: 29.3$6.00/1M

Mais lento: 70%Mais caro: 1590%

Qwen3.6 27B (Non-reasoning)

Alibaba

Q: 29.3$1.35/1M

Mais lento: 67%Mais caro: 280%

Command A+

Cohere

Q: 29.3N/A/1M

Kimi K2.5 (Non-reasoning)

Kimi

Q: 29.4$1.20/1M

Mais lento: 78%Mais caro: 238%

Gemma 4 31B (Reasoning)

Google

Q: 29.4$0.20/1M

Mais lento: 78%Mais barato: 42%

Comparar todos os 7 modelos