Ir para o conteúdo principal
Voltar para Explorar

Qwen: Qwen3.5-35B-A3B

Alibaba·Lançado em 2026-02-25
Open Source35B262K ctxApache 2.0Multimodal

Sobre

The Qwen3.5 Series 35B-A3B is a native vision-language model designed with a hybrid architecture that integrates linear attention mechanisms and a sparse mixture-of-experts model, achieving higher inference efficiency. Its overall...

Preços

Entrada

$0.14

por 1M tokens

Saída

$1.00

por 1M tokens

Combinado

$0.35

por 1M tokens

Mais barato que 58% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.35

Mensal

$10.65

vs. Modelos Similares

Claude 4.5 Sonnet (Non-reasoning)Q:0.0
$6.00+1590%
Qwen3.5 27B (Non-reasoning)Q:0.0
$0.88+146%
Qwen3.6 27B (Non-reasoning)Q:0.0
$1.35+280%
Gemma 4 31B (Reasoning)Q:+0.1
$0.20-42%

Desempenho

163

tokens/seg

Mais rápido que 78% dos modelos

1.17

segundos

Mais rápido que 46% dos modelos

13.43

segundos

Mais rápido que 36% dos modelos

Mediana do Mercado

95 tok/s

72% mais rápido

TTFT Mediano

1.11s

6% mais lento

Vazão/Dólar

460

tok/s por $/1M

Comparação de Velocidade

GPT-5.4 mini (Non-Reasoning)
162 tok/s-0%
OpenAI: GPT-5.4 Nano
164 tok/s+0%
MiniMax: MiniMax M2.5
164 tok/s+1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

82K

tokens

31% do contexto

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
84.5%
HLE
19.7%
LiveCodeBenchNão avaliado
SciCode
37.7%
TerminalBench Hard
26.5%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
72.5%
Long Context Recall
62.7%
Tau2
89.2%
Média do MercadoMelhor Score
apache-2.035BGGUF / GPTQ / AWQ
Downloads

2.1M

Curtidas

1.4K

VRAM (FP16)

48-80 GB

GPU

A100 80GB

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos