Ir para o conteúdo principal
Voltar para Explorar

Qwen: Qwen3.6 35B A3B

Alibaba·Lançado em 2026-04-27
Open Source35B262K ctxApache 2.0Multimodal

Sobre

Qwen3.6-35B-A3B is an open-weight multimodal model from Alibaba Cloud with 35 billion total parameters and 3 billion active parameters per token. It uses a hybrid sparse mixture-of-experts architecture combining Gated...

Preços

Entrada

$0.14

por 1M tokens

Saída

$1.00

por 1M tokens

Combinado

$0.35

por 1M tokens

Mais barato que 58% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.35

Mensal

$10.65

vs. Modelos Similares

Qwen: Qwen3 Max ThinkingQ:+0.1
$1.56+339%
MiniMax: MiniMax M2.1Q:-0.2
$0.45+28%
Qwen3.5 397B A17B (Non-reasoning)Q:+0.4
$1.35+280%
DeepSeek V4 Pro (Non-reasoning)Q:-0.4
$0.54+53%

Desempenho

147

tokens/seg

Mais rápido que 73% dos modelos

1.36

segundos

Mais rápido que 38% dos modelos

38.03

segundos

Mais rápido que 12% dos modelos

Mediana do Mercado

94 tok/s

56% mais rápido

TTFT Mediano

1.11s

23% mais lento

Vazão/Dólar

414

tok/s por $/1M

Comparação de Velocidade

GPT-3.5 Turbo
147 tok/s-0%
GLM-4.7-Flash (Non-reasoning)
148 tok/s+0%
Mistral Small 3
146 tok/s-1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

262K

tokens

100% do contexto

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
84.1%
HLE
20.2%
LiveCodeBenchNão avaliado
SciCode
35.8%
TerminalBench Hard
34.8%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
64.4%
Long Context Recall
63.7%
Tau2
95.3%
Média do MercadoMelhor Score
apache-2.035BGGUF / GPTQ / AWQ
Downloads

5.6M

Curtidas

2.3K

VRAM (FP16)

48-80 GB

GPU

A100 80GB

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos