Qwen: Qwen3.5-35B-A3B
Sobre
The Qwen3.5 Series 35B-A3B is a native vision-language model designed with a hybrid architecture that integrates linear attention mechanisms and a sparse mixture-of-experts model, achieving higher inference efficiency. Its overall...
Modelos Relacionados
Preços
Entrada
$0.14
por 1M tokens
Saída
$1.00
por 1M tokens
Combinado
$0.35
por 1M tokens
Mais barato que 58% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Diário
$0.35
Mensal
$10.65
vs. Modelos Similares
Desempenho
163
tokens/seg
Mais rápido que 78% dos modelos
1.17
segundos
Mais rápido que 46% dos modelos
13.43
segundos
Mais rápido que 36% dos modelos
Mediana do Mercado
95 tok/s
72% mais rápido
TTFT Mediano
1.11s
6% mais lento
Vazão/Dólar
460
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 62% dos modelos
Saída Máxima
82K
tokens
31% do contexto
Benchmarks
Open Source
2.1M
1.4K
48-80 GB
A100 80GB