Loading...
Loading...
The Qwen3.5 Series 35B-A3B is a native vision-language model designed with a hybrid architecture that integrates linear attention mechanisms and a sparse mixture-of-experts model, achieving higher inference efficiency. Its overall performance is comparable to that of the Qwen3.5-27B.
Índice de Qualidade
37.1
61st de 444
Top 14%
Índice de Código
30.3
79th de 354
Top 22%
Preço/1M
$0.69
423rd mais barato
129% acima da mediana
Top 63%
Velocidade
130 tok/s
Top 18%
TTFT
0.99s
Janela de Contexto
262K
61st maior
Top 25%
Entrada
$0.25
por 1M tokens
Saída
$2.00
por 1M tokens
Combinado
$0.69
por 1M tokens
Mais barato que 37% dos modelos. Preço mediano é $0.30/1M tokens.
Diário
$0.69
Mensal
$20.64
130
tokens/seg
Mais rápido que 82% dos modelos
0.99
segundos
Mais rápido que 30% dos modelos
16.34
segundos
Mais rápido que 17% dos modelos
Mediana do Mercado
45 tok/s
187% mais rápido
TTFT Mediano
0.42s
137% mais lento
Vazão/Dólar
189
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 75% dos modelos
Saída Máxima
66K
tokens
25% do contexto
2.7M
1.3K
48-80 GB
A100 80GB