Loading...
Loading...
The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. It delivers...
Entrada
$0.39
por 1M tokens
Saída
$2.34
por 1M tokens
Combinado
$0.88
por 1M tokens
Mais barato que 38% dos modelos. Preço mediano é $0.56/1M tokens.
Diário
$0.88
Mensal
$26.32
52
tokens/seg
Mais rápido que 23% dos modelos
1.52
segundos
Mais rápido que 30% dos modelos
62.89
segundos
Mais rápido que 4% dos modelos
Mediana do Mercado
86 tok/s
40% mais lento
TTFT Mediano
1.07s
42% mais lento
Vazão/Dólar
59
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 66% dos modelos
Saída Máxima
66K
tokens
25% do contexto
645.8K
1.5K
Multi-GPU
8x A100 / H100
Índice de Qualidade
45.0
41st de 507
Top 8%
Índice de Código
41.3
42nd de 417
Top 10%
Preço/1M
$0.88
393rd mais barato
57% acima da mediana
Top 62%
Velocidade
52 tok/s
Top 77%
TTFT
1.52s
Janela de Contexto
262K
91st maior
Top 34%