Ir para o conteúdo principal
Voltar para Explorar

Qwen: Qwen3.5-122B-A10B

Alibaba·Lançado em 2026-02-25
Open Source122B262K ctxApache 2.0Multimodal

Sobre

The Qwen3.5 122B-A10B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. In terms of...

Preços

Entrada

$0.26

por 1M tokens

Saída

$2.08

por 1M tokens

Combinado

$0.72

por 1M tokens

Mais barato que 45% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.72

Mensal

$21.45

vs. Modelos Similares

GLM-5 (Non-reasoning)Q:+0.1
$1.55+117%
OpenAI: o3 ProQ:+0.2
$35.00+4795%
Qwen3.5 397B A17B (Non-reasoning)Q:-0.3
$1.35+89%
MoonshotAI: Kimi K2 ThinkingQ:+0.4
$1.07+50%

Desempenho

148

tokens/seg

Mais rápido que 73% dos modelos

1.08

segundos

Mais rápido que 51% dos modelos

14.57

segundos

Mais rápido que 34% dos modelos

Mediana do Mercado

94 tok/s

58% mais rápido

TTFT Mediano

1.10s

2% mais rápido

Vazão/Dólar

207

tok/s por $/1M

Comparação de Velocidade

Apertus 8B Instruct
148 tok/s-0%
NVIDIA Nemotron Nano 9B V2 (Non-reasoning)
148 tok/s-0%
GPT-5 nano (minimal)
149 tok/s+0%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

262K

tokens

100% do contexto

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
85.7%
HLE
23.4%
LiveCodeBenchNão avaliado
SciCode
42.0%
TerminalBench Hard
31.1%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
75.7%
Long Context Recall
66.7%
Tau2
93.6%
Média do MercadoMelhor Score
apache-2.0122BGGUF / GPTQ / AWQ
Downloads

799.3K

Curtidas

578

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos