Qwen: Qwen3.5-122B-A10B

Alibaba·Lançado em 2026-02-25

Open Source122B262K ctxApache 2.0Multimodal

Comparar Testar modelo Ver repositório do modelo

Sobre

The Qwen3.5 122B-A10B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. In terms of...

Modelos Relacionados

Qwen: Qwen3.7 Plus2026-06-03 Qwen: Qwen3.7 Max2026-05-21 Qwen: Qwen3.6 27B2026-04-27 Qwen: Qwen3.6 35B A3B2026-04-27 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22

Índice de Qualidade

32.3

90th de 537

Top 17%

Índice de Código

45.7

46th de 447

Top 10%

Preço/1M

$0.72

373rd mais barato

31% acima da mediana

Top 55%

Velocidade

145 tok/s

Top 29%

TTFT

1.13s

Janela de Contexto

262K

110th maior

Top 38%

Posição no Mercado

Qwen: Qwen3.5-122B-A10BMédia do Mercado

Preços

Entrada

$0.26

por 1M tokens

Saída

$2.08

por 1M tokens

Combinado

$0.72

por 1M tokens

Mais barato que 45% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.72

Mensal

$21.45

vs. Modelos Similares

GLM-5 (Non-reasoning)Q:+0.1

$1.55+117%

OpenAI: o3 ProQ:+0.2

$35.00+4795%

Qwen3.5 397B A17B (Non-reasoning)Q:-0.3

$1.35+89%

MoonshotAI: Kimi K2 ThinkingQ:+0.4

$1.07+50%

Desempenho

145

tokens/seg

Mais rápido que 71% dos modelos

1.13

segundos

Mais rápido que 49% dos modelos

14.96

segundos

Mais rápido que 32% dos modelos

Mediana do Mercado

94 tok/s

53% mais rápido

TTFT Mediano

1.11s

1% mais lento

Vazão/Dólar

202

tok/s por $/1M

Comparação de Velocidade

NVIDIA Nemotron Nano 9B V2 (Non-reasoning)

145 tok/s+0%

Grok 4.3 (medium)

144 tok/s-0%

OpenAI: o3

145 tok/s+1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

262K

tokens

100% do contexto

Benchmarks

MMLU-ProNão avaliado

GPQA Diamond

85.7%

HLE

23.4%

LiveCodeBenchNão avaliado

SciCode

42.0%

TerminalBench Hard

31.1%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025Não avaliado

IFBench

75.7%

Long Context Recall

66.7%

Tau2

93.6%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.0122BGGUF / GPTQ / AWQ

Downloads

779.3K

Curtidas

578

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Comparação Rápida

Modelos Similares

GLM-5 (Non-reasoning)

Z AI

Q: 32.4$1.55/1M

Mais lento: 63%Mais caro: 117%

OpenAI: o3 Pro

OpenAI

Q: 32.5$35.00/1M200K ctx

Mais lento: 76%Mais caro: 4795%

Qwen3.5 397B A17B (Non-reasoning)

Alibaba

Q: 32.0$1.35/1M

Mais lento: 63%Mais caro: 89%

MoonshotAI: Kimi K2 Thinking

Kimi

Q: 32.7$1.07/1M262K ctx

Mais caro: 50%Código: -10.9

Qwen: Qwen3 Max Thinking

Alibaba

Q: 31.7$1.56/1M262K ctx

Mais lento: 70%Mais caro: 118%

Qwen: Qwen3.6 35B A3B

Alibaba

Q: 31.6$0.35/1M262K ctx

Mais barato: 50%Código: -3.8

Comparar todos os 7 modelos