Qwen: Qwen3 Next 80B A3B Instruct

Alibaba·Lançado em 2025-09-11

Open Source80B262K ctxApache 2.0

Comparar Testar modelo Ver repositório do modelo

Sobre

Qwen3-Next-80B-A3B-Instruct is an instruction-tuned chat model in the Qwen3-Next series optimized for fast, stable responses without “thinking” traces. It targets complex tasks across reasoning, code generation, knowledge QA, and multilingual...

Modelos Relacionados

Qwen: Qwen3.7 Plus2026-06-03 Qwen: Qwen3.7 Max2026-05-21 Qwen: Qwen3.6 27B2026-04-27 Qwen: Qwen3.6 35B A3B2026-04-27 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22

Índice de Qualidade

13.7

268th de 537

Top 50%

Índice de Código

15.3

275th de 447

Top 62%

Índice de Matemática

66.3

104th de 269

Top 39%

Preço/1M

$0.34

272nd mais barato

37% abaixo da mediana

Top 40%

Velocidade

189 tok/s

Top 15%

TTFT

1.11s

Janela de Contexto

262K

110th maior

Top 38%

Posição no Mercado

Qwen: Qwen3 Next 80B A3B InstructMédia do Mercado

Preços

Entrada

$0.09

por 1M tokens

Saída

$1.10

por 1M tokens

Combinado

$0.34

por 1M tokens

Mais barato que 60% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.34

Mensal

$10.28

vs. Modelos Similares

Qwen: Qwen3 Coder 30B A3B InstructQ:-0.1

$0.12-65%

QwQ 32BQ:-0.3

$0.74+118%

Qwen3 235B A22B (Reasoning)Q:-0.3

$2.63+666%

Qwen3 VL 30B A3B (Reasoning)Q:-0.4

$0.34-1%

Desempenho

189

tokens/seg

Mais rápido que 85% dos modelos

1.11

segundos

Mais rápido que 50% dos modelos

1.11

segundos

Mais rápido que 66% dos modelos

Mediana do Mercado

94 tok/s

100% mais rápido

TTFT Mediano

1.11s

1% mais rápido

Vazão/Dólar

551

tok/s por $/1M

Comparação de Velocidade

Gemini 3 Flash Preview (Non-reasoning)

188 tok/s-0%

Step 3.5 Flash

189 tok/s+0%

Nova 2.0 Lite (high)

188 tok/s-0%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

16K

tokens

6% do contexto

Benchmarks

MMLU-Pro

81.9%

GPQA Diamond

73.8%

HLE

7.3%

LiveCodeBench

68.4%

SciCode

30.7%

TerminalBench Hard

7.6%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

66.3%

IFBench

39.7%

Long Context Recall

51.3%

Tau2

21.6%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.080BGGUF / GPTQ / AWQ

Downloads

777.1K

Curtidas

951

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Comparação Rápida

Modelos Similares

Qwen: Qwen3 Coder 30B A3B Instruct

Alibaba

Q: 13.6$0.12/1M160K ctx

Mais lento: 41%Mais barato: 65%

Tri-21B-think Preview

Trillion Labs

Q: 13.6N/A/1M

Código: -7.9

GPT-4.5 (Preview)

OpenAI

Q: 13.6N/A/1M

QwQ 32B

Alibaba

Q: 13.4$0.74/1M131K ctx

Mais lento: 83%Mais caro: 118%

Qwen3 235B A22B (Reasoning)

Alibaba

Q: 13.4$2.63/1M

Mais lento: 65%Mais caro: 666%

o1-mini

OpenAI

Q: 14.0N/A/1M

Comparar todos os 7 modelos