Ir para o conteúdo principal
Voltar para Explorar

Qwen: Qwen3 Next 80B A3B Instruct

Alibaba·Lançado em 2025-09-11
Open Source80B262K ctxApache 2.0

Sobre

Qwen3-Next-80B-A3B-Instruct is an instruction-tuned chat model in the Qwen3-Next series optimized for fast, stable responses without “thinking” traces. It targets complex tasks across reasoning, code generation, knowledge QA, and multilingual...

Preços

Entrada

$0.09

por 1M tokens

Saída

$1.10

por 1M tokens

Combinado

$0.34

por 1M tokens

Mais barato que 60% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.34

Mensal

$10.28

vs. Modelos Similares

Qwen3 Coder 30B A3B InstructQ:-0.1
$0.12-65%
QwQ 32BQ:-0.3
$0.74+118%
Qwen3 235B A22B (Reasoning)Q:-0.3
$2.63+666%
Qwen3 VL 30B A3B (Reasoning)Q:-0.4
$0.34-1%

Desempenho

194

tokens/seg

Mais rápido que 85% dos modelos

1.06

segundos

Mais rápido que 52% dos modelos

1.06

segundos

Mais rápido que 66% dos modelos

Mediana do Mercado

94 tok/s

107% mais rápido

TTFT Mediano

1.10s

4% mais rápido

Vazão/Dólar

567

tok/s por $/1M

Comparação de Velocidade

Step 3.5 Flash
194 tok/s-0%
StepFun: Step 3.5 Flash
194 tok/s-0%
inclusionAI: Ling-2.6-flash
196 tok/s+1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

16K

tokens

6% do contexto

Benchmarks

MMLU-Pro
81.9%
GPQA Diamond
73.8%
HLE
7.3%
LiveCodeBench
68.4%
SciCode
30.7%
TerminalBench Hard
7.6%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
66.3%
IFBench
39.7%
Long Context Recall
51.3%
Tau2
21.6%
Média do MercadoMelhor Score
apache-2.080BGGUF / GPTQ / AWQ
Downloads

777.1K

Curtidas

951

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos