Qwen: Qwen3 Next 80B A3B Instruct

Alibaba·Released 2025-09-11

Open Source80B262K ctxApache 2.0

About

Qwen3-Next-80B-A3B-Instruct is an instruction-tuned chat model in the Qwen3-Next series optimized for fast, stable responses without “thinking” traces. It targets complex tasks across reasoning, code generation, knowledge QA, and multilingual...

Quality Index

13.7

268th of 537

Top 50%

Coding Index

15.3

275th of 447

Top 62%

Math Index

66.3

104th of 269

Top 39%

Price/1M

$0.34

272nd cheapest

37% below median

Top 40%

Speed

189 tok/s

Top 15%

TTFT

1.11s

Context Window

262K

110th largest

Top 38%

Market Position

Qwen: Qwen3 Next 80B A3B InstructMarket Average

Pricing

Input

$0.09

per 1M tokens

Output

$1.10

per 1M tokens

Blended

$0.34

per 1M tokens

Cheaper than 60% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.34

Monthly

$10.28

vs. Similar Models

Qwen: Qwen3 Coder 30B A3B InstructQ:-0.1

$0.12-65%

QwQ 32BQ:-0.3

$0.74+118%

Qwen3 235B A22B (Reasoning)Q:-0.3

$2.63+666%

Qwen3 VL 30B A3B (Reasoning)Q:-0.4

$0.34-1%

Performance

189

tokens/sec

Faster than 85% of models

1.11

seconds

Faster than 50% of models

1.11

seconds

Faster than 66% of models

Market Median

94 tok/s

100% faster

Median TTFT

1.11s

1% faster

Throughput/Dollar

551

tok/s per $/1M

Speed Comparison

Gemini 3 Flash Preview (Non-reasoning)

188 tok/s-0%

Step 3.5 Flash

189 tok/s+0%

Nova 2.0 Lite (high)

188 tok/s-0%

Context Window

262K

tokens

Larger than 62% of models

Max Output

16K

tokens

6% of context

Benchmarks

MMLU-Pro

81.9%

GPQA Diamond

73.8%

HLE

7.3%

LiveCodeBench

68.4%

SciCode

30.7%

TerminalBench Hard

7.6%

MATH-500Not evaluated

AIMENot evaluated

AIME 2025

66.3%

IFBench

39.7%

Long Context Recall

51.3%

Tau2

21.6%

Market AverageTop Score

Open Source

View model repository

apache-2.080BGGUF / GPTQ / AWQ

Downloads

777.1K

Likes

951

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Quick Compare

Similar Models

Qwen: Qwen3 Coder 30B A3B Instruct

Alibaba

Q: 13.6$0.12/1M160K ctx

Slower: 41%Cheaper: 65%

Tri-21B-think Preview

Trillion Labs

Q: 13.6N/A/1M

Coding: -7.9

GPT-4.5 (Preview)

OpenAI

Q: 13.6N/A/1M

QwQ 32B

Alibaba

Q: 13.4$0.74/1M131K ctx

Slower: 83%Pricier: 118%

Qwen3 235B A22B (Reasoning)

Alibaba

Q: 13.4$2.63/1M

Slower: 65%Pricier: 666%

o1-mini

OpenAI

Q: 14.0N/A/1M

Compare all 7 models

Qwen: Qwen3 Next 80B A3B Instruct

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position