Qwen3 14B (Non-reasoning)

Alibaba·Released 2025-04-28

Open Source14BApache 2.0

Compare View model repository

Quality Index

7.0

402nd of 537

Top 75%

Coding Index

12.4

323rd of 447

Top 72%

Math Index

58.0

120th of 269

Top 45%

Price/1M

$0.38

295th cheapest

30% below median

Top 43%

Speed

63 tok/s

Top 70%

TTFT

1.07s

Market Position

Qwen3 14B (Non-reasoning)Market Average

Pricing

Input

$0.23

per 1M tokens

Output

$0.82

per 1M tokens

Blended

$0.38

per 1M tokens

Cheaper than 57% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.38

Monthly

$11.43

vs. Similar Models

OpenAI: GPT-4Q:0.0

$37.50+9743%

Z.ai: GLM 4.5VQ:0.0

$0.90+136%

Google: Gemini 2.5 Flash LiteQ:-0.1

$0.17-54%

Hermes 4 - Llama-3.1 70B (Non-reasoning)Q:-0.1

$0.20-48%

Performance

tokens/sec

Faster than 30% of models

1.07

seconds

Faster than 52% of models

1.07

seconds

Faster than 67% of models

Market Median

94 tok/s

33% slower

Median TTFT

1.11s

4% faster

Throughput/Dollar

167

tok/s per $/1M

Speed Comparison

Qwen3 235B A22B 2507 Instruct

63 tok/s+0%

Qwen3 14B (Reasoning)

63 tok/s-1%

Devstral Small (Jul '25)

64 tok/s+1%

Benchmarks

MMLU-Pro

67.5%

GPQA Diamond

47.0%

HLE

4.2%

LiveCodeBench

28.0%

SciCode

26.5%

TerminalBench Hard

5.3%

MATH-500

87.1%

AIME

28.0%

AIME 2025

58.0%

IFBench

23.9%

Long Context Recall

0.0%

Tau2

32.2%

Market AverageTop Score

Open Source

View model repository

apache-2.014BGGUF / GPTQ / AWQ

Downloads

698.0K

Likes

VRAM (FP16)

16-24 GB

GPU

RTX 4090 / M2 Max

Quick Compare

Similar Models

Z.ai: GLM 4.5V

Z AI

Q: 7.0$0.90/1M66K ctx

Slower: 28%Pricier: 136%

OpenAI: GPT-4

OpenAI

Q: 7.0$37.50/1M8K ctx

Slower: 34%Pricier: 9743%

Google: Gemini 2.5 Flash Lite

Google

Q: 6.9$0.17/1M1.0M ctx

Faster: 232%Cheaper: 54%

OpenAI: GPT-4o-mini

OpenAI

Q: 6.9$0.26/1M128K ctx

Cheaper: 31%

Hermes 4 - Llama-3.1 70B (Non-reasoning)

Nous Research

Q: 6.9$0.20/1M

Faster: 43%Cheaper: 48%

Mistral Small 3

Mistral

Q: 6.9$0.10/1M

Faster: 130%Cheaper: 73%

Compare all 7 models

Qwen3 14B (Non-reasoning)

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position