Qwen3 14B (Non-reasoning)

Alibaba·Lançado em 2025-04-28

Open Source14BApache 2.0

Modelos Relacionados

Qwen: Qwen3.7 Plus2026-06-03 Qwen: Qwen3.7 Max2026-05-21 Qwen: Qwen3.6 27B2026-04-27 Qwen: Qwen3.6 35B A3B2026-04-27 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22

Índice de Qualidade

7.0

402nd de 537

Top 75%

Índice de Código

12.4

323rd de 447

Top 72%

Índice de Matemática

58.0

120th de 269

Top 45%

Preço/1M

$0.38

295th mais barato

30% abaixo da mediana

Top 43%

Velocidade

63 tok/s

Top 70%

TTFT

1.07s

Posição no Mercado

Qwen3 14B (Non-reasoning)Média do Mercado

Preços

Entrada

$0.23

por 1M tokens

Saída

$0.82

por 1M tokens

Combinado

$0.38

por 1M tokens

Mais barato que 57% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.38

Mensal

$11.43

vs. Modelos Similares

OpenAI: GPT-4Q:0.0

$37.50+9743%

Z.ai: GLM 4.5VQ:0.0

$0.90+136%

Google: Gemini 2.5 Flash LiteQ:-0.1

$0.17-54%

Hermes 4 - Llama-3.1 70B (Non-reasoning)Q:-0.1

$0.20-48%

Desempenho

tokens/seg

Mais rápido que 30% dos modelos

1.07

segundos

Mais rápido que 52% dos modelos

1.07

segundos

Mais rápido que 67% dos modelos

Mediana do Mercado

94 tok/s

33% mais lento

TTFT Mediano

1.11s

4% mais rápido

Vazão/Dólar

167

tok/s por $/1M

Comparação de Velocidade

Qwen3 235B A22B 2507 Instruct

63 tok/s+0%

Qwen3 14B (Reasoning)

63 tok/s-1%

Devstral Small (Jul '25)

64 tok/s+1%

Benchmarks

MMLU-Pro

67.5%

GPQA Diamond

47.0%

HLE

4.2%

LiveCodeBench

28.0%

SciCode

26.5%

TerminalBench Hard

5.3%

MATH-500

87.1%

AIME

28.0%

AIME 2025

58.0%

IFBench

23.9%

Long Context Recall

0.0%

Tau2

32.2%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.014BGGUF / GPTQ / AWQ

Downloads

698.0K

Curtidas

VRAM (FP16)

16-24 GB

GPU

RTX 4090 / M2 Max

Comparação Rápida

Modelos Similares

Z.ai: GLM 4.5V

Z AI

Q: 7.0$0.90/1M66K ctx

Mais lento: 28%Mais caro: 136%

OpenAI: GPT-4

OpenAI

Q: 7.0$37.50/1M8K ctx

Mais lento: 34%Mais caro: 9743%

Google: Gemini 2.5 Flash Lite

Google

Q: 6.9$0.17/1M1.0M ctx

Mais rápido: 232%Mais barato: 54%

OpenAI: GPT-4o-mini

OpenAI

Q: 6.9$0.26/1M128K ctx

Mais barato: 31%

Hermes 4 - Llama-3.1 70B (Non-reasoning)

Nous Research

Q: 6.9$0.20/1M

Mais rápido: 43%Mais barato: 48%

Mistral Small 3

Mistral

Q: 6.9$0.10/1M

Mais rápido: 130%Mais barato: 73%

Comparar todos os 7 modelos