Ir para o conteúdo principal
Voltar para Explorar

Qwen2.5 Turbo

Alibaba·Lançado em 2024-11-18
131K ctx

Sobre

Qwen-Turbo, based on Qwen2.5, is a 1M context model that provides fast speed and low cost, suitable for simple tasks.

Preços

Entrada

$0.05

por 1M tokens

Saída

$0.20

por 1M tokens

Combinado

$0.09

por 1M tokens

Mais barato que 85% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.09

Mensal

$2.64

vs. Modelos Similares

Reka Flash (Sep '24)Q:0.0
$0.35+298%
Llama 3.2 Instruct 90B (Vision)Q:-0.1
$1.38+1468%
Solar MiniQ:-0.1
$0.15+70%
AllenAI: Olmo 3 32B ThinkQ:+0.1
$0.24+170%

Desempenho

113

tokens/seg

Mais rápido que 60% dos modelos

1.07

segundos

Mais rápido que 52% dos modelos

1.07

segundos

Mais rápido que 67% dos modelos

Mediana do Mercado

94 tok/s

20% mais rápido

TTFT Mediano

1.11s

4% mais rápido

Vazão/Dólar

1286

tok/s por $/1M

Comparação de Velocidade

Qwen3 30B A3B (Reasoning)
113 tok/s+0%
MiniMax: MiniMax M2
113 tok/s-1%
Qwen3 30B A3B (Non-reasoning)
111 tok/s-2%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

8K

tokens

6% do contexto

Benchmarks

MMLU-Pro
63.3%
GPQA Diamond
41.0%
HLE
4.2%
LiveCodeBench
16.3%
SciCode
15.3%
TerminalBench HardNão avaliado
MATH-500
80.5%
AIME
12.0%
AIME 2025Não avaliado
IFBenchNão avaliado
Long Context RecallNão avaliado
Tau2Não avaliado
Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos