Ir para o conteúdo principal
Voltar para Explorar

Z.ai: GLM 4.5 Air

Z AI·Lançado em 2025-07-25
Open Source131K ctx

Sobre

GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications. Like GLM-4.5, it adopts the Mixture-of-Experts (MoE) architecture but with a more compact parameter...

Preços

Entrada

$0.13

por 1M tokens

Saída

$0.85

por 1M tokens

Combinado

$0.31

por 1M tokens

Mais barato que 61% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.31

Mensal

$9.30

vs. Modelos Similares

Grok 4 Fast (Non-reasoning)Q:0.0
$0.28-11%
GPT-5.4 mini (Non-Reasoning)Q:+0.1
$1.69+445%
Nova 2.0 Omni (low)Q:+0.1
$0.85+174%
OpenAI: GPT-4.1 MiniQ:-0.2
$0.70+126%

Desempenho

77

tokens/seg

Mais rápido que 38% dos modelos

1.46

segundos

Mais rápido que 34% dos modelos

27.30

segundos

Mais rápido que 17% dos modelos

Mediana do Mercado

94 tok/s

18% mais lento

TTFT Mediano

1.11s

31% mais lento

Vazão/Dólar

250

tok/s por $/1M

Comparação de Velocidade

Anthropic: Claude Fable 5
77 tok/s-0%
Grok Code Fast 1
79 tok/s+2%
Olmo 3 7B Instruct
76 tok/s-2%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

98K

tokens

75% do contexto

Benchmarks

MMLU-Pro
81.5%
GPQA Diamond
73.3%
HLE
6.8%
LiveCodeBench
68.4%
SciCode
30.6%
TerminalBench Hard
20.5%
MATH-500
96.5%
AIME
67.3%
AIME 2025
80.7%
IFBench
37.6%
Long Context Recall
43.7%
Tau2
46.5%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos

Usado por Agentes