Ir para o conteúdo principal
Voltar para Explorar

Z.ai: GLM 4.5 Air

Z AI·Lançado em 2025-07-25
Open Source131K ctx

Sobre

GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications. Like GLM-4.5, it adopts the Mixture-of-Experts (MoE) architecture but with a more compact parameter...

Preços

Entrada

$0.13

por 1M tokens

Saída

$0.85

por 1M tokens

Combinado

$0.31

por 1M tokens

Mais barato que 61% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.31

Mensal

$9.30

vs. Modelos Similares

Grok 4 Fast (Non-reasoning)Q:0.0
$0.28-11%
GPT-5.4 mini (Non-Reasoning)Q:+0.1
$1.69+445%
Nova 2.0 Omni (low)Q:+0.1
$0.85+174%
OpenAI: GPT-4.1 MiniQ:-0.2
$0.70+126%

Desempenho

75

tokens/seg

Mais rápido que 37% dos modelos

1.49

segundos

Mais rápido que 34% dos modelos

28.06

segundos

Mais rápido que 17% dos modelos

Mediana do Mercado

94 tok/s

20% mais lento

TTFT Mediano

1.10s

35% mais lento

Vazão/Dólar

243

tok/s por $/1M

Comparação de Velocidade

NVIDIA Nemotron Nano 9B V2 (Reasoning)
75 tok/s+0%
MiniMax: MiniMax M3
75 tok/s+0%
DeepSeek: DeepSeek V4 Pro
75 tok/s+0%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

98K

tokens

75% do contexto

Benchmarks

MMLU-Pro
81.5%
GPQA Diamond
73.3%
HLE
6.8%
LiveCodeBench
68.4%
SciCode
30.6%
TerminalBench Hard
20.5%
MATH-500
96.5%
AIME
67.3%
AIME 2025
80.7%
IFBench
37.6%
Long Context Recall
43.7%
Tau2
46.5%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos

Usado por Agentes