Ir para o conteúdo principal
Voltar para Explorar

Z.ai: GLM 4.6V

Z AI·Lançado em 2025-12-08
Open Source131K ctxMultimodal

Sobre

GLM-4.6V is a large multimodal model designed for high-fidelity visual understanding and long-context reasoning across images, documents, and mixed media. It supports up to 128K tokens, processes complex page layouts...

Preços

Entrada

$0.30

por 1M tokens

Saída

$0.90

por 1M tokens

Combinado

$0.45

por 1M tokens

Mais barato que 53% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.45

Mensal

$13.50

vs. Modelos Similares

DeepSeek R1 Distill Qwen 32BQ:0.0
$0.29-36%
Qwen: Qwen3 VL 32B InstructQ:+0.1
$0.18-60%
Ministral 3 14BQ:+0.1
$0.20-56%
Qwen3 235B A22B (Non-reasoning)Q:-0.1
$0.79+75%

Desempenho

48

tokens/seg

Mais rápido que 15% dos modelos

1.14

segundos

Mais rápido que 48% dos modelos

1.14

segundos

Mais rápido que 65% dos modelos

Mediana do Mercado

94 tok/s

49% mais lento

TTFT Mediano

1.11s

2% mais lento

Vazão/Dólar

108

tok/s por $/1M

Comparação de Velocidade

Claude Opus 4.6 (Adaptive Reasoning, Max Effort)
49 tok/s+1%
Qwen2.5 Max
48 tok/s-1%
Qwen: Qwen3.7 Plus
48 tok/s-1%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

33K

tokens

25% do contexto

Benchmarks

MMLU-Pro
75.2%
GPQA Diamond
56.6%
HLE
3.7%
LiveCodeBench
41.1%
SciCode
27.2%
TerminalBench Hard
3.0%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
26.3%
IFBench
27.9%
Long Context Recall
12.3%
Tau2
30.7%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos