Modelos Relacionados
Google: Gemini 3.5 Flash2026-05-19Gemini 3.5 Flash (medium)2026-05-19Gemini 3.5 Flash (minimal)2026-05-19Google: Gemini 3.1 Flash Lite2026-05-07Google: Gemini 3.1 Flash Lite Preview2026-03-03Google: Gemini 3.1 Pro Preview Custom Tools2026-02-25Google: Gemini 3.1 Pro Preview2026-02-19Gemini 3 Deep Think2026-02-05
Preços
Entrada
$2.00
por 1M tokens
Saída
$12.00
por 1M tokens
Combinado
$4.50
por 1M tokens
Mais barato que 12% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Tokens por dia1M
100K100M
Diário
$4.50
Mensal
$135.00
vs. Modelos Similares
Qwen: Qwen3.6 PlusQ:0.0
$0.73-84%
Z.ai: GLM 5Q:-0.1
$0.93-79%
Grok Build 0.1 0616Q:+0.2
$1.25-72%
OpenAI: GPT-5.4 MiniQ:+0.4
$1.69-63%
Desempenho
161
tokens/seg
Mais rápido que 78% dos modelos
32.20
segundos
Mais rápido que 3% dos modelos
32.20
segundos
Mais rápido que 15% dos modelos
Mediana do Mercado
94 tok/s
72% mais rápido
TTFT Mediano
1.10s
2814% mais lento
Vazão/Dólar
36
tok/s por $/1M
Comparação de Velocidade
GLM-4.7-Flash (Non-reasoning)
162 tok/s+0%
GPT-5.4 mini (Non-Reasoning)
162 tok/s+0%
GPT-5.4 nano (Non-Reasoning)
161 tok/s-1%
Benchmarks
MMLU-Pro
89.8%
GPQA Diamond
90.8%
HLE
37.2%
LiveCodeBench
91.7%
SciCode
56.1%
TerminalBench Hard
41.7%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
95.7%
IFBench
70.4%
Long Context Recall
70.7%
Tau2
87.1%
Média do MercadoMelhor Score