Modelos Relacionados
Google: Gemini 3.5 Flash2026-05-19Gemini 3.5 Flash (medium)2026-05-19Gemini 3.5 Flash (minimal)2026-05-19Google: Gemini 3.1 Flash Lite2026-05-07Google: Gemini 3.1 Flash Lite Preview2026-03-03Google: Gemini 3.1 Pro Preview Custom Tools2026-02-25Google: Gemini 3.1 Pro Preview2026-02-19Gemini 3 Deep Think2026-02-05
Preços
Entrada
$0.10
por 1M tokens
Saída
$0.40
por 1M tokens
Combinado
$0.17
por 1M tokens
Mais barato que 72% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Tokens por dia1M
100K100M
Diário
$0.17
Mensal
$5.25
vs. Modelos Similares
Magistral Small 1.2Q:-0.1
$0.75+329%
OpenAI: GPT-4oQ:-0.2
$4.38+2400%
Qwen: Qwen3 VL 32B InstructQ:-0.3
$0.18+4%
Ministral 3 14BQ:-0.3
$0.20+14%
Desempenho
269
tokens/seg
Mais rápido que 95% dos modelos
21.19
segundos
Mais rápido que 5% dos modelos
21.19
segundos
Mais rápido que 24% dos modelos
Mediana do Mercado
94 tok/s
185% mais rápido
TTFT Mediano
1.11s
1804% mais lento
Vazão/Dólar
1537
tok/s por $/1M
Comparação de Velocidade
NVIDIA Nemotron Nano 12B v2 VL (Reasoning)
266 tok/s-1%
gpt-oss-20B (low)
265 tok/s-2%
Nova Micro
289 tok/s+7%
Benchmarks
MMLU-Pro
75.9%
GPQA Diamond
62.5%
HLE
6.4%
LiveCodeBench
59.3%
SciCode
19.3%
TerminalBench Hard
4.5%
MATH-500
96.9%
AIME
70.3%
AIME 2025
53.3%
IFBench
49.9%
Long Context Recall
51.3%
Tau2
18.4%
Média do MercadoMelhor Score