Ir para o conteúdo principal
Voltar para Explorar

Gemini 2.5 Flash-Lite (Reasoning)

Google·Lançado em 2025-06-17
MoEMultimodal

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.17

por 1M tokens

Mais barato que 72% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.17

Mensal

$5.25

vs. Modelos Similares

Magistral Small 1.2Q:-0.1
$0.75+329%
OpenAI: GPT-4oQ:-0.2
$4.38+2400%
Qwen: Qwen3 VL 32B InstructQ:-0.3
$0.18+4%
Ministral 3 14BQ:-0.3
$0.20+14%

Desempenho

269

tokens/seg

Mais rápido que 95% dos modelos

21.19

segundos

Mais rápido que 5% dos modelos

21.19

segundos

Mais rápido que 24% dos modelos

Mediana do Mercado

94 tok/s

185% mais rápido

TTFT Mediano

1.11s

1804% mais lento

Vazão/Dólar

1537

tok/s por $/1M

Comparação de Velocidade

NVIDIA Nemotron Nano 12B v2 VL (Reasoning)
266 tok/s-1%
gpt-oss-20B (low)
265 tok/s-2%
Nova Micro
289 tok/s+7%

Benchmarks

MMLU-Pro
75.9%
GPQA Diamond
62.5%
HLE
6.4%
LiveCodeBench
59.3%
SciCode
19.3%
TerminalBench Hard
4.5%
MATH-500
96.9%
AIME
70.3%
AIME 2025
53.3%
IFBench
49.9%
Long Context Recall
51.3%
Tau2
18.4%
Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos