Google: Gemini 2.5 Flash Lite Preview 09-2025

Google·Lançado em 2025-09-25

1.0M ctxMoEMultimodal

Sobre

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance...

Modelos Relacionados

Google: Gemini 3.5 Flash2026-05-19 Gemini 3.5 Flash (medium)2026-05-19 Gemini 3.5 Flash (minimal)2026-05-19 Google: Gemini 3.1 Flash Lite2026-05-07 Google: Gemini 3.1 Flash Lite Preview2026-03-03 Google: Gemini 3.1 Pro Preview Custom Tools2026-02-25 Google: Gemini 3.1 Pro Preview2026-02-19 Gemini 3 Deep Think2026-02-05

Índice de Qualidade

13.1

277th de 537

Top 52%

Índice de Código

14.5

282nd de 447

Top 64%

Índice de Matemática

46.7

145th de 269

Top 55%

Preço/1M

$0.17

178th mais barato

68% abaixo da mediana

Top 28%

Velocidade

353 tok/s

Top 2%

TTFT

0.43s

Janela de Contexto

1.0M

17th maior

Top 10%

Posição no Mercado

Google: Gemini 2.5 Flash Lite Preview 09-2025Média do Mercado

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.17

por 1M tokens

Mais barato que 72% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.17

Mensal

$5.25

vs. Modelos Similares

Gemma 4 12B (Non-reasoning)Q:+0.1

$0.15-14%

Qwen3 VL 30B A3B (Reasoning)Q:+0.2

$0.34+93%

QwQ 32BQ:+0.3

$0.74+326%

Qwen3 235B A22B (Reasoning)Q:+0.3

$2.63+1400%

Desempenho

353

tokens/seg

Mais rápido que 98% dos modelos

0.43

segundos

Mais rápido que 93% dos modelos

0.43

segundos

Mais rápido que 95% dos modelos

Mediana do Mercado

94 tok/s

277% mais rápido

TTFT Mediano

1.10s

61% mais rápido

Vazão/Dólar

2020

tok/s por $/1M

Comparação de Velocidade

Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)

347 tok/s-2%

LFM2 2.6B

331 tok/s-6%

gpt-oss-120b (low)

327 tok/s-7%

Janela de Contexto

1.0M

tokens

Maior que 90% dos modelos

Saída Máxima

66K

tokens

6% do contexto

Benchmarks

MMLU-Pro

79.6%

GPQA Diamond

65.1%

HLE

4.6%

LiveCodeBench

64.1%

SciCode

28.5%

TerminalBench Hard

7.6%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

46.7%

IFBench

41.8%

Long Context Recall

48.0%

Tau2

30.4%

Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Devstral Small 2

Mistral

Q: 13.1N/A/1M

Mais lento: 88%Código: +14.8

Gemma 4 12B (Non-reasoning)

Google

Q: 13.2$0.15/1M

Mais lento: 53%Mais barato: 14%

Gemini 2.0 Flash Thinking Experimental (Jan '25)

Google

Q: 13.3N/A/1M

Código: +9.6

Qwen3 VL 30B A3B (Reasoning)

Alibaba

Q: 13.3$0.34/1M

Mais lento: 65%Mais caro: 93%

Motif-2-12.7B-Reasoning

Motif Technologies

Q: 12.8N/A/1M

Ling-1T

InclusionAI

Q: 12.8N/A/1M

Código: +4.3

Comparar todos os 7 modelos

Usado por Agentes

Gobii