Google: Gemini 2.5 Flash Lite

Google·Lançado em 2025-07-22

1.0M ctxMoEMultimodal

Sobre

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance...

Modelos Relacionados

Google: Gemini 3.5 Flash2026-05-19 Gemini 3.5 Flash (medium)2026-05-19 Gemini 3.5 Flash (minimal)2026-05-19 Google: Gemini 3.1 Flash Lite2026-05-07 Google: Gemini 3.1 Flash Lite Preview2026-03-03 Google: Gemini 3.1 Pro Preview Custom Tools2026-02-25 Google: Gemini 3.1 Pro Preview2026-02-19 Gemini 3 Deep Think2026-02-05

Índice de Qualidade

6.9

405th de 537

Top 76%

Índice de Código

7.4

383rd de 447

Top 86%

Índice de Matemática

35.3

173rd de 269

Top 65%

Preço/1M

$0.17

178th mais barato

68% abaixo da mediana

Top 28%

Velocidade

227 tok/s

Top 8%

TTFT

0.32s

Janela de Contexto

1.0M

17th maior

Top 10%

Posição no Mercado

Google: Gemini 2.5 Flash LiteMédia do Mercado

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.17

por 1M tokens

Mais barato que 72% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.17

Mensal

$5.25

vs. Modelos Similares

Hermes 4 - Llama-3.1 70B (Non-reasoning)Q:0.0

$0.20+13%

Mistral Small 3Q:0.0

$0.10-41%

Nova LiteQ:0.0

$0.10-40%

OpenAI: GPT-4o-miniQ:0.0

$0.26+50%

Desempenho

227

tokens/seg

Mais rápido que 92% dos modelos

0.32

segundos

Mais rápido que 97% dos modelos

0.32

segundos

Mais rápido que 99% dos modelos

Mediana do Mercado

94 tok/s

142% mais rápido

TTFT Mediano

1.10s

71% mais rápido

Vazão/Dólar

1296

tok/s por $/1M

Comparação de Velocidade

Google: Gemini 2.5 Flash

226 tok/s-0%

Qwen3 0.6B (Reasoning)

224 tok/s-1%

Gemini 2.5 Flash (Reasoning)

224 tok/s-1%

Janela de Contexto

1.0M

tokens

Maior que 90% dos modelos

Saída Máxima

66K

tokens

6% do contexto

Benchmarks

MMLU-Pro

72.4%

GPQA Diamond

47.4%

HLE

3.7%

LiveCodeBench

40.0%

SciCode

17.7%

TerminalBench Hard

2.3%

MATH-500

92.6%

AIME

50.0%

AIME 2025

35.3%

IFBench

31.5%

Long Context Recall

31.3%

Tau2

19.0%

Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

OpenAI: GPT-4o-mini

OpenAI

Q: 6.9$0.26/1M128K ctx

Mais lento: 66%Mais caro: 50%

Hermes 4 - Llama-3.1 70B (Non-reasoning)

Nous Research

Q: 6.9$0.20/1M

Mais lento: 60%Mais caro: 13%

Mistral Small 3

Mistral

Q: 6.9$0.10/1M

Mais lento: 34%Mais barato: 41%

Nova Lite

Amazon

Q: 6.9$0.10/1M

Mais lento: 27%Mais barato: 40%

Z.ai: GLM 4.5V

Z AI

Q: 7.0$0.90/1M66K ctx

Mais lento: 78%Mais caro: 414%

OpenAI: GPT-4

OpenAI

Q: 7.0$37.50/1M8K ctx

Mais lento: 85%Mais caro: 21329%

Comparar todos os 7 modelos

Usado por Agentes

OpenClaw

Codebuff