Google: Gemini 2.5 Flash Lite

Google·Released 2025-07-22

1.0M ctxMoEMultimodal

About

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance...

Quality Index

6.9

405th of 537

Top 76%

Coding Index

7.4

383rd of 447

Top 86%

Math Index

35.3

173rd of 269

Top 65%

Price/1M

$0.17

178th cheapest

68% below median

Top 28%

Speed

211 tok/s

Top 12%

TTFT

0.31s

Context Window

1.0M

17th largest

Top 10%

Market Position

Google: Gemini 2.5 Flash LiteMarket Average

Pricing

Input

$0.10

per 1M tokens

Output

$0.40

per 1M tokens

Blended

$0.17

per 1M tokens

Cheaper than 72% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.17

Monthly

$5.25

vs. Similar Models

Hermes 4 - Llama-3.1 70B (Non-reasoning)Q:0.0

$0.20+13%

Mistral Small 3Q:0.0

$0.10-41%

Nova LiteQ:0.0

$0.10-40%

OpenAI: GPT-4o-miniQ:0.0

$0.26+50%

Performance

211

tokens/sec

Faster than 88% of models

0.31

seconds

Faster than 97% of models

0.31

seconds

Faster than 99% of models

Market Median

94 tok/s

123% faster

Median TTFT

1.11s

73% faster

Throughput/Dollar

1203

tok/s per $/1M

Speed Comparison

Google: Gemini 3.5 Flash

210 tok/s-0%

Gemini 3.5 Flash (medium)

211 tok/s+0%

Arcee AI: Trinity Large Thinking

211 tok/s+0%

Context Window

1.0M

tokens

Larger than 90% of models

Max Output

66K

tokens

6% of context

Benchmarks

MMLU-Pro

72.4%

GPQA Diamond

47.4%

HLE

3.7%

LiveCodeBench

40.0%

SciCode

17.7%

TerminalBench Hard

2.3%

MATH-500

92.6%

AIME

50.0%

AIME 2025

35.3%

IFBench

31.5%

Long Context Recall

31.3%

Tau2

19.0%

Market AverageTop Score

Quick Compare

Similar Models

OpenAI: GPT-4o-mini

OpenAI

Q: 6.9$0.26/1M128K ctx

Slower: 65%Pricier: 50%

Hermes 4 - Llama-3.1 70B (Non-reasoning)

Nous Research

Q: 6.9$0.20/1M

Slower: 57%Pricier: 13%

Mistral Small 3

Mistral

Q: 6.9$0.10/1M

Slower: 31%Cheaper: 41%

Nova Lite

Amazon

Q: 6.9$0.10/1M

Slower: 16%Cheaper: 40%

Z.ai: GLM 4.5V

Z AI

Q: 7.0$0.90/1M66K ctx

Slower: 78%Pricier: 414%

OpenAI: GPT-4

OpenAI

Q: 7.0$37.50/1M8K ctx

Slower: 80%Pricier: 21329%

Compare all 7 models

Used by Agents

OpenClaw

Codebuff

Google: Gemini 2.5 Flash Lite

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Quick Compare

Similar Models

Used by Agents

Market Position