Gemini 2.5 Flash-Lite (Reasoning)

Google·Lançado em 2025-06-17

MoEMultimodal

Modelos Relacionados

Google: Gemini 3.5 Flash2026-05-19 Gemini 3.5 Flash (medium)2026-05-19 Gemini 3.5 Flash (minimal)2026-05-19 Google: Gemini 3.1 Flash Lite2026-05-07 Google: Gemini 3.1 Flash Lite Preview2026-03-03 Google: Gemini 3.1 Pro Preview Custom Tools2026-02-25 Google: Gemini 3.1 Pro Preview2026-02-19 Gemini 3 Deep Think2026-02-05

Índice de Qualidade

11.4

306th de 537

Top 57%

Índice de Código

9.5

360th de 447

Top 81%

Índice de Matemática

53.3

135th de 269

Top 50%

Preço/1M

$0.17

178th mais barato

68% abaixo da mediana

Top 28%

Velocidade

269 tok/s

Top 5%

TTFT

21.19s

Posição no Mercado

Gemini 2.5 Flash-Lite (Reasoning)Média do Mercado

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.17

por 1M tokens

Mais barato que 72% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.17

Mensal

$5.25

vs. Modelos Similares

Magistral Small 1.2Q:-0.1

$0.75+329%

OpenAI: GPT-4oQ:-0.2

$4.38+2400%

Qwen: Qwen3 VL 32B InstructQ:-0.3

$0.18+4%

Ministral 3 14BQ:-0.3

$0.20+14%

Desempenho

269

tokens/seg

Mais rápido que 95% dos modelos

21.19

segundos

Mais rápido que 5% dos modelos

21.19

segundos

Mais rápido que 24% dos modelos

Mediana do Mercado

94 tok/s

185% mais rápido

TTFT Mediano

1.11s

1804% mais lento

Vazão/Dólar

1537

tok/s por $/1M

Comparação de Velocidade

NVIDIA Nemotron Nano 12B v2 VL (Reasoning)

266 tok/s-1%

gpt-oss-20B (low)

265 tok/s-2%

Nova Micro

289 tok/s+7%

Benchmarks

MMLU-Pro

75.9%

GPQA Diamond

62.5%

HLE

6.4%

LiveCodeBench

59.3%

SciCode

19.3%

TerminalBench Hard

4.5%

MATH-500

96.9%

AIME

70.3%

AIME 2025

53.3%

IFBench

49.9%

Long Context Recall

51.3%

Tau2

18.4%

Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Magistral Small 1.2

Mistral

Q: 11.3$0.75/1M

Mais lento: 70%Mais caro: 329%

OpenAI: GPT-4o

OpenAI

Q: 11.2$4.38/1M128K ctx

Mais lento: 17%Mais caro: 2400%

Gemini 2.5 Flash Preview (Non-reasoning)

Google

Q: 11.7N/A/1M

Sonar Reasoning

Perplexity

Q: 11.7N/A/1M

MiniCPM5-1B (Non-reasoning)

OpenBMB

Q: 11.7N/A/1M

Código: -9.0

Qwen: Qwen3 VL 32B Instruct

Alibaba

Q: 11.1$0.18/1M262K ctx

Mais lento: 73%Código: +6.1

Comparar todos os 7 modelos