Ir para o conteúdo principal
Voltar para Explorar

Google: Gemini 2.5 Flash Lite

Google·Lançado em 2025-07-22
1.0M ctxMoEMultimodal

Sobre

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance...

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.17

por 1M tokens

Mais barato que 72% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.17

Mensal

$5.25

vs. Modelos Similares

Hermes 4 - Llama-3.1 70B (Non-reasoning)Q:0.0
$0.20+13%
Mistral Small 3Q:0.0
$0.10-41%
Nova LiteQ:0.0
$0.10-40%
OpenAI: GPT-4o-miniQ:0.0
$0.26+50%

Desempenho

227

tokens/seg

Mais rápido que 92% dos modelos

0.32

segundos

Mais rápido que 97% dos modelos

0.32

segundos

Mais rápido que 99% dos modelos

Mediana do Mercado

94 tok/s

142% mais rápido

TTFT Mediano

1.10s

71% mais rápido

Vazão/Dólar

1296

tok/s por $/1M

Comparação de Velocidade

Google: Gemini 2.5 Flash
226 tok/s-0%
Qwen3 0.6B (Reasoning)
224 tok/s-1%
Gemini 2.5 Flash (Reasoning)
224 tok/s-1%

Janela de Contexto

1.0M

tokens

Maior que 90% dos modelos

Saída Máxima

66K

tokens

6% do contexto

Benchmarks

MMLU-Pro
72.4%
GPQA Diamond
47.4%
HLE
3.7%
LiveCodeBench
40.0%
SciCode
17.7%
TerminalBench Hard
2.3%
MATH-500
92.6%
AIME
50.0%
AIME 2025
35.3%
IFBench
31.5%
Long Context Recall
31.3%
Tau2
19.0%
Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos

Usado por Agentes