Ir para o conteúdo principal
Voltar para Explorar

Google: Gemini 2.5 Flash Lite Preview 09-2025

Google·Lançado em 2025-09-25
1.0M ctxMoEMultimodal

Sobre

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance...

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.17

por 1M tokens

Mais barato que 72% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.17

Mensal

$5.25

vs. Modelos Similares

Gemma 4 12B (Non-reasoning)Q:+0.1
$0.15-14%
Qwen3 VL 30B A3B (Reasoning)Q:+0.2
$0.34+93%
QwQ 32BQ:+0.3
$0.74+326%
Qwen3 235B A22B (Reasoning)Q:+0.3
$2.63+1400%

Desempenho

353

tokens/seg

Mais rápido que 98% dos modelos

0.43

segundos

Mais rápido que 93% dos modelos

0.43

segundos

Mais rápido que 95% dos modelos

Mediana do Mercado

94 tok/s

277% mais rápido

TTFT Mediano

1.10s

61% mais rápido

Vazão/Dólar

2020

tok/s por $/1M

Comparação de Velocidade

Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)
347 tok/s-2%
LFM2 2.6B
331 tok/s-6%
gpt-oss-120b (low)
327 tok/s-7%

Janela de Contexto

1.0M

tokens

Maior que 90% dos modelos

Saída Máxima

66K

tokens

6% do contexto

Benchmarks

MMLU-Pro
79.6%
GPQA Diamond
65.1%
HLE
4.6%
LiveCodeBench
64.1%
SciCode
28.5%
TerminalBench Hard
7.6%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
46.7%
IFBench
41.8%
Long Context Recall
48.0%
Tau2
30.4%
Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos

Usado por Agentes