Google: Gemini 3.1 Flash Lite Preview

Google·Lançado em 2026-03-03

1.0M ctxMultimodal

Sobre

Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across...

Modelos Relacionados

Google: Gemini 3.5 Flash2026-05-19 Gemini 3.5 Flash (medium)2026-05-19 Gemini 3.5 Flash (minimal)2026-05-19 Google: Gemini 3.1 Flash Lite2026-05-07 Google: Gemini 3.1 Pro Preview Custom Tools2026-02-25 Google: Gemini 3.1 Pro Preview2026-02-19 Gemini 3 Deep Think2026-02-05 Gemini 3 Flash Preview (Reasoning)2025-12-17

Índice de Qualidade

25.0

147th de 537

Top 28%

Índice de Código

34.7

112th de 447

Top 25%

Preço/1M

$0.56

348th mais barato

3% acima da mediana

Top 51%

Velocidade

329 tok/s

Top 4%

TTFT

4.92s

Janela de Contexto

1.0M

17th maior

Top 10%

Posição no Mercado

Google: Gemini 3.1 Flash Lite PreviewMédia do Mercado

Preços

Entrada

$0.25

por 1M tokens

Saída

$1.50

por 1M tokens

Combinado

$0.56

por 1M tokens

Mais barato que 49% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.56

Mensal

$16.88

vs. Modelos Similares

Qwen: Qwen3.5-9BQ:0.0

$0.11-80%

Qwen3 Max Thinking (Preview)Q:0.0

$2.40+327%

GLM-4.6 (Reasoning)Q:+0.1

$0.96+71%

Gemma 4 31B (Non-reasoning)Q:-0.2

$0.20-64%

Desempenho

329

tokens/seg

Mais rápido que 96% dos modelos

4.92

segundos

Mais rápido que 17% dos modelos

4.92

segundos

Mais rápido que 47% dos modelos

Mediana do Mercado

94 tok/s

248% mais rápido

TTFT Mediano

1.11s

342% mais lento

Vazão/Dólar

584

tok/s por $/1M

Comparação de Velocidade

LFM2 2.6B

335 tok/s+2%

gpt-oss-120b (low)

340 tok/s+4%

Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)

347 tok/s+5%

Janela de Contexto

1.0M

tokens

Maior que 90% dos modelos

Saída Máxima

66K

tokens

6% do contexto

Benchmarks

MMLU-ProNão avaliado

GPQA Diamond

82.2%

HLE

16.2%

LiveCodeBenchNão avaliado

SciCode

41.9%

TerminalBench Hard

24.2%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025Não avaliado

IFBench

77.2%

Long Context Recall

65.3%

Tau2

31.3%

Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Qwen: Qwen3.5-9B

Alibaba

Q: 25.0$0.11/1M262K ctx

Mais lento: 79%Mais barato: 80%

Qwen3 Max Thinking (Preview)

Alibaba

Q: 25.0$2.40/1M

Mais lento: 84%Mais caro: 327%

GLM-4.6 (Reasoning)

Z AI

Q: 25.1$0.96/1M

Mais lento: 83%Mais caro: 71%

Gemma 4 31B (Non-reasoning)

Google

Q: 24.8$0.20/1M

Mais lento: 83%Mais barato: 64%

Grok 4.3 (Non-reasoning)

xAI

Q: 24.8$1.56/1M

Mais lento: 64%Mais caro: 178%

Inception: Mercury 2

Inception

Q: 25.3$0.38/1M128K ctx

Mais rápido: 220%Mais barato: 33%

Comparar todos os 7 modelos