Ir para o conteúdo principal
Voltar para Explorar

Gemini 3.1 Flash-Lite

Google·Lançado em 2026-03-03
1.0M ctxMultimodal

Sobre

Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across...

Preços

Entrada

$0.25

por 1M tokens

Saída

$1.50

por 1M tokens

Combinado

$0.56

por 1M tokens

Mais barato que 50% dos modelos. Preço mediano é $0.57/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.56

Mensal

$16.89

vs. Modelos Similares

Qwen3.5 9B (Reasoning)Q:0.0
$0.11-80%
Qwen3 Max Thinking (Preview)Q:0.0
$2.40+326%
GLM-4.6 (Reasoning)Q:+0.1
$0.96+71%
Gemma 4 31B (Non-reasoning)Q:-0.2
$0.20-64%

Desempenho

324

tokens/seg

Mais rápido que 96% dos modelos

5.14

segundos

Mais rápido que 17% dos modelos

5.14

segundos

Mais rápido que 47% dos modelos

Mediana do Mercado

95 tok/s

242% mais rápido

TTFT Mediano

1.11s

364% mais lento

Vazão/Dólar

575

tok/s por $/1M

Comparação de Velocidade

LFM2 2.6B
332 tok/s+2%
gpt-oss-120b (low)
340 tok/s+5%
gpt-oss-120b (high)
302 tok/s-7%

Janela de Contexto

1.0M

tokens

Maior que 90% dos modelos

Saída Máxima

66K

tokens

6% do contexto

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
82.2%
HLE
16.2%
LiveCodeBenchNão avaliado
SciCode
41.9%
TerminalBench Hard
24.2%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
77.2%
Long Context Recall
65.3%
Tau2
31.3%
Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos