Ir para o conteúdo principal
Voltar para Explorar

Gemini 2.0 Flash Thinking Experimental (Jan '25)

Google·Lançado em 2025-01-21
MoEMultimodal

Benchmarks

MMLU-Pro
79.8%
GPQA Diamond
70.1%
HLE
7.1%
LiveCodeBench
32.1%
SciCode
32.9%
TerminalBench HardNão avaliado
MATH-500
94.4%
AIME
50.0%
AIME 2025Não avaliado
IFBenchNão avaliado
Long Context RecallNão avaliado
Tau2Não avaliado
Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos