Back to Explore

LongCat Flash Lite

LongCat·Released 2026-01-28

Performance

117

tokens/sec

Faster than 61% of models

4.63

seconds

Faster than 17% of models

4.63

seconds

Faster than 48% of models

Market Median

94 tok/s

25% faster

Median TTFT

1.10s

319% slower

Speed Comparison

Mistral: Mistral Medium 3.5

117 tok/s+0%

GLM-4.7 (Non-reasoning)

117 tok/s+0%

Z.ai: GLM 4.7

116 tok/s-1%

Benchmarks

MMLU-ProNot evaluated

GPQA Diamond

63.6%

HLE

6.0%

LiveCodeBenchNot evaluated

SciCode

28.4%

TerminalBench Hard

10.6%

MATH-500Not evaluated

AIMENot evaluated

AIME 2025Not evaluated

IFBench

43.1%

Long Context Recall

25.7%

Tau2

79.5%

Market AverageTop Score

Quick Compare

Similar Models

GPT-5 (minimal)

OpenAI

Q: 17.2$3.44/1M

Slower: 33%Coding: +8.5

K2 Think V2

MBZUAI

HyperCLOVA X SEED Think (32B)

Naver

o1-preview

OpenAI

Q: 17.0$28.88/1M

Grok 4.1 Fast (Non-reasoning)

xAI

Q: 16.9$0.28/1M2.0M ctx

Gemini 2.5 Flash Preview (Reasoning)

Google

Compare all 7 models