Inception: Mercury 2

Inception·Released 2026-03-04

128K ctx

About

Mercury 2 is an extremely fast reasoning LLM, and the first reasoning diffusion LLM (dLLM). Instead of generating tokens sequentially, Mercury 2 produces and refines multiple tokens in parallel, achieving...

Quality Index

32.8

125th of 507

Top 25%

Coding Index

30.6

113th of 417

Top 27%

Price/1M

$0.38

269th cheapest

33% below median

Top 43%

Speed

777 tok/s

Top 0%

TTFT

3.58s

Context Window

128K

284th largest

Top 78%

Market Position

Inception: Mercury 2Market Average

Pricing

Input

$0.25

per 1M tokens

Output

$0.75

per 1M tokens

Blended

$0.38

per 1M tokens

Cheaper than 57% of models. Median price is $0.56/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.38

Monthly

$11.25

vs. Similar Models

DeepSeek V3.2 Exp (Reasoning)Q:+0.1

$0.31-17%

Claude 4 Opus (Non-reasoning)Q:+0.2

$32.81+8650%

Claude 4 Sonnet (Non-reasoning)Q:+0.2

$6.56+1650%

GLM-4.6 (Reasoning)Q:-0.3

$0.96+157%

Performance

777

tokens/sec

Faster than 100% of models

3.58

seconds

Faster than 19% of models

3.58

seconds

Faster than 48% of models

Market Median

86 tok/s

805% faster

Median TTFT

1.07s

234% slower

Throughput/Dollar

2072

tok/s per $/1M

Speed Comparison

Qwen3.5 0.8B

422 tok/s-46%

Qwen3.5 2B

364 tok/s-53%

Qwen3.5 0.8B (Non-reasoning)

357 tok/s-54%

Context Window

128K

tokens

Larger than 22% of models

Max Output

50K

tokens

39% of context

Benchmarks

MMLU-ProNot evaluated

GPQA Diamond

77.0%

HLE

15.5%

LiveCodeBenchNot evaluated

SciCode

38.7%

TerminalBench Hard

26.5%

MATH-500Not evaluated

AIMENot evaluated

AIME 2025Not evaluated

IFBench

69.8%

Long Context Recall

36.3%

Tau2

70.8%

Market AverageTop Score

Quick Compare

Similar Models

DeepSeek V3.2 Exp (Reasoning)

DeepSeek

Q: 32.9$0.31/1M

Slower: 90%Cheaper: 17%

Claude 4 Sonnet (Non-reasoning)

Anthropic

Q: 33.0$6.56/1M

Slower: 94%Pricier: 1650%

Claude 4 Opus (Non-reasoning)

Anthropic

Q: 33.0$32.81/1M

Slower: 95%Pricier: 8650%

GLM-4.6 (Reasoning)

Z AI

Q: 32.5$0.96/1M

Slower: 96%Pricier: 157%

Qwen3 Max Thinking (Preview)

Alibaba

Q: 32.5$2.40/1M

Slower: 94%Pricier: 540%

OpenAI: o4 Mini

OpenAI

Q: 33.1$1.93/1M200K ctx

Slower: 83%Pricier: 413%

Compare all 7 models

Quality Index

32.8

125th of 507

Top 25%

Coding Index

30.6

113th of 417

Top 27%

Price/1M

$0.38

269th cheapest

33% below median

Top 43%

Speed

777 tok/s

Top 0%

TTFT

3.58s

Context Window

128K

284th largest

Top 78%

Market Position

Inception: Mercury 2Market Average

Inception: Mercury 2

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Quick Compare

Similar Models

Market Position