Microsoft: Phi 4

Microsoft·Released 2025-01-10

Open Source16K ctxMIT

About

[Microsoft Research](/microsoft) Phi-4 is designed to perform well in complex reasoning tasks and can operate efficiently in situations with limited memory or where quick responses are needed. At 14 billion...

Quality Index

4.9

446th of 537

Top 83%

Coding Index

11.2

333rd of 447

Top 75%

Math Index

18.0

214th of 269

Top 80%

Price/1M

$0.09

102nd cheapest

84% below median

Top 15%

Speed

40 tok/s

Top 93%

TTFT

0.49s

Context Window

16K

421st largest

Top 95%

Market Position

Microsoft: Phi 4Market Average

Pricing

Input

$0.07

per 1M tokens

Output

$0.14

per 1M tokens

Blended

$0.09

per 1M tokens

Cheaper than 85% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.09

Monthly

$2.63

vs. Similar Models

LFM2 24B A2BQ:0.0

$0.05-41%

Qwen3.5 0.8BQ:+0.1

$0.02-77%

Jamba 1.6 LargeQ:+0.1

$3.50+3900%

Jamba 1.5 LargeQ:+0.2

$3.50+3900%

Performance

tokens/sec

Faster than 7% of models

0.49

seconds

Faster than 89% of models

0.49

seconds

Faster than 93% of models

Market Median

94 tok/s

58% slower

Median TTFT

1.11s

56% faster

Throughput/Dollar

452

tok/s per $/1M

Speed Comparison

Qwen3.5 4B (Non-reasoning)

40 tok/s+0%

Hermes 4 - Llama-3.1 405B (Reasoning)

40 tok/s+1%

Claude 4.1 Opus (Reasoning)

40 tok/s+1%

Context Window

16K

tokens

Larger than 5% of models

Max Output

16K

tokens

100% of context

Benchmarks

MMLU-Pro

71.4%

GPQA Diamond

57.5%

HLE

4.1%

LiveCodeBench

23.1%

SciCode

26.0%

TerminalBench Hard

3.8%

MATH-500

81.0%

AIME

14.3%

AIME 2025

18.0%

IFBench

23.5%

Long Context Recall

0.0%

Tau2

0.0%

Market AverageTop Score

Open Source

View model repository

mit

Downloads

868.2K

Likes

2.3K

Quick Compare

Similar Models

LFM2 24B A2B

Liquid AI

Q: 4.9$0.05/1M

Faster: 181%Cheaper: 41%

Gemini 1.5 Flash (May '24)

Google

Q: 4.9N/A/1M

Qwen3.5 0.8B

Alibaba

Q: 5.0$0.02/1M

Slower: 24%Cheaper: 77%

OLMo 2 32B

Allen AI

Q: 5.0N/A/1M

Coding: -8.5

Jamba 1.6 Large

AI21 Labs

Q: 5.0$3.50/1M

Faster: 55%Pricier: 3900%

Nous: Hermes 3 70B Instruct

Nous Research

Q: 5.1$0.70/1M131K ctx

Slower: 25%Pricier: 700%

Compare all 7 models

Microsoft: Phi 4

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position