Llama 3.1 Instruct 405B

Meta·Released 2024-07-23

Open SourceMultimodal

Compare

Quality Index

8.5

370th of 537

Top 69%

Coding Index

14.5

282nd of 447

Top 64%

Math Index

3.0

257th of 269

Top 96%

Price/1M

$3.69

579th cheapest

578% above median

Top 85%

Speed

82 tok/s

Top 59%

TTFT

0.72s

Market Position

Llama 3.1 Instruct 405BMarket Average

Pricing

Input

$2.75

per 1M tokens

Output

$6.50

per 1M tokens

Blended

$3.69

per 1M tokens

Cheaper than 15% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$3.69

Monthly

$110.64

vs. Similar Models

Llama 3.3 Instruct 70BQ:+0.1

$0.61-83%

Mistral Small 3.1Q:+0.1

$0.14-96%

OpenAI: GPT-4o (2024-05-13)Q:+0.1

$7.50+103%

Qwen3 32B (Non-reasoning)Q:+0.1

$0.26-93%

Performance

tokens/sec

Faster than 41% of models

0.72

seconds

Faster than 69% of models

0.72

seconds

Faster than 78% of models

Market Median

94 tok/s

13% slower

Median TTFT

1.11s

35% faster

Throughput/Dollar

tok/s per $/1M

Speed Comparison

Mistral 7B Instruct

82 tok/s+0%

OpenAI: GPT-5.5

82 tok/s-1%

Ministral 3 8B

83 tok/s+1%

Benchmarks

MMLU-Pro

73.2%

GPQA Diamond

51.5%

HLE

4.2%

LiveCodeBench

30.5%

SciCode

29.9%

TerminalBench Hard

6.8%

MATH-500

70.3%

AIME

21.3%

AIME 2025

3.0%

IFBench

39.0%

Long Context Recall

24.3%

Tau2

19.0%

Market AverageTop Score

Open Source

Quick Compare

Similar Models

Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

NVIDIA

Q: 8.5N/A/1M

Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)

NVIDIA

Q: 8.5N/A/1M

Coding: -6.9

Kimi Linear 48B A3B Instruct

Kimi

Q: 8.5N/A/1M

Qwen: Qwen3 VL 8B Instruct

Alibaba

Q: 8.4$0.18/1M256K ctx

Faster: 74%Cheaper: 95%

OpenAI: GPT-4o (2024-05-13)

OpenAI

Q: 8.6$7.50/1M128K ctx

Faster: 54%Pricier: 103%

Llama 3.3 Instruct 70B

Llama 3.1 Instruct 405B

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position