Llama 3.3 Instruct 70B

Meta·Released 2024-12-06

Open SourceMultimodal

Compare

Quality Index

8.6

364th of 537

Top 69%

Coding Index

10.7

344th of 447

Top 77%

Math Index

7.7

236th of 269

Top 88%

Price/1M

$0.61

353rd cheapest

13% above median

Top 52%

Speed

92 tok/s

Top 51%

TTFT

0.65s

Market Position

Llama 3.3 Instruct 70BMarket Average

Pricing

Input

$0.58

per 1M tokens

Output

$0.71

per 1M tokens

Blended

$0.61

per 1M tokens

Cheaper than 48% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.61

Monthly

$18.36

vs. Similar Models

Mistral Small 3.1Q:0.0

$0.14-77%

OpenAI: GPT-4o (2024-05-13)Q:0.0

$7.50+1125%

Qwen3 32B (Non-reasoning)Q:0.0

$0.26-58%

Llama Nemotron Super 49B v1.5 (Non-reasoning)Q:+0.1

$0.17-71%

Performance

tokens/sec

Faster than 49% of models

0.65

seconds

Faster than 73% of models

0.65

seconds

Faster than 81% of models

Market Median

94 tok/s

3% slower

Median TTFT

1.11s

41% faster

Throughput/Dollar

150

tok/s per $/1M

Speed Comparison

MiMo-V2-Flash (Reasoning)

91 tok/s-1%

Hermes 4 - Llama-3.1 70B (Non-reasoning)

91 tok/s-1%

Hermes 4 - Llama-3.1 70B (Reasoning)

90 tok/s-1%

Benchmarks

MMLU-Pro

71.3%

GPQA Diamond

49.8%

HLE

4.0%

LiveCodeBench

28.8%

SciCode

26.0%

TerminalBench Hard

3.0%

MATH-500

77.3%

AIME

30.0%

AIME 2025

7.7%

IFBench

47.1%

Long Context Recall

15.0%

Tau2

26.6%

Market AverageTop Score

Open Source

Quick Compare

Similar Models

OpenAI: GPT-4o (2024-05-13)

OpenAI

Q: 8.6$7.50/1M128K ctx

Faster: 38%Pricier: 1125%

K2-V2 (low)

MBZUAI

Q: 8.6N/A/1M

Gemini 2.0 Flash-Lite (Preview)

Google

Q: 8.6N/A/1M

Mistral Small 3.1

Mistral

Q: 8.6$0.14/1M

Faster: 65%Cheaper: 77%

Qwen3 32B (Non-reasoning)

Alibaba

Q: 8.6$0.26/1M

Cheaper: 58%

Llama 3.1 Instruct 405B

Llama 3.3 Instruct 70B

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position