Hermes 4 - Llama-3.1 70B (Non-reasoning)

Nous Research·Lançado em 2025-08-27

Open Source

Modelos Relacionados

Hermes 4 - Llama-3.1 70B (Reasoning)2025-08-27 Hermes 4 - Llama-3.1 405B (Reasoning)2025-08-27 Hermes 4 - Llama-3.1 405B (Non-reasoning)2025-08-27 Nous: Hermes 4 405B2025-08-26 Nous: Hermes 4 70B2025-08-26 Nous: Hermes 3 70B Instruct2024-08-18 Nous: Hermes 3 405B Instruct2024-08-16 Nous: Hermes 3 405B Instruct (free)2024-08-16

Índice de Qualidade

6.9

405th de 537

Top 76%

Índice de Código

9.2

365th de 447

Top 82%

Índice de Matemática

11.3

229th de 269

Top 85%

Preço/1M

$0.20

202nd mais barato

64% abaixo da mediana

Top 30%

Velocidade

91 tok/s

Top 51%

TTFT

0.63s

Posição no Mercado

Hermes 4 - Llama-3.1 70B (Non-reasoning)Média do Mercado

Preços

Entrada

$0.13

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.20

por 1M tokens

Mais barato que 70% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.20

Mensal

$5.94

vs. Modelos Similares

Google: Gemini 2.5 Flash LiteQ:0.0

$0.17-12%

Mistral Small 3Q:0.0

$0.10-47%

Nova LiteQ:0.0

$0.10-47%

OpenAI: GPT-4o-miniQ:0.0

$0.26+33%

Desempenho

tokens/seg

Mais rápido que 49% dos modelos

0.63

segundos

Mais rápido que 75% dos modelos

0.63

segundos

Mais rápido que 83% dos modelos

Mediana do Mercado

94 tok/s

4% mais lento

TTFT Mediano

1.11s

44% mais rápido

Vazão/Dólar

459

tok/s por $/1M

Comparação de Velocidade

MiMo-V2-Flash (Reasoning)

91 tok/s+0%

Hermes 4 - Llama-3.1 70B (Reasoning)

90 tok/s-0%

Llama 3.3 Instruct 70B

92 tok/s+1%

Benchmarks

MMLU-Pro

66.4%

GPQA Diamond

49.1%

HLE

3.6%

LiveCodeBench

26.9%

SciCode

27.7%

TerminalBench Hard

0.0%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

11.3%

IFBench

29.0%

Long Context Recall

2.0%

Tau2

21.6%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Google: Gemini 2.5 Flash Lite

Google

Q: 6.9$0.17/1M1.0M ctx

Mais rápido: 132%Mais barato: 12%

OpenAI: GPT-4o-mini

OpenAI

Q: 6.9$0.26/1M128K ctx

Mais lento: 20%Mais caro: 33%

Mistral Small 3

Mistral

Q: 6.9$0.10/1M

Mais rápido: 61%Mais barato: 47%

Nova Lite

Amazon

Q: 6.9$0.10/1M

Mais rápido: 94%Mais barato: 47%

Z.ai: GLM 4.5V

Z AI

Q: 7.0$0.90/1M66K ctx

Mais lento: 50%Mais caro: 355%

OpenAI: GPT-4

OpenAI

Q: 7.0$37.50/1M8K ctx

Mais lento: 54%Mais caro: 18839%

Comparar todos os 7 modelos