Hermes 4 - Llama-3.1 405B (Non-reasoning)

Nous Research·Lançado em 2025-08-27

Open Source

Modelos Relacionados

Hermes 4 - Llama-3.1 70B (Reasoning)2025-08-27 Hermes 4 - Llama-3.1 405B (Reasoning)2025-08-27 Hermes 4 - Llama-3.1 70B (Non-reasoning)2025-08-27 Nous: Hermes 4 405B2025-08-26 Nous: Hermes 4 70B2025-08-26 Nous: Hermes 3 70B Instruct2024-08-18 Nous: Hermes 3 405B Instruct2024-08-16 Nous: Hermes 3 405B Instruct (free)2024-08-16

Índice de Qualidade

8.8

358th de 537

Top 67%

Índice de Código

18.1

245th de 447

Top 55%

Índice de Matemática

15.3

217th de 269

Top 81%

Preço/1M

$1.50

480th mais barato

176% acima da mediana

Top 71%

Velocidade

39 tok/s

Top 93%

TTFT

0.79s

Posição no Mercado

Hermes 4 - Llama-3.1 405B (Non-reasoning)Média do Mercado

Preços

Entrada

$1.00

por 1M tokens

Saída

$3.00

por 1M tokens

Combinado

$1.50

por 1M tokens

Mais barato que 29% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$1.50

Mensal

$45.00

vs. Modelos Similares

Gemini 2.0 Flash-Lite (Feb '25)Q:0.0

$0.13-91%

NVIDIA Nemotron Nano 9B V2 (Reasoning)Q:0.0

$0.07-95%

Qwen3.5 2B (Non-reasoning)Q:0.0

$0.04-97%

Gemma 4 E4B (Non-reasoning)Q:+0.1

$0.54-64%

Desempenho

tokens/seg

Mais rápido que 7% dos modelos

0.79

segundos

Mais rápido que 66% dos modelos

0.79

segundos

Mais rápido que 75% dos modelos

Mediana do Mercado

94 tok/s

59% mais lento

TTFT Mediano

1.11s

29% mais rápido

Vazão/Dólar

tok/s por $/1M

Comparação de Velocidade

Magistral Medium 1.2

39 tok/s-0%

OpenAI: GPT-4 Turbo

38 tok/s-1%

Qwen3.6 Max Preview

38 tok/s-2%

Benchmarks

MMLU-Pro

72.9%

GPQA Diamond

53.6%

HLE

4.2%

LiveCodeBench

54.6%

SciCode

34.6%

TerminalBench Hard

9.8%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

15.3%

IFBench

34.8%

Long Context Recall

20.0%

Tau2

26.6%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Gemini 2.0 Flash-Lite (Feb '25)

Google

Q: 8.8$0.13/1M1.0M ctx

Mais barato: 91%

NVIDIA Nemotron Nano 9B V2 (Reasoning)

NVIDIA

Q: 8.8$0.07/1M

Mais rápido: 83%Mais barato: 95%

Qwen3.5 2B (Non-reasoning)

Alibaba

Q: 8.8$0.04/1M

Mais barato: 97%

NVIDIA Nemotron 3 Nano 4B

NVIDIA

Q: 8.8N/A/1M

Código: -8.1

Gemma 4 E4B (Non-reasoning)

Google

Q: 8.9$0.54/1M

Mais rápido: 54%Mais barato: 64%

Granite 4.1 30B

IBM

Q: 8.9N/A/1M

Código: -7.7

Comparar todos os 7 modelos