Voltar para Explorar
Hermes 4 - Llama-3.1 70B (Non-reasoning)
Nous Research·Lançado em 2025-08-27
Open Source
Modelos Relacionados
Hermes 4 - Llama-3.1 70B (Reasoning)2025-08-27Hermes 4 - Llama-3.1 405B (Reasoning)2025-08-27Hermes 4 - Llama-3.1 405B (Non-reasoning)2025-08-27Nous: Hermes 4 405B2025-08-26Nous: Hermes 4 70B2025-08-26Nous: Hermes 3 70B Instruct2024-08-18Nous: Hermes 3 405B Instruct2024-08-16Nous: Hermes 3 405B Instruct (free)2024-08-16
Preços
Entrada
$0.13
por 1M tokens
Saída
$0.40
por 1M tokens
Combinado
$0.20
por 1M tokens
Mais barato que 70% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Tokens por dia1M
100K100M
Diário
$0.20
Mensal
$5.94
vs. Modelos Similares
Google: Gemini 2.5 Flash LiteQ:0.0
$0.17-12%
Mistral Small 3Q:0.0
$0.10-47%
Nova LiteQ:0.0
$0.10-47%
OpenAI: GPT-4o-miniQ:0.0
$0.26+33%
Desempenho
90
tokens/seg
Mais rápido que 48% dos modelos
0.62
segundos
Mais rápido que 75% dos modelos
0.62
segundos
Mais rápido que 83% dos modelos
Mediana do Mercado
94 tok/s
3% mais lento
TTFT Mediano
1.10s
44% mais rápido
Vazão/Dólar
457
tok/s por $/1M
Comparação de Velocidade
Qwen3 32B (Non-reasoning)
91 tok/s+0%
Qwen3.5 27B (Non-reasoning)
90 tok/s-0%
Grok 4 Fast (Reasoning)
90 tok/s-1%
Benchmarks
MMLU-Pro
66.4%
GPQA Diamond
49.1%
HLE
3.6%
LiveCodeBench
26.9%
SciCode
27.7%
TerminalBench Hard
0.0%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
11.3%
IFBench
29.0%
Long Context Recall
2.0%
Tau2
21.6%
Média do MercadoMelhor Score