Hermes lleva agentes de IA autoaprendibles a PCs NVIDIA RTX y DGX Spark
El sistema desarrollado por Nous Research se ejecuta de forma local y continua en PCs y workstations NVIDIA RTX, con soporte para DGX Spark, y se apoya en modelos Qwen 3.6 de Alibaba para acelerar tareas de agentes con menor latencia, un avance que apunta a mejorar flujos de trabajo de desarrollo y productividad
Hermes, un sistema de agentes de inteligencia artificial con capacidad de autoaprendizaje, se incorpora como una nueva clase de agentes para su ejecución en PCs y estaciones de trabajo NVIDIA RTX, con soporte también para workstations NVIDIA RTX PRO y para NVIDIA DGX Spark. El desarrollo está a cargo de Nous Research y apunta a combinar fiabilidad con aprendizaje autónomo en entornos locales.
Los agentes de IA se integran con aplicaciones de mensajería, acceden a archivos y aplicaciones locales y pueden operar de manera continua. En ese contexto, Hermes está optimizado para un uso local permanente, con funcionamiento “las 24 horas del día, los 7 días de la semana”. El diseño busca independencia de proveedor y de modelo, con foco en sostener la ejecución en el dispositivo.
En paralelo, la adopción de entornos de trabajo de código abierto basados en agentes se aceleró tras OpenClaw. Hermes Agent superó las 140.000 GitHub stars en menos de tres meses y, según datos de la semana pasada, figura como “el agente más utilizado del mundo” de acuerdo con OpenRouter.
Hermes se diferencia por cuatro características. La primera es la evolución autónoma de habilidades: “Hermes crea y perfecciona sus propias habilidades”. La segunda es el uso de subagentes contenidos, definidos como “trabajadores aislados y de corta duración dedicados a una subtarea”, con contexto y herramientas específicas, para reducir confusión y operar con ventanas de contexto más pequeñas. La tercera es la “fiabilidad desde el diseño”, ya que Nous Research selecciona y somete a pruebas de estrés cada habilidad, herramienta y complemento. La cuarta apunta a resultados comparativos: “Hermes es una capa de orquestación activa, no una simple envoltura”.
El esquema de ejecución local se apoya en modelos Qwen 3.6, una serie de modelos de lenguaje a gran escala de “peso abierto” de Alibaba. Qwen 3.6 35B funciona con aproximadamente 20 GB de memoria y supera a modelos de más de 120.000 millones de parámetros que requieren más de 70 GB. Además, Qwen 3.6 27B iguala la precisión de modelos de 400.000 millones de parámetros como Qwen 3.5 397B, con un tamaño 16 veces menor.
Para acelerar la inferencia —el proceso de ejecutar un modelo para producir respuestas—, se utiliza hardware con GPU NVIDIA RTX. Los NVIDIA Tensor Cores aceleran la inferencia para reducir latencia y permitir que Hermes complete tareas de varios pasos o perfeccione habilidades “en segundos, en lugar de minutos”.
En el segmento de hardware dedicado, NVIDIA DGX Spark se presenta como una computadora compacta para flujos de trabajo de agentes continuos durante todo el día. Cuenta con 128 GB de memoria unificada y 1 petaflop de rendimiento de IA, y ya está disponible para su compra a través de socios fabricantes de NVIDIA.
Para comenzar, Hermes puede ejecutarse combinándolo con Qwen 3.6 mediante llama.cpp, LM Studio u Ollama, a partir del repositorio de GitHub de Hermes.
- Etiquetas
- hermes
- Nous Research
Artículos relacionados

Elegoo presentó la serie Centauri 2 con impresión 3D multicolor y marco abierto
La compañía lanzó dos modelos —Centauri 2 y Centauri 2 Combo— con sistema CANVAS para imprimir en cuatro colores, velocidades de hasta 500 mm/s y automatización de calibración y sensores, con precios desde US$ 299 y disponibilidad a través de sus tiendas online con envíos a varios mercados

IBM presentó una tecnología de chip sub-1 nm con arquitectura 3D nanostack
La compañía introdujo un diseño en nodo de 0,7 nm (7 angstroms) con casi 100 mil millones de transistores y proyecciones de hasta 50% más rendimiento o 70% más eficiencia energética frente a su chip de 2 nm, un avance que busca extender el escalado en semiconductores para IA generativa y nube

Huawei llevó a MWC Shanghai innovaciones para monetizar tokens con redes 5G-A
En MWC Shanghai 2026, la compañía presentó desarrollos que integran servicios, redes y cómputo para impulsar el crecimiento en telecomunicaciones medido en bytes y tokens, con foco en enlace ascendente de alta velocidad, banda superior de 6 GHz y modernización empresarial con inteligencia artificial, en un escenario de expansión de modelos y agentes de IA

