Hermes lleva agentes de IA autoaprendibles a PCs NVIDIA RTX y DGX Spark
El sistema desarrollado por Nous Research se ejecuta de forma local y continua en PCs y workstations NVIDIA RTX, con soporte para DGX Spark, y se apoya en modelos Qwen 3.6 de Alibaba para acelerar tareas de agentes con menor latencia, un avance que apunta a mejorar flujos de trabajo de desarrollo y productividad
Hermes, un sistema de agentes de inteligencia artificial con capacidad de autoaprendizaje, se incorpora como una nueva clase de agentes para su ejecución en PCs y estaciones de trabajo NVIDIA RTX, con soporte también para workstations NVIDIA RTX PRO y para NVIDIA DGX Spark. El desarrollo está a cargo de Nous Research y apunta a combinar fiabilidad con aprendizaje autónomo en entornos locales.
Los agentes de IA se integran con aplicaciones de mensajería, acceden a archivos y aplicaciones locales y pueden operar de manera continua. En ese contexto, Hermes está optimizado para un uso local permanente, con funcionamiento “las 24 horas del día, los 7 días de la semana”. El diseño busca independencia de proveedor y de modelo, con foco en sostener la ejecución en el dispositivo.
En paralelo, la adopción de entornos de trabajo de código abierto basados en agentes se aceleró tras OpenClaw. Hermes Agent superó las 140.000 GitHub stars en menos de tres meses y, según datos de la semana pasada, figura como “el agente más utilizado del mundo” de acuerdo con OpenRouter.
Hermes se diferencia por cuatro características. La primera es la evolución autónoma de habilidades: “Hermes crea y perfecciona sus propias habilidades”. La segunda es el uso de subagentes contenidos, definidos como “trabajadores aislados y de corta duración dedicados a una subtarea”, con contexto y herramientas específicas, para reducir confusión y operar con ventanas de contexto más pequeñas. La tercera es la “fiabilidad desde el diseño”, ya que Nous Research selecciona y somete a pruebas de estrés cada habilidad, herramienta y complemento. La cuarta apunta a resultados comparativos: “Hermes es una capa de orquestación activa, no una simple envoltura”.
El esquema de ejecución local se apoya en modelos Qwen 3.6, una serie de modelos de lenguaje a gran escala de “peso abierto” de Alibaba. Qwen 3.6 35B funciona con aproximadamente 20 GB de memoria y supera a modelos de más de 120.000 millones de parámetros que requieren más de 70 GB. Además, Qwen 3.6 27B iguala la precisión de modelos de 400.000 millones de parámetros como Qwen 3.5 397B, con un tamaño 16 veces menor.
Para acelerar la inferencia —el proceso de ejecutar un modelo para producir respuestas—, se utiliza hardware con GPU NVIDIA RTX. Los NVIDIA Tensor Cores aceleran la inferencia para reducir latencia y permitir que Hermes complete tareas de varios pasos o perfeccione habilidades “en segundos, en lugar de minutos”.
En el segmento de hardware dedicado, NVIDIA DGX Spark se presenta como una computadora compacta para flujos de trabajo de agentes continuos durante todo el día. Cuenta con 128 GB de memoria unificada y 1 petaflop de rendimiento de IA, y ya está disponible para su compra a través de socios fabricantes de NVIDIA.
Para comenzar, Hermes puede ejecutarse combinándolo con Qwen 3.6 mediante llama.cpp, LM Studio u Ollama, a partir del repositorio de GitHub de Hermes.
- Etiquetas
- hermes
- Nous Research
Artículos relacionados

AWS presenta Startup Advisor y una capacidad de migración con IA para startups
Las nuevas herramientas, disponibles en startups.aws e integradas a IDE como VS Code y Cursor, apuntan a ayudar a fundadores a configurar y optimizar entornos en la nube y a generar planes de migración en minutos, con foco en infraestructura, seguridad, costos y arquitectura

Lenovo aportará infraestructura de IA para IPTV de baja latencia en el Mundial 2026
La compañía desplegará servidores y soluciones de computación perimetral en sedes de FIFA en Estados Unidos para sostener la distribución de video por IPTV con retrasos inferiores a cinco segundos, además de apoyar el control operativo del torneo, que reunirá a 48 selecciones y apunta a una audiencia estimada de 6.000 millones de aficionados

GIGABYTE exhibe en COMPUTEX 2026 motherboards Z890 Plus con CQDIMM y DDR5
En Taipéi, la compañía mostró placas base compatibles con módulos CQDIMM y configuraciones DDR5 de dos DIMM que llegan a 256 GB y hasta 10.400 MT/s, con foco en usuarios orientados al rendimiento y en la validación de memorias de alta frecuencia junto a fabricantes del sector

