Qué hace un data engineer y por qué sostiene proyectos de inteligencia artificial
La expansión de herramientas como ChatGPT y Gemini volvió masivo el uso de la inteligencia artificial, pero su funcionamiento depende de datos disponibles y confiables, un trabajo previo que recae en el data engineer, un perfil técnico que organiza, limpia y automatiza flujos de información para que las empresas puedan usarla con propósito

La adopción reciente de herramientas de inteligencia artificial como ChatGPT o Gemini instaló la idea de resultados inmediatos: generación de contenido, automatización de tareas y respuestas con mayor velocidad, precisión y eficiencia. Sin embargo, el rendimiento de estos sistemas depende de una condición menos visible: que los datos estén listos para ser usados y alineados con la aplicación final.
En esa etapa previa se ubica el data engineer, un perfil que trabaja antes del entrenamiento de modelos o de la implementación final de una solución. Su función se centra en preparar la base de información para sostener procesos analíticos y aplicaciones basadas en datos. “No es quien entrena modelos ni quien trabaja en la etapa final, sino el que trabaja en una capa anterior”, dijo Mariana Navarro, data engineer en Ingenia.
La especialista describió el rol como el primer paso en la construcción de cualquier solución basada en datos, con tareas que incluyen recolección, sanitización y transformación de información. “En definitiva, recolecta, sanitiza y transforma los datos; por ende, establece procesos ordenados, repetibles y confiables”, dijo Navarro, data engineer en Ingenia.
En la práctica, el trabajo abarca la construcción de *pipelines* que trasladan datos desde distintos orígenes hacia un entorno donde puedan utilizarse. Esos orígenes pueden ser sistemas, bases de datos, APIs o archivos. A la vez, el perfil se encarga de limpiar información duplicada o incompleta, definir reglas para asegurar consistencia y detectar errores antes de que se propaguen.
La complejidad aumenta cuando las fuentes presentan datos dispersos en múltiples sistemas y con estructuras difíciles de interpretar. En ese escenario, el data engineer transforma esos datos en información confiable y los organiza de forma estructurada y coherente. Ese orden se apoya en modelos que permitan su interpretación y uso sostenido: identificar qué tablas existen, cómo se relacionan y qué significado tiene cada campo.
Otra dimensión del rol es la automatización y la confiabilidad operativa de esos procesos. La actualización puede requerir tiempo real o una frecuencia definida, sin interrupciones y con trazabilidad para reconstruir el origen de cada dato. “Que los datos se actualicen en tiempo real o con cierta frecuencia; que los procesos no se rompan: que haya trazabilidad”, dijo Navarro, data engineer en Ingenia.
A esa capa se suma la gobernanza de datos, con reglas sobre quién accede, cómo se protegen y bajo qué condiciones se consideran confiables. En ese marco, la inteligencia artificial deja de ser solamente un problema de modelos y pasa a ser también un desafío de infraestructura: cuanto más se busca hacer con datos, más determinante se vuelve su calidad y su gestión cotidiana para obtener resultados consistentes en la práctica.
- Etiquetas
- Ingenia
- data engineer
- Mariana Navarro
Artículos relacionados

Google habilitó en Argentina la función “Pruébalo” para probar ropa y calzado
La herramienta de prueba virtual ya funciona en Google Shopping y el Buscador para usuarios con sesión iniciada, mayores de 18 años, y busca facilitar la compra online al mostrar cómo podrían verse tops, pantalones, vestidos y zapatos en una foto propia, con foco en privacidad y limitaciones de ajuste

Botmaker 3.0 incorpora agentes de IA para delegar procesos de negocio completos
La compañía presentó en Buenos Aires una arquitectura de agentes autónomos multimodales y orquestadores que apunta a ejecutar flujos operativos de punta a punta, con primeras implementaciones que registraron 98% de interacciones y respuestas correctas y una reducción de hasta 82% en el uso de recursos manuales mediante Human-in-the-Loop

Ericsson lidera por sexto año el Frost Radar de infraestructura 5G global
El informe Frost Radar™: 5G Network Infrastructure, 2026, de Frost & Sullivan ubicó a la compañía al frente de 20 firmas evaluadas entre más de 100 participantes y destacó su desempeño en crecimiento e innovación, con foco en inteligencia artificial, redes abiertas y eficiencia energética, en un mercado que acelera inversiones en infraestructura 5G

