Por María Teresa Ballestar de las Heras (*)
Prueba de ello es que si realizamos una búsqueda en Google Trends del término en inglés “ciencia de datos” (data science) vemos que el interés por esta disciplina no ha hecho más que crecer.
Transcurrida una década, la misma revista confirmó en otro artículo que, si bien la profesión continuaba siendo la más sexy del siglo, esta había evolucionado. Ahora veremos cómo.
Actualmente, el científico de datos es indispensable en aquellas empresas que ambicionan aprovechar las tecnologías digitales. Como consecuencia, se han definido con mayor precisión roles y responsabilidades y la forma en la que estos profesionales pueden aportar un gran valor. Por este motivo, los mejores científicos de datos no solo son buenos en matemáticas, estadística y computación, sino que también entienden de negocios.
Pero para entender mejor esta evolución, hay que aclarar primero qué es la ciencia de datos y para qué sirve.
¿Qué es la ciencia de datos?
La ciencia de datos es un área de conocimiento multidisciplinar. Es decir, que nace de la combinación de varias disciplinas científicas: la estadística, las matemáticas y las ciencias de la computación aplicadas al análisis de datos en diversas industrias o áreas de negocio.
Su objetivo es la resolución de problemas complejos que requieren el procesamiento y análisis avanzado de datos, aplicados a industrias de cualquier tipo. La ciencia de datos forma parte de la inteligencia artificial que está en boca de todos desde el lanzamiento de ChatGPT en noviembre de 2022.
Según la consultora estadounidense de referencia McKinsey, las empresas que usan estas tecnologías están logrando, en tan solo cinco años, el doble de ingresos en comparación con las que no las usan.
La ciencia de datos y la inteligencia artificial son herramientas poderosas para la diferenciación de las marcas en mercados muy competitivos. Sectores que han destacado por su rápida y fructífera adopción son la banca, el sector farmacéutico y salud, marketing y ventas, y distribución.
¿Que tipos de científicos de datos hay?
La evolución del papel de los científicos de datos se ha debido principalmente a dos factores. En primer lugar, a la integración plena del rol de científico de datos dentro de la organización, proporcionándole competencias y conocimientos específicos del negocio. Un científico de datos alcanza su mayor potencial cuando comprende el propósito de los productos que desarrolla. Por este motivo, las formaciones específicas ya incluyen el desarrollo de competencias más allá de las meramente analíticas o técnicas.
En segundo lugar, en el mundo de la ciencia de datos, los análisis de mayor complejidad son también aquellos que generan más valor para las organizaciones y la sociedad. Este hecho queda perfectamente reflejado en la escalera de valor analítico de otra consultora de referencia, Gartner. Para realizar análisis cada vez más complejos, también se necesitan tecnologías de computación cada vez más sofisticadas. Aquí entra en juego la computación en la nube.
Al tratarse de tecnologías muy variadas y complejas los científicos de datos han tenido que optar por la especialización, dando lugar a múltiples perfiles. Este alto grado de especialización es también habitual en otras áreas de conocimiento como la medicina o la ingeniería.
Por lo tanto, podemos encontrar científicos de datos que realizan tareas muy diferentes dentro de un mismo equipo de trabajo. Desde los que se dedican a almacenar y procesar datos, otros que modelan el dato o los que trabajan con las áreas del negocio en la definición de los casos de uso.
La coordinación de todos ellos para conseguir el objetivo final es uno de los retos a los que se enfrentan los proyectos de ciencia de datos. Puede parecer algo sencillo pero no lo es en absoluto.
Según un estudio de McKinsey, el 85 % de los proyectos de ciencia de datos nunca llegan a buen puerto. Este alto porcentaje de fracaso se debe fundamentalmente a tres motivos:
- La dificultad de acceso e integración de los datos.
- La falta de calidad de los datos.
- El último, y el más difícil de corregir, es la falta de entendimiento entre las áreas de negocio y los equipos de datos y tecnología. Los humanos somos el eslabón más débil de la cadena.
Entonces, en este ecosistema complejo de tipos de científicos de datos surge una duda muy importante.
¿Cuales son las vías de formación o carreras para ser un científico de datos?
La respuesta es sencilla y complicada al mismo tiempo. No hay una vía única de formación para ser científico de datos. Sí hay carreras para ser científico de datos: grados y masters de Data Analytics, Big Data y Data Science, pero no son la única manera de lograrlo.
Si bien es cierto que un sólido conocimiento de estadística, matemáticas y computación es imprescindible, no hace esta profesión exclusiva de matemáticos, estadísticos e ingenieros informáticos. Otros perfiles científicos están altamente capacitados para incorporarse a esta disciplina con formación adicional. Asimismo, perfiles de economía y empresa están siendo capaces de realizar su transición al mundo del dato con gran éxito y, además, son muy valiosos a la hora de facilitar la conversación y entendimiento con las áreas del negocio en proyectos complejos.
Sin embargo, a la hora de convertirse en científico de datos se deben tener en consideración varios aspectos. En primer lugar, es importante diseñar un camino formativo acorde a la especialidad elegida. De la misma forma que un neurólogo estudia una especialidad de medicina diferente a la de un oftalmólogo o un dermatólogo.
El segundo aspecto importante consiste en elegir con cuidado el tipo de formación para adquirir estos conocimientos y competencias. La alta demanda de estos perfiles ha generado una gran oferta formativa de diversa calidad y duración. La ciencia de datos es una disciplina científica compleja y no hay atajos.
Estamos en la era de la inteligencia artificial. Según Bill Gates, esta representa la segunda revolución tecnológica. Está en nuestras manos elegir el rol que vamos a ocupar en esta revolución, porque todo lo que es ciencia de datos estará en primera línea.
(*) Profesor Titular de Universidad en Economía Aplicada y Estadística, Universidad Rey Juan Carlos