Tras los avances en digitalización e industria 4.0, las empresas progresan hacia nuevas fronteras tecnológicas para aumentar su productividad y los analistas comienzan a hablar de “Sociedad 5.0”, que, en el ámbito productivo, se sostiene en dos herramientas clave: los sistemas ciberfísicos y los datos sintéticos. Esta información se desprende del informe “Tech Translated: Cyberphysical systems”, desarrollado por PwC.
En los sistemas ciberfísicos se aprecia una intersección de la computación, las comunicaciones y los procesos físicos: por ejemplo, la robótica, los sistemas de control industrial (ICS), la convergencia de elementos del Internet de las cosas (IOT) con la inteligencia artificial. Su característica principal es que permiten la interacción entre un entorno físico y uno digital, es decir, que cualquier proceso físico susceptible de medición podría formar parte de un sistema ciberfísico integrado. Estos sistemas pueden crear valor mejorando la eficiencia y la seguridad, como cualquier otra tecnología enfocada en la automatización, pero, el valor más tangible resulta de la mejora constante de los resultados al comprender el funcionamiento de todo el sistema.
Según el estudio, los datos sintéticos surgen de la información creada de manera artificial mediante algoritmos, estadística o IA generativa, y que no surgen de manera directa de actividades desarrolladas en el mundo real. Para generarlos se analiza la información de cualquier fuente intentando detectar estructura o patrones que luego se utilizarán para crear nuevos conjuntos de datos que replican las características principales de los originales.
Riesgos y oportunidades
“Esta tecnología se instala en la idea de una ‘Sociedad 5.0’, una estructura compuesta por sistemas en los que múltiples redes tecnologías, organizaciones, personas y necesidades interconectadas convergen mediante datos compartidos y, además, se autocorrige de forma automática para crear un ecosistema eficiente, en constante perfeccionamiento, con enfoque en las personas e impulsado por la tecnología”, comenta Roberto Cruz, socio de PwC Argentina responsable de la práctica de Innovación Digital.
El texto detalla además que continúan existiendo riesgos ya que la mayor amenaza son las violaciones a la ciberseguridad que, debido a las necesarias interconexiones entre los entornos físicos y digitales, pueden manifestarse de tres maneras: ataque físicos-cibernéticos, que dañan la estructura física y pueden tener incidencia en el entorno digital; ataques cibernéticos-físicos, surgen en el entorno digital y están diseñados para impedir el funcionamiento del sistema físico, como los bloqueos por ransomware o ataques de denegación de servicio; y ataques ciber-cinéticos, que son aquellos que inician en el entorno digital con el objetivo de causar un daño físico a la propiedad o a las personas.
“A pesar de la presencia de amenazas considerables, vale la pena explorar el mundo de los sistemas ciberfísicos debido a su gran potencial, siempre y cuando el gobierno corporativo y la gestión del riesgo sean sólidos. Dada la omnipresencia de la tecnología digital, todos deberían interesarse por estos sistemas, desde los CIO, CTO, CISO o COO a los líderes de las empresas de todos los sectores”, explica Roberto Cruz.
Calidad de los datos: el punto de partida
La utilización de datos sintéticos es menos costosa y es una manera más rápida de acceder a grandes cantidades de información. Esto significa que tiene el potencial para impulsar la transformación basada en datos en cualquier industria al convertirse en la base para la formación de modelos de aprendizaje automático e inteligencia artificial que permitan el desarrollo de nuevos productos, servicios y modalidades de trabajo.
Sin embargo, la calidad de sus resultados depende de la calidad de las fuentes y los algoritmos. Las anomalías o valores atípicos en los datos de origen pueden amplificarse o perderse por completo, y cualquiera de las dos opciones hará que el producto final sea menos representativo. Además, los conjuntos de datos sintéticos pueden retener accidentalmente datos de identificación personal obtenidos de la fuente, lo que significaría una violación a la privacidad de los individuos.
“Es de conocimiento general que la IA generativa puede brindar información incorrecta cuando no puede reconocer anomalías en el modelo subyacente y formula conclusiones que parecen estadísticamente probables, pero que no están respaldadas por los datos reales. Esto afecta a todo el conjunto de datos sintéticos. Algunas personas creen que debido a esto la proliferación de datos sintéticos con el tiempo podría crear circuitos de retroalimentación que reducirían la fiabilidad de la información generada por la inteligencia artificial. Por eso es necesario contar con procesos de auditoría y control sólidos en los que intervengan las personas para garantizar el valor de los datos sintéticos”, expone Roberto Cruz.
Los datos sintéticos pueden ser útiles para casi todas las empresas y, probablemente, tanto los CIO, CTO y CISO como los sectores de investigación y desarrollo; datos y análisis; legal y cumplimiento regulatorio; y marketing y ventas, ya están analizando todas las opciones disponibles. Las industrias que enfrentan desafíos de privacidad de datos y accesos son las que probablemente se verán más beneficiadas.
Las decisiones empresariales siempre requieren tiempo, son costosas y pueden generar riesgos, por eso, identificar, recopilar y estructurar datos relevantes puede ser útil para estas situaciones.
“Las empresas enfrentan desafíos sobre normas de protección y tratamiento de datos, por ejemplo, si no es posible acceder a los datos adecuados por un problema de confidencialidad, privacidad, cumplimiento regulatorio, o porque no hay suficiente información útil. Los conjuntos de datos sintéticos son una posibilidad a considerar para sortear estos obstáculos”, concluye Roberto Cruz.