Nuevas técnicas para entender la enorme masa de datos

spot_img

En San Diego se reúnen académicos para presentar las nuevas técnicas de data mining que pueden ayudar a las empresas a extraer conocimiento de las inmensas bases de datos que genera diariamente Internet. La cantidad de datos exige nuevas técnicas.

<p>Cient&iacute;ficos de compa&ntilde;&iacute;as como Google y Yahoo se re&uacute;nen esta semana en San Diego, California con los m&aacute;s altos acad&eacute;micos en la 17a conferencia de la <em>Association for Computing Machinery</em> (ACM) sobre Descubrimiento de Conocimiento y Data Mining. Presentar&aacute;n las &uacute;ltimas t&eacute;cnicas para extraer conocimiento entre el diluvio de datos que se producen en la actualidad y para interpretar la informaci&oacute;n que viene en la variedad de formas m&aacute;s enorme que se ha visto jam&aacute;s.</p>
<p>Hace veinte a&ntilde;os, los &uacute;nicos que se preocupaban por &ldquo;Los grandes datos&rdquo; &ndash; los &uacute;nicos que ten&iacute;an enormes conjuntos de datos y motivaci&oacute;n para tratar de procesarlos &ndash; eran los miembros de la comunidad cient&iacute;fica, Usama Fayyad, presidenta ejecutiva del grupo de inter&eacute;s especial en descubrimiento de conocimiento y data mining de ACM. Aun entonces, los resultados del data minino eran impresionantes. &quot;Nos permit&iacute;an resolver importantes problemas cient&iacute;ficos .<br />
<br />
El explosivo crecimiento de Internet cambi&oacute; todo. Las empresas se encontraron operando online y amasando enormes vol&uacute;menes de datos sobre consumidores y su comportamiento. Cuando se fue haciendo claro el poder del data mining, dice Fayyad, surgi&oacute; la motivaci&oacute;n de invertir en ese campo.</p>
<p>En estos d&iacute;as, los gigantes de Internet ganan dinero con la informaci&oacute;n que recolectan sobre usuarios y los conocimientos que extraen estudi&aacute;ndola. Los comerciantes pueden acceder a complejos patrones de comportamiento del comprador para aprovisionar m&aacute;s rentablemente sus negocios. Los investigadores industriales pueden predecir los patrones de tr&aacute;fico automotor bas&aacute;ndose en congesti&oacute;n, clima y momento del a&ntilde;o, y ofrecer las mejores rutas. <br />
<br />
Sin embargo, la data actual no toma la forma conocida de la base de datos. &quot;La informaci&oacute;n no nos llega en una clara forma tabulada,&quot; dice Chid Apte, presidente de la conferencia. &quot;Nos llega en forma de red.&quot; A veces llega en un gr&aacute;fico, como los que usan los medios sociales. Esos gr&aacute;ficos registran no s&oacute;lo las complejas conexiones entre nodos sino tambi&eacute;n otros tipos de informaci&oacute;n en una diversidad de formatos, como videos, im&aacute;genes y comentarios que pone la gente en las redes sociales.</p>
<p>Los medios sociales pueden haber comenzado la tendencia hacia analizar esos gr&aacute;ficos, dice Apte, pero los datos en red vienen tambi&eacute;n de otras fuentes, por ejemplo, de los complejos sistemas de ingenier&iacute;a, como la red de energ&iacute;a el&eacute;ctrica, los sistemas de distribuci&oacute;n de agua potable y sistema de control de tr&aacute;nsito. Las redes de sensores en esos sistemas producen conjuntos de datos en los que las conexiones entre lugares son tan importantes como las amistades entre individuos en una red social. Entender esas conexiones es la clave para optimizar sistemas y hacerlos sostenibles, dice Apte.</p>
<p>La gente viene trabajando con gr&aacute;ficos de datos desde hace cientos de a&ntilde;os, pero los gr&aacute;ficos que se plotean ahora a partir de las redes sociales o las redes de sensores tienen una escala sin precedentes. &quot;Estos son gr&aacute;ficos gigantescos,&quot; dice. &quot;Estamos hablando de millones de nodos y de cientos de millones de v&iacute;nculos.&quot;</p>
<p>Manejar gr&aacute;ficos de ese tama&ntilde;o y aplicarles modernas herramientas anal&iacute;ticas, exige mejores algoritmos y otras innovaciones. Apte explica que una de las metas de la conferencia es difundir las t&eacute;cnicas de punta de los laboratorios de la investigaci&oacute;n acad&eacute;mica e industrial entre las empresas para que ellas puedan aplicarlas m&aacute;s r&aacute;pidamente. Los organizadores tambi&eacute;n esperan entender los desaf&iacute;os que afrontan las empresas y que deben ser atendidos.</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>

Compartir:

spot_img
spot_img
spot_img
spot_img
spot_img
spot_img

Noticias

CONTENIDO RELACIONADO