Búsquedas: I.B.M. detrás de un nuevo estándar

Mientras las novedades se suceden a un ritmo que la computación no veía en años, I.B.M. busca un método que descubra el significado del material cualquiera sea la forma en que esté estructurado: texto, audio, imagen estática o video.

2 febrero, 2005

Google, el peso pesado en sistemas de búsqueda en Internet, no deja de sacar novedades cada dos o tres semanas. Además de su ya famoso plan de indexar el contenido de varias bibliotecas universitarias, sacó el Google Scholar, que devuelve resúmenes de trabajos académicos y muestra cuántas veces son citados por otros académicos; y Google Suggest, que trata de adivinar el objeto de la búsqueda no bien uno ha tipeado sólo la primera o segunda letra.

Microsoft, número uno en casi todo lo demás, Bill Gates se desespera por encontrar un producto que iguale las novedades de Google y otros buscadores. Acaba de lanzar su buscador en internet, que incorporará a su sistema operativo para disputar el liderazgo de Google y se sabe que trabaja intensamente en una herramienta que buscará en el interior de las PC.

Mientras tanto, una cantidad de fusiones, anuncios y acuerdos entre los jugadores más pequeños produce una increíble variedad de nuevas posibilidades de búsqueda.

Yahoo! anunció que usará el excelente programa de indexación X1 como base para su sistema de búsquedas en PC, que distribuirá gratuitamente a sus usuarios. Autonomy, el grupo especializado en datos empresarios, también se incorporó a la carrera, además de Ask Jeeves, EarthLink y otras pequeñas compañías como dTSearch, Copernic, Accoona y muchos otros. Todavía es temprano para evaluar y comparar los desempeños.

Mientras todo esto sale a la luz, I.B.M, otro gran peso pesado, desarrolla silenciosamente su estrategia de búsquedas. El concepto que desarrolla la compañía y que parece prometedor, es conocido internamente como “el futuro de las búsquedas”.

Su primer producto, ya lanzado, se llama OmniFind, el primer programa que utiliza una nueva estrategia para resolver problemas de búsqueda. El método, que la empresa denomina “unstructured information management architecture, o UIMA (arquitectura no estructurada de manejo de la información), llevará – según I.B.M. – a una tercera generación en la capacidad para recuperar datos computarizados. La primera generación, según este esquema, es la simple coincidencia de palabras clave: o sea, encontrar todos los documentos que contienen un determinado nombre o dirección. Eso es todo lo que la mayoría de los sistemas de búsqueda pueden, hacer en una PC, porque lo que normalmente se busca allí es un mensaje de email, o un memorándum que se sabe está allí. La próxima generación es una búsqueda basada en la web que usa no solamente palabras clave sino muchos otros indicadores.

I.B.M. asegura que sus herramientas harán posible un método de búsqueda llamado de los “sistemas de descubrimiento” que extraerá el significado escondido en el material almacenado cualquiera sea la forma en que esté estructurado (bases de datos, archivos de e-mail, grabaciones de audio, imágenes o archivos de video) incluyendo idiomas diferentes. Los pasos necesarios para lograr eso incluyen un “procesamiento natural del idioma”, traducción computarizada de idiomas extranjeros y otros intentos que desvelan desde hace años a los estudiosos de la inteligencia artificial. Pero la combinación de computadoras cada vez más rápidas y programas en permanente evolución permiten a estos sistemas realizar tareas que han frustrado a sus predecesores.

Una de ellas es la respuesta a preguntas. Google es fabuloso recuperando datos al azar, pero pobre en el manejo de preguntas más sutiles. Hace falta un rodeo, por ejemplo, para averiguar la fecha o el lugar de nacimiento de Beethoven. E una demostración interna, el programa escaneó una noticia sobre política canadiense y el sistema respondió correctamente a la pregunta “quién es el primer ministro de Canadá”. Aunque esas palabras exactas no aparecían en el artículo.

Arthur Ciccolo, uno de los estrategas en el proyecto de información no estructurada, opina que los call centers serían el primer lugar donde el nuevo sistema se aplicaría. El segundo serían los proyectos de investigación genómica, donde las correlaciones inesperadas adquieren una importancia decisiva. Además, de una demostración surgió que otro mercado probable sería el de las personas sospechadas de actividades terroristas.

El nuevo estándar que están buscando no se haría realidad antes de los dos años, según Ciccolo.

Google, el peso pesado en sistemas de búsqueda en Internet, no deja de sacar novedades cada dos o tres semanas. Además de su ya famoso plan de indexar el contenido de varias bibliotecas universitarias, sacó el Google Scholar, que devuelve resúmenes de trabajos académicos y muestra cuántas veces son citados por otros académicos; y Google Suggest, que trata de adivinar el objeto de la búsqueda no bien uno ha tipeado sólo la primera o segunda letra.

Microsoft, número uno en casi todo lo demás, Bill Gates se desespera por encontrar un producto que iguale las novedades de Google y otros buscadores. Acaba de lanzar su buscador en internet, que incorporará a su sistema operativo para disputar el liderazgo de Google y se sabe que trabaja intensamente en una herramienta que buscará en el interior de las PC.

Mientras tanto, una cantidad de fusiones, anuncios y acuerdos entre los jugadores más pequeños produce una increíble variedad de nuevas posibilidades de búsqueda.

Yahoo! anunció que usará el excelente programa de indexación X1 como base para su sistema de búsquedas en PC, que distribuirá gratuitamente a sus usuarios. Autonomy, el grupo especializado en datos empresarios, también se incorporó a la carrera, además de Ask Jeeves, EarthLink y otras pequeñas compañías como dTSearch, Copernic, Accoona y muchos otros. Todavía es temprano para evaluar y comparar los desempeños.

Mientras todo esto sale a la luz, I.B.M, otro gran peso pesado, desarrolla silenciosamente su estrategia de búsquedas. El concepto que desarrolla la compañía y que parece prometedor, es conocido internamente como “el futuro de las búsquedas”.

Su primer producto, ya lanzado, se llama OmniFind, el primer programa que utiliza una nueva estrategia para resolver problemas de búsqueda. El método, que la empresa denomina “unstructured information management architecture, o UIMA (arquitectura no estructurada de manejo de la información), llevará – según I.B.M. – a una tercera generación en la capacidad para recuperar datos computarizados. La primera generación, según este esquema, es la simple coincidencia de palabras clave: o sea, encontrar todos los documentos que contienen un determinado nombre o dirección. Eso es todo lo que la mayoría de los sistemas de búsqueda pueden, hacer en una PC, porque lo que normalmente se busca allí es un mensaje de email, o un memorándum que se sabe está allí. La próxima generación es una búsqueda basada en la web que usa no solamente palabras clave sino muchos otros indicadores.

I.B.M. asegura que sus herramientas harán posible un método de búsqueda llamado de los “sistemas de descubrimiento” que extraerá el significado escondido en el material almacenado cualquiera sea la forma en que esté estructurado (bases de datos, archivos de e-mail, grabaciones de audio, imágenes o archivos de video) incluyendo idiomas diferentes. Los pasos necesarios para lograr eso incluyen un “procesamiento natural del idioma”, traducción computarizada de idiomas extranjeros y otros intentos que desvelan desde hace años a los estudiosos de la inteligencia artificial. Pero la combinación de computadoras cada vez más rápidas y programas en permanente evolución permiten a estos sistemas realizar tareas que han frustrado a sus predecesores.

Una de ellas es la respuesta a preguntas. Google es fabuloso recuperando datos al azar, pero pobre en el manejo de preguntas más sutiles. Hace falta un rodeo, por ejemplo, para averiguar la fecha o el lugar de nacimiento de Beethoven. E una demostración interna, el programa escaneó una noticia sobre política canadiense y el sistema respondió correctamente a la pregunta “quién es el primer ministro de Canadá”. Aunque esas palabras exactas no aparecían en el artículo.

Arthur Ciccolo, uno de los estrategas en el proyecto de información no estructurada, opina que los call centers serían el primer lugar donde el nuevo sistema se aplicaría. El segundo serían los proyectos de investigación genómica, donde las correlaciones inesperadas adquieren una importancia decisiva. Además, de una demostración surgió que otro mercado probable sería el de las personas sospechadas de actividades terroristas.

El nuevo estándar que están buscando no se haría realidad antes de los dos años, según Ciccolo.

Compartir:
Notas Relacionadas

Suscripción Digital

Suscríbase a Mercado y reciba todos los meses la mas completa información sobre Economía, Negocios, Tecnología, Managment y más.

Suscribirse Archivo Ver todos los planes

Newsletter


Reciba todas las novedades de la Revista Mercado en su email.

Reciba todas las novedades