"El poder de la gente siempre ha estado presente en las búsquedas"
Las búsquedas que cada día realizan millones de personas a través de Yahoo! se traducen al final de la jornada en unos 500 millones de registros. Analizarlos es fundamental para entender cómo nos movemos en la Red e intentar mejorar con ello los buscadores, tarea que ocupa el trabajo de Ricardo Baeza-Yates, director de grupo de investigación de Yahoo! en Europa, que ayer participó en la conferencia sobre Web 2.0 que ayer se celebró en Madrid.
“Lo que hace la gente con el contenido es lo que realmente vale”, afirma Baeza-Yates en una charla poco después de su intervención en el evento que ha traído a Madrid a los fundadores de Del.ico.us y Flickr. El director de Yahoo! Research en el laboratorio de Barcelona está convencido de que el análisis del comportamiento frente a las páginas de resultados es clave para mejorar los buscadores.
El investigador chileno, que ha trabajado también para la Universidad de Chile y la Pompeu Fabra, se dedica a la “minería de datos en Internet, el análisis de contenido, de los enlaces y el comportamiento en la web. El objetivo, afirma, es “permitir que partiendo de la información implícita que hay en las páginas podamos ayudar a la gente” a encontrar más fácilmente lo que busca.
El poder de la gente
Para alcanzar esa meta lo mejor es prestar atención al comportamiento de los internautas. “El poder de la gente siempre ha estado presente en las búsquedas, aunque se ha producido una evolución”, señala antes de explicar que si en un principio lo importante era el texto que había en una página ?era lo que preocupaba a un buscador como Altavista-, luego llegó con Google la importancia de los enlaces, que es ya un comportamiento humano, y luego hubo buscadores que se empezaron a fijar en lo que hace la gente.
“El elemento humano sigue siendo necesario en los buscadores, la gente es mucho mejor que la tecnología, quiere participar, aportar conocimiento, y hay que lograr aprovechar todas las fuentes de información humana”.
En la actualidad los buscadores deben tener presentes muchos elementos, como las etiquetas o palabras clave con que los internautas marcan los contenidos, los comentarios y votos que emiten. Información que junto al texto o los enlaces puede resultar vital a la hora de determinar cuál es el contenido o la importancia de una página. “Los buscadores integran todos estos criterios para dar el peso exacto a cada web, pero hay que encontrar un equilibrio que permita dar resultados relevantes y que al tiempo el buscador sea resistente a la manipulación que puede llegar por a través del spam”.
Inteligencia colectiva contra el spam
Se refiere el jefe de investigación de Yahoo! a páginas que, conociendo algunos de los factores que utilizan los buscadores para valorar las webs, y los utilizan en su propio beneficio. Así, se crean por ejemplo cientos de páginas que contienen enlaces a otra que se quiere promocionar, creando la falsa sensación para los buscadores de que esa web es muy popular ?lo que la situará en lo más alto de las listas de resultados- porque muchas páginas la vinculan. Contra ello, el “poder de la gente” también es efectivo.
“El spam en buscadores es muy grande, pero lo que está haciendo la gente en la Web 2.0, opinando y calificando contenidos, nos ayuda a determinar qué es spam. No es lo mismo hacer algo ilegal en la calle, donde puede verte alguna persona, que hacer algo malo en Internet, donde todo el mundo está mirando. Es positivo y nos ayuda”.
No se puede tratar igual a todas las páginas
La participación de los internautas en la elaboración de contenidos para la web no es el único ingrediente que marca esta época de Internet que se ha dado en llamar Web 2.0. Destaca también la presencia de contenidos audiovisuales y páginas muy gráficas y dinámicas, el rich media, que plantea nuevos desafíos para los buscadores.
“Uno no puede indexar todos los sitios igual, no tiene el mismo peso un comentario en un blog que en un medio tradicional, hay factores temporales y temáticos que hay que tener en cuenta”, explica Baeza-Yates. “Cada medio tiene su forma especial de ser recolectado y valorado, basándose tanto en el contenido como en los enlaces que hay en el contenido y lo que la gente hace. Uno aprende a detectar casi de forma automática las mejores fuentes de información que permiten detectar lo más relevante”.
Sobre la búsqueda de vídeos e imágenes, actualmente basada fundamentalmente en la interpretación de los textos que acompañan a estos archivos, el experto en búsquedas señala que en el futuro debería utilizarse “un sistema más integrado en el que también se tenga en cuenta el contenido (?). Podemos utilizar el procesamiento automático de los vídeos para encontrar algún atributo que pueda ser útil a la gente. Es algo que existe, pero lo difícil es hacerlo de forma masiva: uno puede buscar en unos cuantos cientos de miles de vídeos, pero no en decenas de millones. Es un tema de escala”.