¿Cómo funcionan las búsquedas en Google?
Google es, desde hace tiempo, la puerta que se usa para llegar a los contenidos de Internet. La facilidad que hay para poner una simple palabra y, supuestamente, que nos aparezca el contenido más relevante que hay en la Red sobre ese concepto es, para muchos, increíble. Vamos a tratar en unas pocas líneas y de forma lo más llana posible, que nos perdonen los más técnicos, de explicar para quien no tiene ni idea como hace Google para conocer, ordenar y, después, mostrar en una lista las webs a partir de que pongamos algo en la caja de búsqueda.
La revolución que supuso Google allá por los albores del siglo XXI cuando se asomaba a una Red donde había otros buscadores como Altavista, el líder del momento, o el propio Yahoo era poco predecible en esos momentos. Las opciones que había entonces, en ocasiones, pasaban por la curación manual en algunos portales, como Yahoo, del contenido.
La propuesta de Segei Brin y Larry Page fue brillante, hacer este trabajo automático y, con el tiempo, inteligente. Cuando decimos que Google "aprende" de los usuarios es porque es cierto. Cada vez que hacemos una búsqueda en Internet, como ya comentó Matt Cutts, Ingeniero en Google, actualizamos el sistema de indexación de Google.
Esto es gracias a las "arañas" o "spiders" del software de Google, unos programas que le permiten conocer e indexar una web en base a unos términos y dotarle de una importancia frente al resto ponderando los enlaces que dirigen a ella. Con cada búsqueda, estos "insectos" siguen tejiendo una red gigantesca en al que, posteriormente, rescatarán la información para mostrársela al usuario cuando ponga el término en cuestión en la caja de búsquedas.
El proceso que sigue Google para mostrar los resultados
Este proceso tiene tres partes: indexación, tratamiento de la consulta y comparación entre la consulta y la colección de documentos indexada.
En el proceso que sigue Google para mostrarnos sus resultados, está la primera fase que hemos comentado con sus "arañas" con las que pre-procesan los documentos para analizarlos y aplicar transformaciones que después mejoren las búsquedas, calculando la importancia de este documento (web) en relación a los términos con los que se le puede relacionar.
Aquí es donde se encuentra el núcleo de la cuestión para los que se dedican al SEO y temas parecidos y que tiene un nombre, el PageRank. Conocer "cómo" tener preparada tu web y qué contenido es el adecuado o el que Google, según sus parámetros, va a reconocer como el mejor para ponerlo en los primeros puestos de los resultados de respuesta. Y es que con el tiempo, Google ha ido haciendo su software más y más inteligente y ya no cae en trampas como repetir hasta la saciedad una palabra clave en los textos y cosas parecidas.
Cómo norma general, y cada vez está más afinado en este sentido el algoritmo de Google, vale ser original, interesante y relevante con nuestros contenidos. Eso... y ser el primero, la razón de que muchas webs cuando hay una noticia de calado corran a publicar cuanto antes posible - algo que tiene un debate por su propia cuenta -. Esto tiene su importancia por otro factor del PageRank, los enlaces a nuestra web. Cuantas más webs nos enlacen, y mejor PageRank tengan estas, el nuestro también será relevante. De ahí la importancia del contenido original que pueda ser referenciado en cuantos más sitios mejor para que Google, en teoría, lo considere más relevante.
El siguiente paso es el tratamiento de la consulta, donde se analiza lo que ha puesto el usuario, el concepto que busca ya no sólo por las palabras sino por el sentido que tienen o la expresión que se les puede dar, y así compararlo con los documentos que ya se tienen indexados.
El último estadio es que cada documento o web, con todos estos datos, obtiene un valor en relación a la consulta, lo que determina su relevancia, según Google, y esto es lo que marcará que esté en los primeros puestos de los resultados cuando usamos el buscador - o todo lo contrario -.