¿Cómo funciona Google o cómo funciona un buscador?

Esta es una de las secciones iniciales de mi tutorial de análisis SEO. No dudes en darte una vuelta por aquí si quieres aprender SEO y conocer los más de 102 factores que destripo a lo largo del tutorial.

Índice de Contenidos

Antes de leer o aventurarnos en el mundo del SEO y el posicionamiento es vital e imprescindible entender cómo funciona Google o cualquier otro buscador. A la hora de hablar o escribir sobre posicionamiento y marketing digital siempre se suele mencionar a Google, pero es muy importante que tengamos presente que hay otros buscadores que pueden ser importantes para nuestro negocio. Por esta razón, aunque se mencione principalmente a Google debemos tener en cuenta que muchas de las teorías de SEO tienen el mismo o similar valor para otros buscadores.

Para entender cómo funciona Google debemos ponernos en el pellejo del buscador e intentar responder a la siguiente pregunta ¿Cómo puedo almacenar toda la información distribuida en millones de páginas web y almacenada en diferentes formatos como HTML y otro tipo de documentos? Y lo que es aún más importante ¿Cómo puedo almacenar toda esta información para que mi cliente, el usuario que busca en mi buscador, encuentre la información más relevante para él?

Para empezar a responder a estas preguntas lo primero que tenemos que tener claro es que el cliente de Google (buscador) y el que le da de comer somos todos nosotros, todos los que todos los días accedemos a www.google.com para buscar por la información que nos interesa. Si Google o cualquier buscador deja de servir información relevante, lo abandonaremos como hicimos en su momento cuando abandonamos buscadores como AOL o Yahoo por el nuevo y revolucionario Google.

Es por esta razón por la que todos los buscadores están constantemente mejorando sus algoritmos para que la información servida sea la mejor.

Para rastrear todas las páginas web Google y cualquier buscador utiliza lo que comúnmente se conoce como robot (o bot en inglés) o araña. Estos robots con aplicaciones que rastrean constantemente las webs buscando nueva información y modificaciones de la que ya tienen.

Un poco de historia para entender cómo funciona un buscador y por qué

Cuando Internet empezó a tener auge y tener un modem con conexión a Internet no era un lujo reservado para unos pocos privilegiados, ya había gran cantidad de información en Internet.

Los buscadores como Google eran capaces de rastrear estas páginas y almacenarlas en sus bases de datos. Ahora bien, ¿Cómo distinguían cual era la página que era más relevante para sus clientes que buscaban en su navegador? Pues bien, al principio de los tiempos Google (y por esa razón destacó sobre sus competidores) analizaba los textos de las páginas y los enlaces que apuntaban a estas.

Estos fueron dos de los primeros factores que Google utilizó para hacer los primeros rankings de posicionamiento. Si un usuario buscaba en Google por “pizza a domicilio” Google buscaba en su índice las páginas que contenían esta palabra clave y las ordenadas por número de veces que tenía la página esta palabra clave y el número de webs que apuntaban a esta página.

Esto tenía mucho sentido, ¿verdad? Si una página habla mucho sobre “pizzas a domicilio” está muy claro que la página habla de este tema. Por otro lado, los enlaces que recibe una página son como recomendaciones de otros sitios, por lo que también tiene sentido que cuando una página tenía muchas recomendaciones de otros sitios, su importancia fuera mayor que la que no tenía.

Hasta aquí todo era perfecto, o casi perfecto, pero fue entonces cuando los primeros gurús SEO descubrieron estas técnicas de Google y empezaron a llenar las páginas de palabras clave y generar enlaces masivos desde diferentes webs que sólo eran creadas con este propósito, el de mejorar el posicionamiento. Aquí es deonde empezó la competición entre Google (y otros buscadores) y estos hackers de SEO. Los primeros todos los días intentan detectar acciones spam con el objetivo de afectar al posicionamiento de páginas web, y los segundos todos los días descubren nuevos trucos para engañar a Google y otros buscadores.

¿Cómo funciona Google?

En la sección anterior hemos hablado de los inicios, pero creo que es un buen ejemplo para entender por qué Google está constantemente añadiendo factores para medir la reputación de las páginas (no sólo enlaces y palabras clave) y cambiando sus algoritmos para detectar nuevos sistemas de fraude que provocan la alteración de los rankings de Google.

Es muy importante destacar que para poder entender los principios básicos del SEO y poder realizar unos trabajos de SEO de calidad, deberemos entender perfectamente cómo funciona Google.

Como comentábamos al principio, los buscadores utilizan robots que constantemente están rastreando las webs de Internet. Su objetivo es el de mantener una base de datos gigantesca donde almacenan todas las páginas por dominio y los datos que necesitan para luego inferir el mejor resultado para la búsqueda de sus clientes.

Es muy importante también saber que los robots de los buscadores no tienen todo el tiempo del mundo para rastrear todas las webs, por esa razón, dependiendo de la reputación e importancia de un sitio web el robot dedicará más tiempo a rastrear la web o menos. Debido a este tiempo limitado que tenemos de rastreo de nuestra web, es muy importante que nuestra web esté optimizada principalmente en los siguientes factores:

  • Tiempo de respuesta de nuestras páginas web.
  • Configuración correcta del fichero sitemap.xml y robots.txt para ahorrar chequeos de páginas innecesarias a los robots.
  • Uso correcto de directivas noindex y nofollow en las páginas accesibles por los robots de Google.
  • Evitar páginas con parámetros en las urls como buscadores y demás. Google prefiere una url como dominio.com/casas/Madrid/ que una url del tipo dominio.com/?tipo=casas&zona=Madrid. Podéis ver más información sobre este aspecto en la sección de estructura web.
  • Contenido duplicado. Como podemos comprender al robot no le va a hacer mucha gracia perder tiempo rastreando urls con contenido duplicado.
  • Errores 4XX o 5XX.

Os recomiendo que leáis el artículo de Google sobre el Crawl Budget. Aquí Google nos cuenta lo importante que son los factores anteriores para que su robot pueda en el menor tiempo posible rastrear el mayor número de páginas.

A continuación, os contamos como funciona Google en tres pasos que vamos a describir de una forma sencilla:

Paso 1: Rastreo

El primer paso será el de leer la información de todos los dominios y páginas de Internet a través de sus robots o arañas. Constantemente los robots de Google están leyendo las páginas web de nuestros dominios y almacenando su contenido en su base de datos.

En este paso Google almacena en una base de datos gigantesca todas las páginas que analiza.

Paso 2: Análisis de páginas, clasificación y ranking.

De forma continua Google está analizando la información que tiene en su base de datos. Lo primero que tiene que hacer es clasificar el contenido de todas las páginas y entender el contenido para poder servirlo a sus usuarios y clientes, los millones de personas que buscan todos los días en Google. Para esto Google principalmente clasifica el contenido por tipología, si es de turismo, si es un medio de comunicación regional, si es nacional, si es un medio de salud, etc.

Google debe ser capaz de entender de qué tipología o sector es una búsqueda y dar prioridad a los medios especializados en esta temática cuando un usuario hace búsquedas relacionadas.

Bien, hasta ahora ya sabemos que Google clasifica el contenido por temáticas, pero ¿cómo puede decidir que una página de una temática es mejor que otra? Para esto Google utiliza diferentes algoritmos (Panda, Colibrí, Pingüino, etc) para poder asignar una “nota” final a cada contenido y así poder establecer un ranking de importancia (ya no es sólo veces que aparece un texto en la página y enlaces).

Para asignar esta nota a la página Google analiza diferentes factores SEO, de los cuales, los más importantes se verán a lo largo del tutorial de análisis SEO de esta web. Algunos factores son a nivel dominio (reputación del dominio, tipología de la temática del dominio, si utiliza protocolo seguro o no y muchos más) y otros a nivel de página (tiempo de respuesta, faltas ortográficas, gramática, usabilidad, calidad del contenido, etc).

A parte, los buscadores utilizaran factores externos como número de enlaces que apuntan a la página, calidad de los mismos, temática de estos y otros parámetros que influirán en la nota final.

Todos estos factores serán los que Google introducirá en la coctelera, batirá y sacará una puntuación (pongamos que es una nota del 1 al 10) que asignará a la página.

Así, con estas notas, Google podrá a la hora de devolver los resultados de búsqueda poder ponderar las diferentes páginas candidatas a salir en la web y devolver lo que el estima es el mejor ranking de posicionamiento.

Por esta razón, para poder actualizar este ranking los robots están constantemente rastreando las webs en busca de actualizaciones. Además, Google y otros buscadores cambiarán sus algoritmos de obtención del posicionamiento para evitar fraudes y dar los mejores resultados.

Con esto, el objetivo de esta fase para Google es el de generar una base de datos con todo el contenido de Internet, bien clasificada y con diferentes notas para cada página.

Paso 3. Devolución de resultados.

Es aquí cuando Google debe servir a sus clientes y usuarios los mejores resultados a las búsquedas que realizan en el buscador. Para ello, cuando un cliente de Google introduce una búsqueda en la caja de Google, este busca en su base de datos obteniendo la página que más nota tiene para la búsqueda de su cliente. El orden de los resultados seguirá ese orden de nota precalculado en la fase 2 por Google.

Como ya hemos visto, no sólo con almacenar la información es suficiente para devolver respuestas a los usuarios de los buscadores. Para poder dar la mejor respuesta (el mejor ranking) Google y otros buscadores analizan la información de las páginas y utilizan algoritmos que se encargan de destripar diferentes factores para al final, digámoslo así, poner una nota a cada página.

En la fase de devolución de resultados entra en juego uno de los algoritmos que más impacto está teniendo en los últimos tiempos, el algoritmo Rankbrain. Este algoritmo se encarga de actualizar las notas que obtienen las páginas web en base a la experiencia de los usuarios de Google. Que sus usuarios accedan a tu contenido, dediquen tiempo y no abandonen nada más entrar hará que tu nota suba y escales posiciones.

Como se ha comentado anteriormente, el objetivo de un experto SEO será el de utilizar diferentes estrategias y realizar implementaciones en una web para poder conseguir la mejor nota posible y poder posicionar por palabras clave en los primeros puestos de Google. En esta sección os hemos dado una visión simple de como funciona Google, la cual entendemos es ideal para que cualquier persona, independientemente de su nivel técnico, entienda el funcionamiento de un buscador. De todas formas, si queréis profundizar más, es muy recomendable la lectura del libro How Google Works de antiguos componentes del equipo de Google.

Si tenéis alguna duda o necesitáis aclaraciones o más detalle en algo no dudéis en comentar con vuestra dudas y cualquier comentario.

5 comentarios en «¿Cómo funciona Google o cómo funciona un buscador?»

  1. Buenos días Javier, te quería preguntar si conoces alguna forma de saber cuando la araña/robots de Google pasa por nuestra web para analizarla. ¿Existe alguna frecuencia determinada?

    Gracias y saludos,
    Eduardo

    Responder
    • Buenas Eduardo, muchas gracias por tu comentario. Para saber cuando la araña de Google rastrea nuestra web, la mejor opción que tenemos es la de acceder a los logs de nuestro servidor y filtrar aquellas peticiones que tengan como user-agent Googlebot. En cuanto a la frecuencia, no hay una frecuencia determinada y esta depende de la reputación de cada web. Cuánto mayor reputación, la frecuencia es mayor.

      Responder

Deja un comentario

Recibe en tu correo de forma gratuita mi plantilla de análisis SEO y únete a Fullanchor
De acuerdo
Recibe en tu correo de forma gratuita mi plantilla con la checklist de redacción SEO
De acuerdo
¿No tienes tiempo para escribir artículos SEO?

Compra textos seo para impulsar tu web en Serptext 

Ver Serptext

Descubre como posiciona tu web y como lo hacen tus competidores

Introduce tu dominio y pruéba gratis SE Ranking

Si continuas utilizando este sitio, aceptas el uso de las cookies. Más Información

Los ajustes de cookies de esta web están configurados para "permitir cookies" y así ofrecerte la mejor experiencia de navegación posible. Si sigues utilizando esta web sin cambiar tus ajustes de cookies o haces clic en "Aceptar" estarás dando tu consentimiento a esto.

Cerrar