Ya hablábamos de este fichero en el apartado del robots.txt. El objetivo de este fichero es el de listar en un fichero XML todas las páginas que el buscador debe tener en cuenta a la hora de indexar una web.
Hasta el 2015 este fichero era útil y orientativo, pero Google solía explorar más páginas, aunque no estuvieran en este fichero. En los últimos meses hemos podido comprobar como Google no ha indexado páginas que no estuvieran en los sitemap.xml aunque si estuvieran enlazadas en la página principal.
Por esta razón ahora es mucho más importante que nuestro fichero sitemap.xml esté perfectamente configurado y lo que es más importante, actualizado. Dependiendo del CMS o la web que hayamos desarrollado será más fácil o difícil tener actualizado este fichero. Hoy en día todos los CMSs como WordPress, Drupal, Joomla y demás incluyen plugins que mantienen bien actualizados estos ficheros sitemap.xml
También podemos encontrar distintas herramientas que podrán generarnos los ficheros sitemap.xml necesarios para nuestra web. Por ejemplo https://www.xml-sitemaps.com/
Es importante, como siempre decimos, el entender el fichero, su contenido y los parámetros que se pueden utilizar, para que podamos entender su funcionamiento y utilidad. Para ello os ponemos a continuación un ejemplo de un fichero sitemap.xml.
Como se puede ver en la imagen anterior, el sitemap.xml es una sucesión de urls con los siguientes parámetros de configuración:
Loc: url de la página a rastrear.
Changefreq: cada cuanto tiempo debe el buscador chequear de nuevo la página para encontrar posibles cambios de la misma.
Priority: prioridad del 0 al 1 de lo importante que es para el robot rastrear esta página. Obviamente el robot comenzará con las páginas más prioritarias, por lo que no rastreará las que menos prioridad tengan si se acaba el tiempo destinado al rastreo de la web.
Lasmod: indicador de la fecha en la que se produjo la última modificación de la página. Esto permitirá al robot saber si debe rastrear de nuevo o no la página, pues si la imagen que tiene en su base de datos es la misma que la de la fecha de última modificación, entonces no rastreará la página.
Image:image: en el caso en el que la página tenga imágenes se podrán introducir las imágenes que posee la página.
Image:loc: url de la imagen.
Image:title: título de la imagen.
Otro punto importante a tener en cuenta es el de la localización del fichero sitemap.xml, la cual por defecto es el directorio raíz. Una vez dicho esto, dependiendo de desarrollo web que tengamos, puede que el sitemap se encuentre en otros directorios (por ejemplo, un sitemap por cada idioma de la web) o incluso esté partido en diferentes ficheros enlazados entre ellos.
Lo recomendable es que el sitemap.xml se encuentre en el directorio raíz, pues cualquier robot irá a buscarlo a este directorio. Si el sitemap.xml cambia de ubicación, entonces debemos indicarlo en el fichero robots.txt.
Otro de los puntos a comprobar es que tango Google como Bing (si hacemos el SEO para estos dos buscadores) deben haber recibido el sitemap.xml y lo deben haber indexado correctamente. Muchas veces nos olvidamos de enviar el fichero sitemap.xml y esto nos puede generar problemas de indexación.
En Google Search Console podemos enviar el sitemap en la página principal del cuadro de mandos pinchando en el enlace de sitemaps.
Para posteriormente pinchar en el botón “Añadir o Probar sitemap”, introducir la url del sitemap.xml principal y pinchar en Enviar.
Una vez enviado el sitemap.xml deberemos esperar para comprobar si Google ha detectado errores. En el caso que haya detectado errores deberemos corregirlos para una correcta optimización. Para ver el estado de nuestro sitemap.xml y sus errores deberemos acceder a Google Search Console y pinchar en Rastreo / sitemaps.
Como habéis podido ver en esta entrada, el fichero sitemap.xml es un fichero vital en nuestra optimización SEO y deberemos tenerlo muy bien configurado y siempre actualizado.
que tal he incluido el sit map del sitio web de prestashop en Google search console me parece correcto pero cuando analizo el seo con herramienta como seoquake o worrank me dice que no hay ningún sit map a que se deberá esto
Hola Daniel, entiendo que debe ser porque no tienes el sitemap.xml en el sitio por defecto, que es /sitemap.xml, por eso las herramientas de análisis seo no lo detectan. Mientras Google Search Console lo tenga bien identificado estate tranquilo.
Gracias