Esta herramienta es capaz de encontrar el sitemap de una web de forma automática y rápida. Además, si el mapa del sitio se halla en formato XML, también puede contar el número de URLs que la web quiere que los buscadores indexen así como la cantidad de URL actualizadas o creadas en los últimos 30 días.
Debes saber que, de forma deliberada, esta utilidad excluye las direcciones que apunten a imágenes. Aún así, puede ocurrir que haya webs que tengan artículos que sólo contengan una imagen.
Hablemos de las tres funciones principales de esta herramienta y sus posibles aplicaciones:
Como verás, es una utilidad sencilla pero con grandes aplicaciones. Además, está preparada para enfrentarse a gran cantidad de problemas que nos podemos enfrentar a la hora de obtener el sitemap de una web.
Es útil tanto para desarrolladores que quieran buscar rápidamente un mapa del sitio, como para SEOs o nicheros que quieran sacar conclusiones sobre su competencia.
Esta herramienta permite que introduzcas una URL de cualquier página de una web o la dirección de un sitemap. Tan solo escribe o pega la dirección y pulsa en el botón de Buscar, en cuanto el proceso se complete, podrás ver los resultados de la búsqueda.
Admite tanto dominios, como URL a artículos. Si detecta una dirección normal ella se encarga de buscar el sitemap en su raíz.
Cuando recibe la dirección de un mapa del sitio válido, esta herramienta se limita a ver si dicha dirección existe y mostrar la información de número total de URL y la cantidad de URL modificadas en los últimos 30 días.
Si tarda, es que la búsqueda se ha vuelto un poco más compleja. Ten un poco de paciencia.
Existen gran cantidad de obstáculos que pueden impedir a esta utilidad a encontrar el sitemap de una web. Por ello, te explicaré lo que hace para que en caso de que falle, puedas encontrar por ti mismo el mapa del sitio de forma manual.
Hay dos formas principales de encontrar el sitemap de un dominio: mediante el robots.txt o probando con las direcciones más comunes.
La forma más rápida de encontrar el mapa del sitio de una web es mediante el archivo robots.txt. Aunque no todos los dominios lo tienen, es una archivo común que da indicaciones a los robots de los buscadores de qué carpetas deben evitar y dónde se encuentra el sitemap.
Se halla en la raíz del dominio por lo que para acceder a él es tan fácil como escribir en la barra de direcciones del navegador el nombre del dominio más el de este archivo. Veamos un ejemplo:
https://www.ejemplo.com/robots.txt
Si existe, se abrirá un archivo en formato plano que variará de un dominio a otro. Habitualmente el robots.txt incluye una línea que empieza por “Sitemap:”. Ahí podrás encontrar la dirección del mapa del sitio.
Cuando el robots.txt no está o no podemos acceder a él nuestras posibilidades se limitan. En estos casos hay que probar con lo nombres y direcciones más comunes para ver si damos con la tecla.
Estos son los nombres y ubicaciones más frecuentes y que yo mismo he usado en esta herramienta:
En otras ocasiones el mapa del sitio no tendrá un formato XML y es por eso que esta herramienta no será capaz de encontrarlo. Aquí tienes algunas opciones para encontrarlo:
Si eso no funciona me temo que tus alternativas se van reduciendo. Sin embargo, ¡no pierdas la esperanza! Todavía nos quedan dos cosas que probar:
Aunque le he dedicado mucho tiempo a que esta herramienta se salte gran cantidad de restricciones y problemas comunes, hay miles de casos específicos que seguramente no haya tenido en cuenta y que impidan que esta utilidad te proporcione el sitemap.
Es por ello que también quiero advertirte de sus limitaciones: