Herramienta para Encontrar el Sitemap de una Web

Para Qué Sirve el Buscador y Analizador de Sitemaps


Servicio de linkbuilding para aumentar tu autoridad

Esta herramienta es capaz de encontrar el sitemap de una web de forma automática y rápida. Además, si el mapa del sitio se halla en formato XML, también puede contar el número de URLs que la web quiere que los buscadores indexen así como la cantidad de URL actualizadas o creadas en los últimos 30 días.

Debes saber que, de forma deliberada, esta utilidad excluye las direcciones que apunten a imágenes. Aún así, puede ocurrir que haya webs que tengan artículos que sólo contengan una imagen.

Sus principales funciones

Hablemos de las tres funciones principales de esta herramienta y sus posibles aplicaciones:

  1. El primero es evidente: encontrar el sitemap de forma rápida y fácil. Esto te permitirá obtener la URL del mismo para que hagas con ella lo que quieras.
  2. También sirve para contar el número de URL que tiene un dominio. Esta funcionalidad nos permite hacernos una idea del tamaño de la web que estemos analizando. Un factor importante para analizar a la competencia y saber contra quién nos enfrentamos.
  3. Además, cuenta con la utilidad de darnos el número de URL que se han alterado en los últimos 30 días. Aunque no es una medida exacta, es una forma de saber cada cuánto actualiza o crea nuevos artículos un dominio. Puede servir como medida aproximada de la frecuencia de publicación de una web. Recuerda que muchos sitemaps no incluyen fecha de publicación.

Como verás, es una utilidad sencilla pero con grandes aplicaciones. Además, está preparada para enfrentarse a gran cantidad de problemas que nos podemos enfrentar a la hora de obtener el sitemap de una web.

Es útil tanto para desarrolladores que quieran buscar rápidamente un mapa del sitio, como para SEOs o nicheros que quieran sacar conclusiones sobre su competencia.

account_tree

Cómo Encontrar el Sitemap de una Web

Esta herramienta permite que introduzcas una URL de cualquier página de una web o la dirección de un sitemap. Tan solo escribe o pega la dirección y pulsa en el botón de Buscar, en cuanto el proceso se complete, podrás ver los resultados de la búsqueda.

Admite tanto dominios, como URL a artículos. Si detecta una dirección normal ella se encarga de buscar el sitemap en su raíz.

Cuando recibe la dirección de un mapa del sitio válido, esta herramienta se limita a ver si dicha dirección existe y mostrar la información de número total de URL y la cantidad de URL modificadas en los últimos 30 días.

Si tarda, es que la búsqueda se ha vuelto un poco más compleja. Ten un poco de paciencia.

Raiola Networks
¿Por qué te recomendamos Raiola Networks?
  • Migración gratuita
  • Tiempos de respuesta mínimos
  • Permite alojar varias webs
  • Si compras un plan anual, incluye dominio y descuento adicional

Cómo Encontrar el Sitemap de Forma Manual


Buscador y analizador de sitemap - Freepik.com

Existen gran cantidad de obstáculos que pueden impedir a esta utilidad a encontrar el sitemap de una web. Por ello, te explicaré lo que hace para que en caso de que falle, puedas encontrar por ti mismo el mapa del sitio de forma manual.

Hay dos formas principales de encontrar el sitemap de un dominio: mediante el robots.txt o probando con las direcciones más comunes.

Robots.txt

La forma más rápida de encontrar el mapa del sitio de una web es mediante el archivo robots.txt. Aunque no todos los dominios lo tienen, es una archivo común que da indicaciones a los robots de los buscadores de qué carpetas deben evitar y dónde se encuentra el sitemap.

Se halla en la raíz del dominio por lo que para acceder a él es tan fácil como escribir en la barra de direcciones del navegador el nombre del dominio más el de este archivo. Veamos un ejemplo:

https://www.ejemplo.com/robots.txt

Si existe, se abrirá un archivo en formato plano que variará de un dominio a otro. Habitualmente el robots.txt incluye una línea que empieza por “Sitemap:”. Ahí podrás encontrar la dirección del mapa del sitio.

Nombres comunes

Cuando el robots.txt no está o no podemos acceder a él nuestras posibilidades se limitan. En estos casos hay que probar con lo nombres y direcciones más comunes para ver si damos con la tecla.

Estos son los nombres y ubicaciones más frecuentes y que yo mismo he usado en esta herramienta:

  • https://www.ejemplo.com/sitemap.xml
  • https://www.ejemplo.com/sitemap-index.xml
  • https://www.ejemplo.com/sitemap_index.xml
  • https://www.ejemplo.com/sitemap/sitemap.xml
  • https://www.ejemplo.com/sitemapindex.xml
  • https://www.ejemplo.com/sitemap/index.xml
  • https://www.ejemplo.com/sitemap1.xml
  • https://www.ejemplo.com/post-sitemap.xml
  • https://www.ejemplo.com/page-sitemap.xml

En otras ocasiones el mapa del sitio no tendrá un formato XML y es por eso que esta herramienta no será capaz de encontrarlo. Aquí tienes algunas opciones para encontrarlo:

  • https://www.ejemplo.com/feeds/posts/default?orderby=updated
  • https://www.ejemplo.com/sitemap.html
  • https://www.ejemplo.com/sitemap.xml.gz
  • https://www.ejemplo.com/sitemap.php
  • https://www.ejemplo.com/sitemap_index.xml.gz
  • https://www.ejemplo.com/sitemap.gz
  • https://www.ejemplo.com/sitemap.txt
  • https://www.ejemplo.com/rss/
  • https://www.ejemplo.com/rss.xml
  • https://www.ejemplo.com/atom.xml

Métodos alternativos

Si eso no funciona me temo que tus alternativas se van reduciendo. Sin embargo, ¡no pierdas la esperanza! Todavía nos quedan dos cosas que probar:

  • Usa un footprint de Google para encontrar todos los archivos xml de un dominio para ver si encuentras entre ellos el mapa del sitio. Por ejemplo así: site:ejemplo.com filetype:xml o así: site:ejemplo.com inurl:sitemap
  • Usa un detector de tecnología web para saber qué tipo de CMS usa la web para ver si el gestor de contenido, la plantilla o los plugins usados guardan el mapa del sitio con algún nombre conocido. Existe un plugin para navegador llamado Built With que permite ver qué tecnologías usa una web. Puedes ver con qué está hecha y luego buscar información de dónde guardan habitualmente el sitemap esas tecnologías.

Limitaciones: algunas cuestiones a tener en cuenta

Aunque le he dedicado mucho tiempo a que esta herramienta se salte gran cantidad de restricciones y problemas comunes, hay miles de casos específicos que seguramente no haya tenido en cuenta y que impidan que esta utilidad te proporcione el sitemap.

Es por ello que también quiero advertirte de sus limitaciones:

  • No puede leer sitemap compuestos. Es bastante común que las webs más grandes tengan el mapa del sitio dividido en varios. En estos casos podrás abrir el mapa del sitio principal y copiar las direcciones de los otros sitemaps que haya dentro para analizarlos.
  • de texto o html. Aunque te dará su dirección si los encuentra, en esos casos deberás acceder a ellos de forma manual.
  • Existen gran cantidad de factores que pueden afectar a la legibilidad de un sitemap. Esta utilidad se centra en el formato estándar habitual aceptado por buscadores como Google. Si el mapa del sitio presenta errores de formato o escritura, es probable que su lectura sea parcial o resulte en un fallo.
  • Algunas webs tiene sistemas de seguridad que impiden el acceso a sus archivos. Si es el caso, tendrás que buscar el archivo del sitemap de forma manual como hemos explicado en la sección anterior.

Gana dinero recomendando Fiverr

Comparte nuestra web

Si te ha gustado lo que has visto, ayúdanos a darlo a conocer a más gente:

Compartir en Facebook Compartir en Twitter Compartir en Pinterest