El crawling o rastreo es la primera fase y el primer punto a tener en cuenta de cualquier proceso de posicionamiento orgánico. Si un site no puede ser rastreado de forma correcta, su indexación puede verse afectada y, con ello, su ranqueo en las SERPs y el consecuente tráfico que pudiera recibir a través de este canal de acceso.

________

Descárgate el Checklist SEO de Crawling e indexación:

Checklist SEO Onpage indexacion

________

Cómo indexar correctamente una web

Una mala indexación puede matar una web y, por contra, una buena relación con GoogleBot puede ponernos por encima de nuestros competidores.

1. Registrar y configurar Google Search Console

Google Search Console es la única herramienta de comunicación directa con el buscador y, aunque no sea la que nos da una mayor información, es un must para cualquier webmaster que se preocupe por el SEO.

Enlace para dar de alta Search Console

Pon especial atención a: Puedes registrar tu web a través del dominio o con URL (más fácil). En la anterior versión era necesario dar de alta todas las versiones de tu dominio (con y sin www. y con y sin protocolo seguro) y los posibles subdominios, configurar la versión de dominio preferida y definir su ubicación geográfica (que solo se permite ahora si das de alta tu web por el método de URL). Ahora, con la nueva comprobación de dominio y con las redirecciones 301 de las diferentes versiones bien aseguradas, ya no es necesario.

alta google search console

2. Crear un archivo sitemap.xml completo y actualizado

El Sitemap, como su nombre indica, es un mapa web que recoge un listado de las distintas URL que conforman nuestro site. Un sitemap que contenga todas aquellas páginas que queremos indexar permitirá al bot de Google localizarlas fácilmente y no pasar ninguna por alto.

Hay plugins que te lo general automáticamente como el Yoast, donde puedes configurar qué tipo de páginas, plantillas o tipología de archivos no quieres que se incluyan en el sitemap.

En el sitemap debes asegurarte de incluir solo aquellas URL que quieras indexar y obviar páginas sin contenido (por ejemplo, porfolio, comentarios, autores, etc.). Crea un sitemap por cada idioma que tengas en tu web. Al terminar, no olvides enviarlo a través de Google Search Console.

3. Crear un archivo Robots.txt

El archivo robots.txt nos permite hacer saber a los bots qué partes de nuestro sitio web NO queremos que rastree. La dirección es siempre la misma: miweb-com/robots.txt, ya que depende de la raíz del dominio siempre.

El archivo debe crearse siguiendo una serie de directrices y especificaciones. Muchos CMS de contenidos como WordPress ya incluyen uno propio normalmente con su instalación. En el caso de que tengas la opción marcada de Ajustes < Lectura < Disuadir a los motores de búsqueda de indexar este sitio, tu sitio no podrá ser rastreado por el buscador (normalmente esto se hace mientras se está trabajando en el lanzamiento de la web). Cuando desmarques esta opción, tu robots.txt ya cambiará automáticamente y dejará acceder al buscador (como Google). Con una regla simple como:

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Si no estás seguro: Utiliza el probador robots.txt de Google Search Console para asegurarte que no estás bloqueando páginas importantes de tu web.

4. Otros aspectos a tener en cuenta

Estos 3 puntos son el mínimo que cualquier webmaster debería llevar a cabo para asegurar el correcto rastreo e indexado de su web. Ahora bien, existen muchos otros aspectos que se deberán tener en cuenta si lo queremos es una presencia óptima en las páginas de resultados.

  • Evitar los errores de rastreo (4XX y 5XX)
  • Evitar cualquier duplicidad de contenido (paginado, barra lateral (/) final, index.php,
    versiones con y sin www., etc.)
  • Utilizar etiquetas de idioma Hreflang

Estos aspectos básicos permitirán un correcto rastreo e indexado del contenido de tu página web, pero esto no es suficiente para estar arriba. Ahora, deberás asegurarte de que tus páginas están debidamente optimizadas para atacar las palabras clave objetivo de tu nicho de negocio.

LEAVE A COMMENT

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *