10 pasos para mejorar la rastreabilidad y la indexabilidad de su sitio

Las palabras clave y el contenido pueden ser los dos pilares sobre los que se construyen la mayoría de las estrategias de optimización de motores de búsqueda, pero están lejos de ser los únicos que importan.

Menos discutido, pero igual de importante, no solo para los usuarios, sino también para los robots de búsqueda, es la capacidad de descubrimiento de su sitio web.

hay aprox 50 mil millones de páginas web de 1.930 millones de sitios web en Internet. Esto es demasiado para que cualquier equipo humano lo explore, por lo que estos bots, también llamados arañas, juegan un papel importante.

Estos bots determinan el contenido de cada página siguiendo los enlaces de un sitio web a otro y de una página a otra. Esta información se compila en una extensa base de datos o índice de URL, que luego se someten al algoritmo del motor de búsqueda para su clasificación.

Este proceso de dos pasos para navegar y comprender su sitio se denomina rastreo e indexación.

Como profesional de SEO, sin duda ha escuchado estos términos antes, pero definámoslos solo para mayor claridad:

  • Habilidad para gatear se refiere a qué tan bien estos robots de motores de búsqueda pueden rastrear e indexar sus páginas web.
  • indexabilidad mide la capacidad de un motor de búsqueda para analizar sus páginas web y agregarlas a su índice.

Como probablemente puedas imaginar, ambos son partes esenciales del SEO.

Si su sitio tiene una capacidad de rastreo deficiente, como muchos enlaces rotos y callejones sin salida, los robots de los motores de búsqueda no podrán acceder a todo su contenido, lo que lo excluirá del índice.

La indexabilidad, por otro lado, es vital porque las páginas que no están indexadas no aparecerán en los resultados de búsqueda. ¿Cómo puede Google clasificar una página que no ha incluido en su base de datos?

El proceso de rastreo e indexación es un poco más complicado de lo que hemos discutido aquí, pero esa es la descripción general básica.

Si está buscando una discusión más profunda sobre cómo funcionan, Dave Davis tiene un excelente artículo sobre rastreo e indexación.

Cómo mejorar el rastreo y la indexación

Ahora que hemos cubierto la importancia de estos dos procesos, veamos algunos elementos de su sitio web que afectan el rastreo y la indexación, y analicemos formas de optimizar su sitio para ellos.

1. Mejorar la velocidad de carga de la página

Con miles de millones de páginas web para catalogar, las arañas web no tienen todo el día para esperar a que se carguen los enlaces. Esto a veces se denomina presupuesto de rastreo.

Si su sitio no se carga en el período de tiempo especificado, lo abandonarán, lo que significa que permanecerá sin rastrear ni indexar. Y como puedes imaginar, esto no es bueno para fines de SEO.

Por lo tanto, es una buena idea evaluar regularmente la velocidad de su página y mejorarla donde pueda.

Puedes usar Google Search Console o herramientas como Rana gritando para probar la velocidad de su sitio web.

Si su sitio funciona lentamente, tome medidas para aliviar el problema. Esto puede incluir actualizar su servidor o plataforma de alojamiento, habilitar la compresión, minimizar CSS, JavaScript y HTML, y eliminar o reducir los redireccionamientos.

Descubra qué está ralentizando los tiempos de carga consultando el suyo Métricas web básicas reporte. Si desea información más precisa sobre sus objetivos, especialmente desde una vista centrada en el usuario, Google Lighthouse es una herramienta de código abierto que puede resultarle muy útil.

2. Fortalecimiento de la estructura interna de la relación

Una buena estructura del sitio y los enlaces internos son elementos fundamentales de una estrategia de SEO exitosa. Un sitio web desorganizado es difícil de rastrear para los motores de búsqueda, lo que hace que los enlaces internos sean una de las cosas más importantes que puede hacer un sitio web.

Pero no se fíe sólo de nuestra palabra. Esto es lo que dijo John Mueller, un defensor de la búsqueda de Google:

“La vinculación interna es muy crítica para el SEO. Creo que esa es una de las cosas más importantes que puedes hacer en un sitio web para llevar a Google y a los visitantes a las páginas que crees que son importantes".

Si sus enlaces internos son malos, también corre el riesgo de páginas huérfanas o páginas que no conducen a otra parte de su sitio web. Dado que nada se dirige a estas páginas, la única forma de que los motores de búsqueda las encuentren es desde su mapa del sitio.

Para eliminar este problema y otros causados ​​por una estructura deficiente, cree una estructura interna lógica para su sitio.

Su página de inicio debe vincularse a subpáginas respaldadas por páginas más abajo en la pirámide. Estas subpáginas deberían tener enlaces contextuales donde se sienta natural.

Otra cosa a tener en cuenta son los enlaces rotos, incluidos aquellos con errores ortográficos en la URL. Esto, por supuesto, da como resultado una conexión rota, lo que dará como resultado el temido error 404. En otras palabras, no se encontró la página.

El problema con esto es que los enlaces rotos no ayudan y dañan tus habilidades de rastreo.

Vuelva a verificar sus URL, especialmente si recientemente realizó una migración del sitio, una eliminación masiva o un cambio de estructura. Y asegúrese de no vincular URL antiguas o eliminadas.

Otras mejores prácticas de enlaces internos incluyen tener una buena cantidad de contenido enlazado (el contenido siempre es lo más importante), usar texto de anclaje en lugar de imágenes enlazadas y usar “un número razonable” de enlaces por página (lo que sea que eso signifique).

Ah, sí, y asegúrate de usar los enlaces de seguimiento para los enlaces internos.

3. Envíe su Sitemap a Google

Con suficiente tiempo, y a menos que le hayas dicho que no lo haga, Google rastreará tu sitio. Y eso es genial, pero no ayuda a tu ranking de búsqueda mientras esperas.

Si recientemente realizó cambios en su contenido y desea que Google se entere de inmediato, es una buena idea enviar un mapa del sitio a Consola de búsqueda de Google.

El mapa del sitio es otro archivo que reside en su directorio de inicio. Sirve como hoja de ruta para los motores de búsqueda con enlaces directos a todas las páginas de su sitio.

Esto beneficia la indexabilidad porque le permite a Google aprender sobre varias páginas al mismo tiempo. Si bien un rastreador puede tener que seguir cinco enlaces internos para encontrar una página profunda mediante el envío de un mapa del sitio XML, puede encontrar todas sus páginas en una visita a su archivo de mapa del sitio.

Enviar su mapa del sitio a Google es especialmente útil si tiene un sitio web extenso, agrega nuevas páginas o contenido con frecuencia, o si su sitio no tiene buenos enlaces internos.

4. Actualice los archivos Robots.txt

Probablemente quieras tener robots.txt archivo para su sitio web. Aunque no es obligatorio, el 99 % de los sitios web lo utilizan como regla general. Si no está familiarizado con él, es un archivo de texto simple en el directorio raíz de su sitio web.

Le dice a los robots de los motores de búsqueda cómo le gustaría que rastreen su sitio. Su uso principal es administrar el tráfico de bots y proteger su sitio de la sobrecarga de solicitudes.

Donde esto es útil en términos de capacidad de rastreo es limitar las páginas que Google rastrea e indexa. Por ejemplo, probablemente no desee páginas como directorios, carritos de compras y etiquetas en el directorio de Google.

Por supuesto, este útil archivo de texto también puede afectar negativamente sus capacidades de rastreo. Vale la pena echar un vistazo a su archivo robots.txt (o pedirle a un experto que lo haga si no está seguro de sus habilidades) para ver si está bloqueando inadvertidamente el acceso del robot a sus páginas.

Algunos errores comunes en los archivos robots.text incluyen:

  • Robots.txt no está en el directorio raíz.
  • Mal uso de comodines.
  • Sin índice en robots.txt.
  • Scripts, hojas de estilo e imágenes bloqueados.
  • No hay URL del mapa del sitio.

Para ver en profundidad cada uno de estos problemas y consejos para resolverlos, lea este artículo.

5. Revisa tu canonización

Las etiquetas canónicas consolidan las señales de varias URL en una única URL canónica. Esta puede ser una forma útil de decirle a Google que indexe las páginas que desea mientras omite las versiones duplicadas y desactualizadas.

Pero esto abre la puerta a etiquetas canónicas fraudulentas. Se refieren a versiones anteriores de una página que ya no existe, lo que hace que los motores de búsqueda indexen las páginas incorrectas y dejen invisibles sus páginas preferidas.

Para eliminar este problema, use una herramienta de verificación de URL para buscar etiquetas fraudulentas y eliminarlas.

Si su sitio web tiene como objetivo el tráfico internacional, es decir. si está dirigiendo a los usuarios de diferentes países a diferentes páginas canónicas, debe tener etiquetas canónicas para cada idioma. Esto asegura que sus páginas estén indexadas en cualquier idioma que use su sitio.

6. Haz una auditoría del sitio

Ahora que completó todos estos otros pasos, hay una última cosa que debe hacer para asegurarse de que su sitio esté optimizado para el rastreo y la indexación: una auditoría del sitio. Y eso comienza con verificar el porcentaje de páginas indexadas por Google para su sitio.

Consulta tu índice de indexabilidad

Su tasa de índice es el número de páginas en el índice de Google dividido por el número de páginas en nuestro sitio web.

Tú puedes entender cuantas paginas hay en el indice de google desde el índice de Google Search Console yendo a la pestaña Páginas y verificando la cantidad de páginas del sitio web desde el panel de administración de CMS.

Es muy probable que su sitio tenga algunas páginas que no desea indexar, por lo que este número probablemente no sea del 100%. Pero si la tasa de indexación está por debajo del 90%, entonces tiene problemas que deben investigarse.

Puede obtener sus URL no indexadas de Search Console y verificarlas. Esto puede ayudarlo a descubrir qué lo está causando. el problema.

Otra herramienta útil de verificación de sitios incluida en Google Search Console es Herramienta de verificación de URL. Esto le permite ver lo que ven las arañas de Google, que luego puede comparar con páginas web reales para ver lo que Google no puede visualizar.

Auditoría de páginas recién publicadas

Siempre que publique nuevas páginas en su sitio web o actualice sus páginas más importantes, debe asegurarse de que se indexen. Inicie sesión en Google Search Console y asegúrese de que aparezcan todos.

Si aún tiene problemas, la auditoría también puede darle una idea de qué otras partes de su estrategia de SEO se están quedando cortas, por lo que es una doble victoria. Mejore su proceso de auditoría con herramientas como:

  1. Rana gritando
  2. Semrush
  3. zipties
  4. oncrawl
  5. Lumar

7. Comprueba si hay contenido de baja calidad o duplicado

Si Google no considera que su contenido sea valioso para los buscadores, puede decidir que no vale la pena indexarlo. Este contenido débil, como se le conoce, puede ser contenido mal escrito (por ejemplo, lleno de errores gramaticales y ortográficos), contenido repetitivo que no es exclusivo de su sitio o contenido sin señales externas de su valor y autoridad.

Para encontrar esto, determine qué páginas de su sitio no están indexadas y luego revise las consultas de destino para ellas. ¿Están proporcionando respuestas de alta calidad a las preguntas de los buscadores? Si no es así, reemplácelos o actualícelos.

El contenido duplicado es otra razón por la que los bots pueden bloquear mientras rastrean su sitio. Básicamente, lo que sucede es que su estructura de codificación la tiene confundida y no sabe qué versión indexar. Esto puede ser causado por cosas como ID de sesión, elementos de contenido redundantes y problemas de paginación.

A veces, esto activará una advertencia en Google Search Console que le indicará que Google está encontrando más URL de las que cree que debería. Si no obtuvo uno, verifique los resultados de su rastreo en busca de cosas como etiquetas duplicadas o faltantes o URL con caracteres adicionales que podrían generar trabajo adicional para los bots.

Corrija estos problemas arreglando etiquetas, eliminando páginas o ajustando el acceso de Google.

8. Elimina las cadenas de redireccionamiento y los redireccionamientos internos

A medida que los sitios web evolucionan, los redireccionamientos son un subproducto natural de dirigir a los visitantes de una página a otra más nueva o más relevante. Pero a pesar de que son comunes en la mayoría de los sitios, si los maneja mal, sin darse cuenta puede sabotear su propia indexación.

Hay varios errores que puedes cometer al crear redireccionamientos, pero uno de los más comunes son las cadenas de redireccionamiento. Esto ocurre cuando hay más de una redirección entre el enlace en el que se hizo clic y el destino. Google no ve esto como una señal positiva.

En casos más extremos, puede iniciar un bucle de redirección en el que una página se redirige a otra página, la cual redirige a otra página, y así sucesivamente, hasta que finalmente se vincula de nuevo a la primera página. En otras palabras, ha creado un ciclo sin fin que no conduce a ninguna parte.

Verifique las redirecciones de su sitio usando Screaming Frog, Redirect-Checker.org o instrumento similar.

9. Repara enlaces rotos

Del mismo modo, los enlaces rotos pueden causar estragos en la capacidad de rastreo de su sitio. Debe revisar su sitio con regularidad para asegurarse de que no tenga enlaces rotos, ya que esto no solo dañará sus resultados de SEO, sino que también frustrará a los usuarios.

Hay varias formas de encontrar enlaces rotos en su sitio, incluida la evaluación manual de cada enlace en su sitio (encabezado, pie de página, navegación, en el texto, etc.), o puede usar Google Search Console, Analytics o Screaming Frog para encontrar 404 errores.

Una vez que encuentre enlaces rotos, tiene tres opciones para corregirlos: redirigir (consulte la sección de advertencia anterior), actualizar o eliminar.

10. Indexa Ahora

IndexNow es un protocolo relativamente nuevo que permite que las URL se envíen simultáneamente entre motores de búsqueda a través de una API. Funciona como una versión mejorada de enviar un mapa del sitio XML, alertando a los motores de búsqueda sobre nuevas URL y cambios en su sitio web.

Básicamente, lo que hace es proporcionar a los robots una hoja de ruta hacia su sitio por adelantado. Ingresan a su sitio con la información que necesitan, por lo que no es necesario volver a revisar constantemente su mapa del sitio. Y a diferencia de los mapas de sitio XML, le permite informar a los motores de búsqueda sobre las páginas con un código de estado distinto de 200.

Es fácil de implementar y solo requiere que genere una clave API, la aloje en su directorio o en otro lugar y envíe sus URL en el formato recomendado.

resumiendo

A estas alturas, debería tener una buena comprensión de las capacidades de indexación y rastreo de su sitio web. También debe comprender cuán importantes son estos dos factores para su clasificación en búsqueda.

Si las arañas de Google pueden rastrear e indexar su sitio, no importa cuántas palabras clave, vínculos de retroceso y etiquetas use, no aparecerá en los resultados de búsqueda.

Y es por eso que es esencial revisar regularmente su sitio en busca de cualquier cosa que pueda ser instructiva, engañosa o que desvíe a los bots.

Entonces, consiga un buen conjunto de herramientas y comience. Sea diligente y esté atento a los detalles y pronto tendrá arañas de Google invadiendo su sitio como arañas.

Más recursos:


Imagen destacada: Roman Samborski/Shutterstock

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir