¿Cuál es la diferencia y cómo solucionar ambos?

Google Search Console advierte a los editores sobre los errores 404: 404 y software 404.

Aunque ambos se llaman 404, son muy diferentes.

Por lo tanto, es importante comprender la diferencia entre los errores para poder corregirlos.

Códigos de estado HTTP

Una página web a la que accede un navegador responde con un código de estado que informa si la solicitud fue exitosa y, de no ser así, por qué no lo fue.

Estas respuestas se comunican con lo que se denominan códigos de respuesta HTTP, pero oficialmente se llaman códigos de estado HTTP.

El servidor proporciona cinco categorías de códigos de respuesta; Este artículo trata específicamente sobre una respuesta, el código de estado de página 404 no encontrada.

El significado de un código de respuesta 404

Todos los códigos dentro de la serie de respuesta 4xx significan que la solicitud no se pudo cumplir porque no se encontró la página.

los definición oficial es:

4xx (Error del cliente): la solicitud contiene una sintaxis incorrecta o no se puede ejecutar

Una respuesta 404 es ambigua en cuanto a si se puede devolver la página web.

Ejemplos de por qué sucede 404 Página no encontrada

  • Si alguien elimina por error una página web, el servidor responde con una respuesta 404 de página no encontrada.
  • Si alguien se vincula a una página web que no existe, el servidor responde con una página no encontrada (404).

los documentación oficial es clara acerca de la ambigüedad de si una página se ha ido de forma temporal o permanente:

"El código de estado 404 (No encontrado) indica que el servidor de origen no ha encontrado una representación actual para el recurso de destino o no está dispuesto a revelar que existe.

Un código de estado 404 no indica si esta falta de rendimiento es temporal o permanente…”

En resumen, el código 404 página no encontrada significa que hubo un error en la solicitud del navegador porque no se pudo encontrar la página solicitada.

¿Qué es un error suave 404?

El error de software 404 no es un código de estado oficial. El servidor no envía una respuesta 404 suave a un navegador porque no existe un código de estado 404 suave.

suave 404 describe una situación en la que el servidor presenta una página web y responde con un código de estado 200 OK que indica éxito cuando falta la página web o el contenido.

Cuatro causas comunes de un 404 suave

Falta una página web y el servidor envía un estado 200 OK.

Este tipo de 404 suave ocurre cuando falta una página, pero la configuración del servidor redirige la página faltante a la página de inicio o a una URL personalizada.

Falta la página, pero el editor ha hecho algo para cumplir con la solicitud de la página que falta.

Falta contenido o es "escaso".

Cuando el contenido falta por completo o hay muy poco contenido (también conocido como contenido delgado), el servidor responderá con un código de estado 200, lo que significa que la solicitud de la página fue exitosa.

Pero para indexar páginas web que no son solicitudes de páginas web exitosas, los motores de búsqueda llaman a esto 404 suaves.

La página que falta redirige a la página de inicio.

Algunos creen erróneamente que hay algo mal con la respuesta de error 404.

Entonces, para detener las respuestas de error 404, el editor puede redirigir la página que falta a la página de inicio, aunque la página de inicio no sea la solicitada.

Google llama a estas solicitudes de página fallidas 404 blandos.

La página que falta se redirige a una página web personalizada.

A veces, las páginas que faltan redirigen a una página web especialmente diseñada que sirve un código de estado 200, lo que hace que Google etiquete esas páginas como 404 suaves.

¿Quién acuñó la frase Soft 404?

El concepto de un 404 suave puede haberse originado en un artículo de investigación de 2004 titulado Hacia una comprensión de la ruptura de la red (PDF).

Las páginas faltantes que se reemplazan incorrectamente son un problema para los motores de búsqueda que intentan indexar páginas reales.

Así es como el artículo de investigación enmarca los 404 blandos:

"Según el protocolo HTTP, cuando se realiza una solicitud a un servidor de una página que ya no está disponible, el servidor debe devolver un código de error...

... de hecho, muchos servidores, incluidos los de mayor reputación, no devuelven un código 404; en cambio, los servidores devuelven una página de reemplazo y un código OK (200).

... Nuestra investigación muestra que este tipo de reemplazos, llamados "soft-404", representan más del 15% de los enlaces muertos. "

Soft 404 debido a errores de codificación

Hay casos en los que la página no falta, pero problemas específicos (como errores de codificación) han provocado que Google la categorice como una página faltante.

Los 404 de software son esenciales para investigar porque pueden señalar un código roto.

Problemas típicos de codificación:

  • Un archivo faltante o incluido que debería llenar una página web con contenido.
  • Error de la base de datos.
  • Falta JavaScript.
  • Páginas de resultados de búsqueda en blanco.

Los errores 404 tienen dos causas principales

  • Error en el enlace dirige a los usuarios a una página que no existe.
  • Un enlace a una página que existía pero desapareció repentinamente.

Error de conexión

Si el motivo del 404 es un error de conexión, debe corregir las conexiones.

La parte complicada de esta tarea es encontrar todos los enlaces rotos en el sitio. Puede ser más difícil rastrear sitios grandes y complejos con miles o millones de páginas.

En casos como este, las herramientas de rastreo son útiles.

Tiene tantas opciones de software de rastreo para elegir: Xenu y Greenflare gratuitos; o software pago como Screaming Frog, DeepCrawl, Botify, Sitebulb y OnCrawl, donde algunos tienen pruebas gratuitas o versiones gratuitas pero limitadas.

Una página que ya no existe

Cuando una página ya no existe, tiene dos opciones:

  • Restaure la página si la eliminación fue accidental.
  • 301 lo redirige a la página relacionada más cercana si la eliminación es intencional.

Primero, debe encontrar cualquier error de conexión del sitio. De manera similar a encontrar todos los errores de enlace para un sitio web grande, puede usar herramientas de rastreo.

Sin embargo, es posible que los rastreadores no encuentren páginas huérfanas: páginas que no están enlazadas en ningún lugar dentro de los enlaces de navegación o desde ninguna de las páginas.

Pueden existir páginas huérfanas si fueran parte del sitio web, luego, después de que un sitio web se rediseñe, el enlace a esa página anterior desaparece, pero los enlaces externos de otros sitios web aún pueden apuntar a ellos.

Para verificar dos veces si este tipo de página existe en su sitio, puede usar varias herramientas.

Cómo identificar las páginas de respuesta 404

Informes de la consola de búsqueda de Google

El informe de cobertura enumera 404 URL de error del sitio web.

Captura de pantalla de Google Search Console, agosto de 2022

Search Console informará 404 páginas mientras Google rastrea todas las páginas que puede encontrar. Esto puede incluir enlaces de otros sitios a una página que existía en su sitio web.

Google analitico

No encontrará un informe de página faltante en Google Analytics de forma predeterminada. Sin embargo, puede rastrearlos de diferentes maneras.

Por un lado, puede crear un informe personalizado y segmentar páginas mencionando el título de la página. Error 404 - Página no encontrada.

Otra forma de encontrar páginas huérfanas en Google Analytics es crear grupos de contenido personalizados y asignar las 404 páginas a un grupo de contenido.

Sitio: Comando de búsqueda de operadores

No se puede usar el sitio: comando de búsqueda para encontrar errores 404 porque Google no indexa páginas web 404 o páginas web 404 de software.

El sitio de Google: el operador de búsqueda es útil para encontrar páginas web en un sitio que contenga una frase clave específica en el contenido de las páginas web.

Google Search Console es la mejor fuente para identificar una lista de 404 blandos y 404 normales.

Los registros de errores de tráfico del sitio web son una fuente útil para identificar las respuestas de error 404.

Otras herramientas de investigación de backlinks

Las herramientas de investigación de backlinks como Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, Semrush, LinkResearchTools y CognitiveSEO también pueden ayudar.

La mayoría de estas herramientas exportarán una lista de enlaces a su dominio. Desde allí, puede verificar todas las páginas vinculadas y buscar errores 404.

Cómo corregir errores suaves 404

Los rastreadores no detectarán un error de software 404 porque no es un error 404. Pero puede usar los rastreadores para detectar otra cosa.

Aquí hay algunas cosas que debe buscar:

  • Contenido delgado: Algunos rastreadores informan páginas que tienen contenido escaso junto con un recuento de palabras clasificables. Comience con las páginas con la menor cantidad de palabras para determinar si la página tiene contenido débil.
  • Contenido duplicado: Algunos rastreadores son lo suficientemente sofisticados como para averiguar qué porcentaje de una página es contenido de plantilla. Además, existen herramientas creadas específicamente para encontrar contenido duplicado interno, como SiteLiner. Si el contenido principal es casi el mismo que muchas otras páginas, debe mirar esas páginas y determinar por qué existe contenido duplicado en su sitio.

Además de las herramientas de rastreo, también puede usar Google Search Console y verificar los errores de rastreo para encontrar páginas enumeradas bajo 404 suaves.

Rastrear un sitio completo para encontrar problemas que causen errores 404 le permite localizar y solucionar problemas antes de que Google los descubra.

Una vez que encuentre estos problemas 404 leves, deberá solucionarlos.

La mayoría de las veces, las soluciones parecen razonables. Esto puede incluir cosas simples como expandir páginas con contenido escaso o reemplazar contenido duplicado con contenido nuevo y único.

Correos Durante este proceso, aquí hay algunas cosas a tener en cuenta:

Consolidar páginas

A veces, el contenido débil es causado por un tema de página demasiado específico, lo que le deja poco que decir.

Combinar varias páginas delgadas en una puede ser más apropiado si los temas están relacionados. Esto no solo resuelve problemas de contenido delgado, sino que también puede solucionar problemas de contenido duplicado.

Por ejemplo, un sitio de comercio electrónico que vende zapatos en diferentes colores y tallas puede tener una URL diferente para cada combinación de tallas y colores. Esto deja una gran cantidad de páginas con contenido débil y relativamente idéntico.

En cambio, un enfoque más eficiente es ponerlo todo en una página y enumerar las opciones disponibles.

Encuentre problemas técnicos que causan contenido duplicado

Usando incluso el rastreador web más simple como Xenu (que no mira el contenido, solo las URL, los códigos de respuesta y las etiquetas de título), aún puede encontrar problemas con el contenido duplicado al mirar las URL.

Esto incluye www vs. URL no www, HTTP y HTTPS, con y sin index.html, con y sin parámetros de seguimiento, etc.

Errores 404 y errores 404 blandos

Lo más importante que debe recordar acerca de los errores 404 es que si realmente faltan las páginas, entonces no hay nada que arreglar. Está bien mostrar una respuesta 404 para solicitudes de páginas que no existen.

Pero si las páginas existen pero en una URL diferente, entonces esto debe solucionarse redirigiendo un enlace roto a la URL real, restaurando una página que falta o redirigiendo la URL anterior a una nueva página que la reemplace.

Un 404 suave siempre es el resultado de un problema que necesita ser diagnosticado y reparado.

Comprender la diferencia entre los 404 es esencial para mantener un sitio web funcionando al máximo rendimiento.


Imagen destacada: Paulo Bobita / Search Engine Journal

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir