Business

Mejores prácticas de SEO para contenido sindicado

Google y el contenido duplicado

Antes de que podamos profundizar en los detalles, primero tenemos que entender por qué el contenido idéntico publicado en varios sitios web es un problema para Google.

En un boletín anterior, ‘Optimización técnica para artículos’, describí cómo Google tiene un sistema de indexación de múltiples capas. En su forma más simple, Google primero indexa un artículo basado en la fuente HTML sin procesar, y luego renderiza la página web y carga todos sus recursos asociados para que pueda obtener una visión general completa del diseño y el contenido de la página.

Pero eso no es todo lo que sucede. La indexación de Google es un complejo sistema entrelazado de muchos procesos diferentes que hacen una cosa específica como parte del esfuerzo de Google para pintar una imagen completa de la página web en sí, su lugar en el sitio web y en la web en general.

Uno de estos procesos adicionales es la deduplicación. Esencialmente, Google no quiere desperdiciar esfuerzo en páginas web que probablemente sean versiones duplicadas de otras páginas que ya han sido rastreadas e indexadas.

La desduplicación ocurre más de una vez en el ecosistema de Google. De hecho, creo que sucede en cada una de las tres etapas principales: rastreo, indexación y clasificación.

Desduplicación de rastreo

En la etapa de rastreo, Google buscará patrones de URL para determinar la probabilidad de que una URL en cola para el rastreo sea de hecho un duplicado exacto de una URL ya rastreada.

Por ejemplo, una URL con parámetros de seguimiento de GA agregados al final es, con toda probabilidad, la misma página web que la versión «limpia» de esa URL. No hay contenido nuevo para que Google lo descubra, por lo que puede decidir omitir esa URL para rastrear.

Desduplicación de índices

Cuando se trata de la etapa de indexación, Google también intenta desduplicar páginas web. Si Google encuentra dos páginas que contienen exactamente el mismo contenido, Google puede decidir incluir una en su índice de la web y descartar la otra.

Podemos encontrar ejemplos de esto en el informe Cobertura del índice en Google Search Console, como una de las razones por las que las páginas web están «Excluidas» del índice.

Desduplicación de rangos

Cuando se trata de clasificar páginas en sus resultados de búsqueda, Google también intenta desduplicar las páginas web que muestra. Google se da cuenta de que mostrar varias instancias del mismo contenido no es una gran experiencia para sus usuarios, por lo que intenta mostrar solo la versión más relevante de un artículo en un resultado de búsqueda, incluso cuando ese mismo artículo está indexado en varios sitios web.

Aquí es donde entran en juego las señales de clasificación, como la experiencia editorial. Cuando se considera que un sitio web tiene una fuerte autoridad editorial sobre un tema específico, es más probable que los artículos sobre ese tema que están alojados en ese sitio web sean elegidos para clasificarse en los resultados de Google que los mismos artículos alojados en un sitio web diferente que carece de esa experiencia editorial.

Author

OfertaPerfect

Leave a comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *