Guía Completa: Contenido Duplicado

contenido duplicado

contenido duplicado

En el mundo del SEO, se entiende por contenido duplicado cualquier texto repetido en más de una URL. Puedes toparte con contenido duplicado si tu sitio web genera varias copias de una misma página, o cuando se copia alguno de tus artículos en Internet.

Aunque puede parecer que esto no tiene la menor importancia para el Marketing Online, pues son realmente escasos los contenidos auténticos y originales que puedes encontrar en la web, lo cierto es que son un verdadero problema para Google.

El algoritmo de Google pretende ofrecer a los usuarios resultados diversos en una búsqueda, no el mismo contenido en distintos formatos. Es por esto que el sistema filtra los duplicados del mismo contenido para que no aparezcan.

En este sentido, el proceso de filtración del buscador es transparente: puedes llegar a no enterarte que una de tus páginas ha sido tachada como duplicada y por lo tanto estás perdiendo oportunidades de aparecer en los resultados de búsqueda.

Ahora que sabes de qué se trata, te contaré  todo sobre cómo detectar, evitar y eliminar contenido duplicado, así como las “penalizaciones” impuestas por Google y su influencia en el ecommerce.

Tipos de contenido duplicado

Es importante establecer que no solo existe un tipo de contenido duplicado: existe el interno; cuando está dentro de tu sitio web y puedes solucionarlo sin depender de la intervención de terceros, y el externo; cuando otra página web copia tu contenido, tal como señalé al principio.

¿Cómo saber si tengo contenido duplicado?

El contenido duplicado suele hallarse en las siguientes áreas:

1.Archivos: ocurre cuando un mismo contenido de tu sitio web está archivado en varias categorías o etiquetas a la vez.

Por ejemplo, cuando asignas dos categorías a un artículo estás generando un contenido duplicado a los ojos de Google, pues se publicarán dos URL diferentes para el mismo contenido.

Es por esto que debes utilizar las etiquetas con conciencia, cuando sea estrictamente necesario, para no jugar en contra del posicionamiento de tus contenidos.

2.Versiones móviles: si la versión móvil de tu página debe generar una URL, Google podría tener problemas para identificar si se trata de un contenido paralelo, esto si la web no está configurada correctamente.

3. Paginación: es muy frecuente que se generen contenidos duplicados en la paginación de un sitio, por ello es importante que los artículos no se incluyan en el sitemap: cualquier publicación que aparezca hoy en la página 1 dentro de algunos días estará también en la 2 y la 3.

Por ejemplo, si nosotros vemos http://fusiona2agencia.com/ y http://fusiona2agencia.com/page/2/ como dos cosas diferentes, para Google es la misma página duplicada.

4. Plagio: cuando otro sitio web decide deliberadamente apropiarse de tus contenidos, sin incluir un enlace que ayude a Google a identificar la publicación original. Es el caso más común de contenido duplicado externo.

5. IDs de sesión: muchas páginas web manejan el inicio de sesión de los usuarios introduciendo un código al final de la URL de cada sitio.

Aunque cada sesión cuenta con parámetros distintos, Google podría creer que se trata de páginas separadas, aunque pertenezcan a la misma.

Ahora que sabes dónde buscar, lo siguiente es apoyarte en algunas herramientas que te ayuden a encontrar los contenidos duplicados. Desde el portal de ‘Marketing and Web’ sugieren algunas realmente efectivas:

1. Virante Tools: esta herramienta puedes encontrarla en Internet y te ayudará a cubrir aspectos básicos sobre cómo evitar el contenido duplicado o eliminarlo a tiempo.
La herramienta analizará cada uno de los URL de tu sitio web para indicarte si debes corregir algún error, usando un indicador rojo.

2. Google Webmaster: para usar esta herramienta de Webmaster, dirígete a la sección “Aspectos de las búsquedas” y selecciona “Mejoras de HTML”.

Por otro lado, puedes emplear la plataforma de Google Analytics en la sección Comportamiento > Contenido del sitio > Páginas de destino.

3.SiteLiner: esta herramienta se dedica a detectar contenidos duplicados y elementos comunes de tu web, como barras laterales y menús.

Puedes utilizar la versión gratuita para escanear hasta 250 páginas y obtener un porcentaje del contenido duplicado en cada una.

4. Copyscape: a través de esta plataforma puedes descubrir fácilmente si hay sitios web plagiando tus contenidos, de modo que podrás evaluar la posibilidad de sugerir modificaciones u eliminación de las publicaciones para evitar consecuencias mayores o penalizaciones de Google.

5. Screaming Frog: esta web es ideal para analizar de forma completa cada error y contenido duplicado en tu página web. Con la versión gratuita puedes escanear hasta 500 URLS, aunque no te permitirá configurar variables.

6. Búsqueda de Google: una búsqueda sencilla en Google también puede ser útil para identificar contenidos duplicados, siempre que uses los footprints o comandos avanzados de Google.

¿Cuáles son las penalizaciones por contenido duplicado?

Google penaliza solamente a los sitios que se dedican a copiar o reescribir sistemáticamente el contenido de otros portales, el algoritmo Panda se diseñó con este propósito.

En palabras de Matt Cutts, director del departamento de prevención del spam en la web de Google hasta 2015:

Si la gran mayoría o la totalidad de tu contenido es el mismo material que aparece en todas partes, y no hay nada que los distinga realmente o que agregue valor, eso es algo que tenemos que evitar en lo posible

Debes preguntarte: “¿Qué valor aporto yo? ¿Qué tengo o no tengo de contenido original, comparado con el resto de los sitios? Así que, en lo posible, es importante tener contenido original para ofrecer un valor añadido único.

No tengas simplemente un feed de afiliados creando un sitio rápidamente, ya que no habrá una razón para que los usuarios deseen visitar tu sitio”.

Por otro lado, la mayoría del contenido duplicado en la web no es penalizado, aunque si es rechazado por el buscador. Lo que hace el algoritmo de Google, como mencioné al principio, es filtrar estos contenidos para que no aparezcan en los resultados de búsquedas.
Si bien es poco probable que obtengas una penalización grave por contenidos duplicados, si hay algunas importantes consecuencias para tu sitio web que debes tener en cuenta:

1.Poca visibilidad del contenido: tener diferentes URLS para un mismo contenido podría implicar que Google seleccione la versión de menor peso para la web, posicionando el contenido de la forma incorrecta.

2. Deficiencia en la indexación: mientras que el buscador invierte su tiempo rastreando contenidos duplicados, la indexación de tu sitio web puede verse afectada. Esto si los contenidos duplicados conforman un porcentaje importante de la página.

3. Enlaces: Las páginas duplicadas diluyen la fuerza de los contenidos. Si bien los enlaces deberían sumar fuerzas al contenido, cuando hay URL duplicadas ocurre exactamente lo contrario.

4. Posicionamiento: tal como expliqué anteriormente, Google puede decidir simplemente excluir tu página web de sus resultados de hallar contenido duplicado.

¿Cómo evito los contenidos duplicados?

Para prevenir la aparición de contenidos duplicados en tu página web, sugiero seguir estas sencillas pautas:

Acostúmbrate a solicitar permisos cada vez que necesites copiar una página entera. Así mismo, incluye un enlace fuerte que niegue al buscador el acceso a través de bots.

Nunca utilices los mismos títulos, descripciones, encabezados y/o secciones en más de una página. El texto de cada sitio debe ser único para toda la web.

Añade a los sitemaps únicamente la versión canónica de la página.

Siempre que utilices una cita de otra página, utiliza un enlace original.

Descubre cómo eliminar el contenido duplicado

Una vez que hayas detectado la ubicación exacta de los contenidos duplicados, ya sean internos o externos, con cualquiera de las herramientas que cité anteriormente, lo siguiente es librarte de ellos. Para tratar el problema, cuentas con varias opciones:

1. Red Canonical: este método emplea la etiqueta “rel=canonical”, creada exclusivamente para tratar el problema a través de una3 línea de código dentro de la sección <head> de la página que señala el buscador como versión buena, original o canónica.

2. Redirecciones 301: cuando no puedas usar la etiqueta canónica, otro de los métodos más eficientes consiste en crear redirecciones 301, es decir, comandos incluidos en el archivo .htaccess en Apache.

3. Denegar el acceso de robots: las etiquetas de meta robots o del archivo robots.txt ayudan a que los buscadores no puedan encontrar las páginas duplicadas.

4. Schema.org: se trata de un buscador que puede utilizar los datos estructurados para solucionar el problema entre páginas duplicadas.

5. Unificar páginas o reescribir contenidos: cuando varias páginas de tu sitio web muestran contenidos similares o iguales, es una muy buena opción.

Por otro lado, ¿qué se puede hacer cuando el contenido duplicado no está dentro de tu sitio web? Es decir, duplicado externo, cuando un tercero ha plagiado una o varias de tus publicaciones. Tienes dos alternativas:

1.Solicitar a la página que borre los contenidos plagiados: si detectas que alguno de tus contenidos ha sido copiado, puedes enviar un correo electrónico o rellenar un formulario de contacto para solicitar que lo borren.

Si los responsables del sitio no responden a los mensajes, usa el email de registro WHOIS, el cual puedes obtener a través de Whois.net.

Si no están dispuestos a borrar el contenido duplicado, exige que añadan un enlace a la publicación original para que el buscador pueda identificar la fuente.

2. Realiza una denuncia con Google, solicitando la eliminación del contenido. Cuando la comunicación con el sitio web no da resultado por ningún canal, puedes acudir a Google, solicitando que elimine la página que cometió la infracción de sus resultados de búsqueda.

El procedimiento se realiza llenando una solicitud basada en la ley estadounidense de protección a los derechos de autor o la ‘Digital Millennium Copyright Act, DMCA’.

Por otro lado, si deseas contribuir a las mejoras del algoritmo de Google en lo referente a detección de plagio en Internet, puedes enviar tu caso a la compañía a través de un formulario, de modo que este será utilizado como ejemplo, en lugar de informe de spam o copyright.

¿Qué hacer con el contenido duplicado en WordPress?

Si has identificado contenido duplicado en tu página de WordPress, el procedimiento para deshacerte de él eficientemente dependerá del tipo de contenido y las necesidades del portal.

Es importante definir que siempre habrá contenidos que sea importante indexar para mejorar el posicionamiento SEO, mientras que habrá otros de menor calidad que no merecerá la pena indexarlos.

En muchos casos se recomienda evitar que estos últimos aparezcan en los buscadores. De este modo no correrás el riesgo de que los contenidos con baja calidad se posicionen por encima de los demás.

En resumen, la mejor manera de evitar el contenido duplicado en WordPress, en la mayoría de los casos por mal uso de categorías y etiquetas, es no indexarlo.

Ahora bien, ¿qué ocurre con la paginación? Esta función de la plataforma es la culpable de que aparezcan grandes cantidades de contenido duplicado casi de forma inadvertida.

Para desactivar esta función y prevenir el problema, dirígete a los ajustes SEO de tu página de WordPress, selecciona la pestaña ‘Otro’ y desactiva el botón de ‘Subpáginas de archivos’.

Por otro lado, el contenido duplicado en WordPress también puede generarse desde los parámetros de URL, es decir, las terminaciones que se le añaden a las direcciones según la función.

Esto ocurre usualmente con los comentarios, terminados de esta forma: https://blog.fusiona2agencia.com/articulo/?replytocom=20.

En este sentido, con cada nuevo comentario en un artículo se crean más URLS. Al final, una sola publicación cuenta con varios URLS duplicados por el número de comentarios.

Para solucionar esto, dirígete nuevamente a los ajustes SEO de tu página de WordPress y en la sección de ‘Enlaces Permanentes’ o ‘Permalinks’ activa la opción “Quitar las variables  ?replytocom”.

Sin embargo, este no es el único problema de parámetros de URL que puede tener tu blog. Existen otros como los ‘?share’ para redes sociales. Si quieres saber cuáles tiene tu página, ve al ‘Search Console’ en la sección ‘Rastreo y Parámetros de URL’.

Por otro lado, los URLS de los adjuntos también pueden generar contenido duplicado en WordPress.

¿Cómo solucionarlo? Ve nuevamente a la sección ‘Enlaces Permanentes’ y más arriba de la opción  “Quitar las variables  ?replytocom” encontrarás una casilla para “Redireccionar las URLS de los adjuntos hacia la URL de la entrada a la que pertenecen”. Activa la función “Sin dirección”.

¿Cómo afecta el contenido duplicado al  eCommerce?

Las fichas originales de productos pueden incrementar hasta un 400% el tráfico de una página de eCommerce.

Para una web de ventas online puede llegar a ser fatal que Google la penalice por contenido duplicado interno o externo, ya que esto reduce significativamente el tráfico de usuarios.

Como señalé anteriormente, es importante no repetir títulos ni descripciones. Diferenciar los  productos con características originales es vital para la percepción de los clientes, incluso cuando existan parámetros “editoriales” que condicionen el contenido.

El Algoritmo de Google se ocupa de que un mismo producto no aparezca en más de una categoría (con URLS duplicadas), ya que aquellas webs de eCommerce que posiciona en los resultados de búsquedas deben ofrecer a los usuarios contenido original.

En este sentido, las webs de eCommerce se enfrentan a grandes inconvenientes internos que Google suele identificar como contenido duplicado. Por ejemplo, los carros de compra.

Aquellos carros de compra que no cuentan con direcciones URL noindex mediante los archivos robots.txt usualmente generan problemas.

En resumen, definitivamente no le conviene a tu tienda virtual tener contenido duplicado, es por esto que ya mismo puedes comenzar a identificarlo a través de las herramientas y consejos dispuestos previamente.

María Gabriela Vignati
María Gabriela Vignati
Artista, fotógrafa, escritora -amateur- y lectora profesional. Entusiasta de contar historias.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *