Estás leyendo: WordPress, el Contenido Duplicado y cómo Corregirlo.
Suscribete a MarlexSystems via RSS

WordPress, el Contenido Duplicado y cómo Corregirlo

Escrito por Marlex el 19 de Agosto del 2007 - Ir a los Comentarios ↓

Cómo corregir el Contenido Duplicado en WordPressUna de las cosas que preocupan a la hora de posicionar es el Contenido Duplicado, en lo que WordPress es el amo y señor. La idea para Google es que privilegiará el contenido que encuentre primero -si, a veces ni siquiera el contenido que haya sido escrito primero-, por lo que muchas veces es bueno “darle la Orden” de que indexe sólo lo que necesitamos para poder Posicionarnos.

Para eso existen algunos Plugins como “Duplicate Content Cure” que nos “desactivará” las páginas que pueden, eventualmente, ser tomadas como Contenido Duplicado en nuestro Blog que, aunque no lo uso, estimo que desactive algunas páginas que no se necesiten posicionar.

Pero nuestro problema va más allá y hoy veremos porqué existe Contenido Duplicado en WordPress y como asegurarnos de que nunca exista en los índices de Google. A Simple vista, puede parecernos que WordPress es el Padre por excelencia de los Blogs, pero también el Padre del Contenido Duplicado.

Una de las cosas que se espera corregir para las Próximas versiones de WordPress es el hecho de que el Contenido no es fijo entre las páginas de WordPress, por lo que un Post que hoy puede estar en www.marlexsystems.org/page/4 en unos días más lo podremos encontrar en www.marlexsystems.org/page/23, cosa que es malo para nuestro posicionamiento, porque cuando Google descubra que el mismo contenido fue encontrado en Dos URL, posiblemente o nos penalize o nos envíe a Contenido Suplementario de su Índice.

Otro de los problemas que surgen por ahí es que podemos llegar a un Post X de nuestro Blog por diferentes lugares, donde igualmente estará nuestro Post que, a los ojos de Google, estará “duplicado”.

Veámoslo en un Ejemplo Práctico. Haremos un Seguimiento de un Post X en MarlexSystems para ver a través de qué rutas actualmente podemos llegar a el. Haremos el seguimiento de este Post: “Redes de Telefonía colapsan en Argentina por el Día del Amigo” por el Blog MarlexSystems, veamos ahora desde dónde podemos encontrarlo…

1. http://www.marlexsystems.org/category/internet/page/9/
2. http://www.marlexsystems.org/category/servidores/page/2/
3. http://www.marlexsystems.org/category/tecnologia/page/6/
4. http://www.marlexsystems.org/category/telefonia/
5. http://www.marlexsystems.org/category/novedades/page/10/
6. http://www.marlexsystems.org/category/curiosidades/page/10/

Eso sin contar el Contenido duplicado que pueden generar los Feeds, los Comentarios o el Archivo del Blog. Como ven, son muchas las maneras que tiene el GoogleBot -y también nos otros buscadores- de encontrar una Misma Publicación en WordPress.

Solución

Lo que haremos será “desactivar para Google” todas las páginas de nuestro Blog, incluyendo las Categorías, Archivo por Mes, los Feeds y los Trackbacks, donde sólo exceptuaremos nuestras entradas, así nos aseguraremos que sólo se publicarán en Google nuestros resultados.

Para realizar esto, lo único que debemos hacer es agregar a nuestro Robots.txt diferentes cadenas que nos permitirán ordenar a Google que desactive esas URLs:

User-agent: *
Disallow: /cgi-bin/
Disallow: /tag/
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /category/
Disallow: /page/
Disallow: /2007/0*
Disallow: /2007/1*
Disallow: /2006/
Disallow: */feed/
Disallow: */trackback/

Con esto ordenamos a Google que ya no indexe más el resto de las Páginas, ya que, como sabemos, lo único que necesitamos posicionar son los Posts que son los que el Usuario final verá, y no necesariamente las Categorías, el Archivo o los Feeds, eso se lo dejamos a los Lectores habituales que quieren recorrer nuestros posts. :D

Es importante destacar que si los Buscadores ya han indexado algunas páginas como las que mencionábamos anteriormente, el Archivo Robots.txt no evitará que sigan indexadas, sino, por el contrario, el cambio se aplicará desde aquí en adelante. Comentarios, Críticas y Sugerencias son Bienvenidas.


2 Respuestas en “WordPress, el Contenido Duplicado y cómo Corregirlo”. Déjanos el Tuyo
  1. Alan Vargas comentó:
    19 de Agosto del 2007 a las 16:37

    :eek: Excelente! Gracias por el tip :wink:

Retroenlaces:
  1. Google comienza una campaña contra “la web infinita”
Queremos saber tu Opinión, déjanos tu comentario!

Por favor, asegúrate de no escribir Comentarios difamatorios, racistas o similares. Haz un comentario acorde a la Temática y que colabore en la Discusión.

Los comentarios que contengan enlaces de referidos, mensajes engañosos o datos personales serán eliminados y el acceso de la persona que los redactó será cerrado a poder publicar nuevos comentarios.

Este Sitio muestra pequeñas imágenes al lado de Cada comentarista mediante el Servicio Gravatar. Regístrate en este Servicio para mostrar la tuya!

MarlexSystems es un proyecto de Patrick D'appollonio | Memoria usada: 12396.7 KB de 12800 KB | Carga: 1,428 | Consultas: 20