3 píldoras SEO de Apache contra el contenido duplicado

Seguro que alguna vez has oído hablar del contenido duplicado. Ese error SEO sucede cuando dos o más URLs sirven exactamente el mismo contenido; por ejemplo:

  • http://example.com
  • https://example.com/

Otro ejemplo es este:

  • https://example.com
  • https://www.example.com

Y otro ejemplo es este:

  • https://example.com
  • https://example.com/

Espero que estos ejemplos te ayuden a entender rápidamente este problema; en todo caso, para ampliar esta información no dudes en consultar este recurso de Google.

¿Cómo puedo saber si mi web tiene contenido duplicado?

¿Cómo puedo saber si mi web tiene contenido duplicado?

Lo más sencillo es meterte en Google Webmasters y una vez dentro irte a Aspecto de la búsqueda > Mejoras de HTML.

Figura 1. Mejoras de HTML

Figura 1. Mejoras de HTML

En el ejemplo anterior, Google me avisa que tengo 2 metadescripciones y etiquetas de título duplicadas.

¿Cómo puedo arreglar el contenido duplicado?

Pues bien amig@s, para los fans del servidor web Apache como yo, hoy vengo con tres píldoras técnicas Apache contra el contenido duplicado. Vamos a escribir las reglas Apache que solucionan los tres ejemplos de antes.

Sé que alguno de vosotr@s dirá que esto se puede arreglar con tal o cual plugin, ¡pues claro que sí! Pero la solución que me gustaría compartir hoy contigo es así como más artesana, porque te invita a escribir tú mismo las reglas correspondientes en el archivo de configuración .htaccess. De hecho, por si no lo sabes, esto es lo que los plugins de los CMS suelen hacer por nosotros: escribir directivas de configuración.

Este artículo te vendrá muy bien si tienes que hacer una web desde el principio y por tanto no cuentas con ningún CMS que haga un montón de cosas por ti.

Eligiendo una URL canónica

Eligiendo una URL canónica

Entonces, lo primero que tienes que hacer es definir la URL canónica de tu website, en nuestro ejemplo será esta:

  • https://example.com/

La URL canónica no es más que la URL oficial de tu website, por decirlo así, es la URL que más te gusta, la que compartirás con tus amigos, la que enviarás a tus clientes, a tus suscriptores, etc.

Suponiendo que nuestra web utiliza HTTPS para todo, en nuestro ejemplo podemos elegir una de las siguientes URLs canónicas:

  • https://example.com/
  • https://example.com
  • https://www.example.com/
  • https://www.example.com

Algunas de estas URLs terminan en barra y otras empiezan por www. Todas ellas son válidas y hasta donde yo sé no existe ninguna diferencia significativa, en términos SEO, entre elegir una u otra.

¡Tenemos que elegir una!, así que nos vamos a quedar con https://example.com/ Fíjate que nuestra URL canónica no lleva el prefijo www. y termina en barra.

Pon la etiqueta canonical en tus documentos HTML

Pon la etiqueta canonical en tus documentos HTML

Una forma de decirle a los buscadores que esta es nuestra URL oficial es poniendo la siguiente etiqueta

en la sección head de la página principal de nuestro website.

Pero cuidado, ¡esto no es suficiente! Tienes que ponerlo en todas las páginas de tu web; por ejemplo, en https://example.com/blog/ tendría que haber esta etiqueta canonical.

Así ayudarás a los buscadores a entender cómo se estructura tu website.

Redireccionando las URLs no canónicas a la canónica

Entonces ya solo nos queda redireccionar estas URLs:

  • https://example.com
  • https://www.example.com/
  • https://www.example.com

a su forma canónica:

  • https://example.com/

Para redireccionar http a https:

Para redireccionar todas las URLs que llevan el prefijo www a su contraparte que no la lleva:

Para redireccionar todas las URLs que no llevan la barra final a su contraparte que sí la lleva:

Fíjate que en estos ejemplos definimos el código de estado 301 para llevar a cabo la redirección.

Recuerda que 301 es un código HTTP que significa “movido permanentemente”. Es así como indicamos a los crawlers que la dirección buena es precisamente la canónica. O dicho de otra forma, cuando las personas o los crawlers intenten acceder a las páginas

  • https://example.com
  • https://www.example.com/
  • https://www.example.com

recibirán una redirección por parte del servidor web que les llevará a la versión canónica del URL, y esta redirección estará etiquetada con el código 301, de modo que los crawlers podrán saber fácilmente que la URL buena es https://example.com/

Y esto es todo por hoy. Espero que el tip de hoy te haya gustado y que lo compartas y lo comentes con tus amigos en las redes: Twitter, Google+, Facebook, etc. ¡Que tengas un buen fin de semana!