Hace unos días diversos buscadores (Google, Yahoo, Microsoft) se sacaron de la manga una  nueva etiqueta meta para evitar contenidos duplicados. Se considera contenido duplicado dos páginas con una url distinta y exactamente el mismo contenido.

¿Qué es el contenido duplicado y por qué molesta?

Se considera que un contenido está duplicado cuando dos url distintas ofrecen exactamente el mismo contenido. El problema para los buscadores es que una url equivale a un documento y el hecho de tener que guardar dos o más copias de un mismo documento les resulta altamente molesto.

En consecuencia, para intentar poner las cosas fáciles a los robots rastreadores, también resulta molesto para las consultorías SEO, convirtiéndose a veces en una auténtica pesadilla. En mi caso, he llegado a encontrar indexadas hasta 30 url distintas para un mismo documento.

Hasta hace unos días los webmasters no tenían ningún mecanismo sencillo para intentar evitar el contenido duplicado. Básicamente se trataba de armarte de paciencia y pelearte con el archivo .htaccess y las redirecciones 301.

¿Cómo funciona el meta “canonical”?

Aunque no es el motivo de esta entrada explicar cómo funciona técnicamente el meta canonical [aquí se explica bastane bien], básicamente se trata de indicar cuál es la url “buena” del documento. Por ejemplo, si tenemos tres documentos iguales pero accesibles desde tres url:

  • http://www.ejemplo.com/copia1.htm
  • http://www.ejemplo.com/copia2.htm
  • http://www.ejemplo.com/copia3.htm

Poniendo <link rel=”canonical” href=”http://www.ejemplo.com/copia1.html” /> en el documento bastaría para indicar cuál es la “copia buena”.

¿Funciona ya canonical?

Para mí la salida de canonical es una de las mejores notícias que me podían dar. Y sin haber hecho experimentos al respecto, ya he aplicado el canonical a un par de clientes. Y estoy casi convencido de que ya se está usando. Pero quería diseñar un experimento desde este mismo blog para comprobarlo. Para ello he creado dos documentos exactamente iguales y he enlazado al que no se corresponde con el meta canonical.

Acceso al experimento con el meta canonical

El comportamiente esperable es que me indexe el documento que no tiene ningún enlace y el documento con el enlace anteior no. Tengo la suerte de que aunque venga algún graciosillo y me intente boicotear como ha pasado con otros experimentos, esta vez no podrá. :)

Entradas relacionadas

8 comentarios en “Experimento: funciona ya el meta canonical en Google”

  1. Esto será la solución perfecta para los “SEO” que no indexan la paginación en sus listados.

    Saludos.

  2. [...] Isaac Sunyer Consultor de negocios en internet y posicionamiento ← Experimento: funciona ya el meta canonical en Google [...]

  3. Ontools says:

    Un lio lo de las urls duplicadas.

    Las webs cuyo objetivo es ofrecer una base de datos, son las que tienen problemas con esto… por poner un ejemplo, la de paginasamarillas.

  4. [...] al experimento con el nuevo meta canonical de los principales buscadores he sacado un par de [...]

  5. Un comentario sobre lo que propone Edgar, respecto a utilizarlo en el páginado.
    OJO, porque Google especifica que lo tendrá en cuenta sólo cuando las diferencias sean ***”ligeras”***. Entiendo que cuando hay paginado, el CONTENIDO de la página 1 es bastante diferente del contenido de la página 2, etc.

    Literalmente lo que dice Google es:
    “Is it okay if the canonical is not an exact duplicate of the content?
    We allow ***slight*** differences, e.g., in the sort order of a table of products. We also recognize that we may crawl the canonical and the duplicate pages at different points in time, so we may occasionally see different versions of your content. All of that is okay with us.”

    En la siguiente URL está el detalle:
    http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html

  6. El metatag canonical se puede usar para dos webs con dominio diferente y contenido idéntico o solamente es a nivel interno, con dos páginas dentro del mismo dominio??

  7. Isaac Sunyer says:

    Solo sirve para un mismo dominio. Señor Akrolis, tendras que acudir a las redirecciones 301 para tu proposito!

  8. Ahora tengo una duda… es contenido duplicado el dominio con www o sin www? Es decir, cuando posicionamos, tan sólo se posiciona uno de los dos, generalmente “www.akrolis.com”, google considera contenido duplicado un dominio con www o sin ellas?

    Esto me surge porque si creo un subdominio que sea http://www.subdominio.akrolis.com y también lo creo así: http://www.akrolis.com/subdominio y quiero indicarle a google mediante el meta canonical que la que vale es cualquiera de esas dos… ¿qué ocurre con los subdominios sin www?

No seas perezoso y deja un comentario