Duplicate content : un problème pour les blogs ? [wprdpress]

Le duplicate content désigne le fait que l’on retrouve le même contenu ? plusieurs endroits sur le web.

Le duplicate content, un mot bien vilain, synonyme de soucis avec Dieu (les moteurs de recherche) si ce n’est pas bien géré. Il se trouve que sur les blogs et notamment ceux utilisant wordpress la question se pose souvent. Avec un wordpress standard, voire avec Tapahont, on peut retrouver les billets sur la page d’accueil, puis dans l’affichage chronologique, dans les archives, dans les catégories et enfin dans la recherche par tags. Je ne parle même pas du fait que je n’ai rêglé le problème de http://tapahont.info et http://www.tapahont.info que la semaine dernière, ni même des sites qui republie le contenu via le flux RSS dans lequel je balance l’intégralité de mes billets.

Le risque c’est que les moteurs desindexent les articles des résultats en pensant que je cherche ? les flouer.

En terme de solution, il semblerait qu’il n’y ait qu’une seule solution, tronquer les articles. Alors pour les archives, tags, recherche, je pense que c’est possible sans être trop gênant mais sur la page d’accueil, je trouve ça carement triste. J’avoue râler quand je visite un blog qui coupe ses billets, ça me fait au moins 1 clic de plus que j’ai pas forcement envie de faire. Bilan soit certains d’entre vous on une bonne idée, soit je continue comme ça en espérant que les moteurs de recherche captent que je fais ça pour faciliter la lecture soit je coupe les articles de la home.

Notez que je ne parle pas volontairement du fait que de tronquer ? pour résultat a priori d’augmenter le nombre de pages vues.

A réfléchir.

ps : pour le flux RSS, je ne me pose pas la question, il restera complet.

17 réflexions au sujet de « Duplicate content : un problème pour les blogs ? [wprdpress] »

  1. C’est vrai que c’est un problème qu’il est difficile de gérer avec WordPress…
    J’ai souvent mes articles indexés ? différents endroits, l’un est indexé via la pages des tags, l’autre via la page des archives. Mais je crois que google ? tendance ? préférer la pages des tags pour les blogs wordpress.

  2. De mon côté, les articles ne sont en entier qu’? deux endroits :
    – Home
    – Article en lui même
    Pour toute recherche ou accès par catégorie, l’accès est tronqué.
    Ce n’était pas forcément voulu initialement, mais avec le temps je me suis dit que ça avait peut-être un rôle positif sur le Duplicate Content… et du coup, je laisse ça comme ça ;).

  3. J’avoue que je ne me suis jamais posé la question.

    Je coupe mes articles sur la Home par habitude… Logique, j’écris généralement beaucoup. Deux pages Word en moyenne.
    Et comme je déteste scroller pendant 3 heures pour trouver ce que je recherche sur un site, et bien c’est automatique : Je coupe avec un « Lire la suite » – Sauf quand je publie une brève de quelques lignes [Faut pas prendre le lecteur pour un con non plus. S’il clique, il faut qu’il en ait pour ses mirettes !]

    Du coup, la même architecture se retrouve dans les archives [Enfin, les tags, j’ai supprimé la recherche par archive depuis un moment] : Billets généralement coupés, quelques uns ne l’étant pas.
    Et pour la recherche, pas de souci : C’est un module WP en Ajax qui m’affiche le titre et les quelques premiers mots, sans les images.

    Merci Richard, grâce ? toi je viens de me rendre compte que je suis nativement géniale quant au duplicate content sur Acqua Tofana.
    Humph.

    Concernant le repiquage de nos articles cependant sur d’autres sites, je crois qu’il n’y a pas grand chose ? faire. La plupart d’entre eux, même s’ils n’affichent que le début de l’article et renvoient vers le blog, aspire quand même la totalité du contenu.
    Que faire ? Ne plus s’inscrire nulle part ?

    Dieu que c’est compliqué, tout ça…

  4. Sauf erreur le « duplicate content » ne concerne pas du contenu identique publié sur un autre site ( un autre serveur) If you find that another site is duplicating your content by scraping (misappropriating and republishing) it, it’s unlikely that this will negatively impact your site’s ranking in Google search results pages. If you do spot a case that’s particularly frustrating, you are welcome to file a DMCA request to claim ownership of the content and request removal of the other site from Google’s index.

  5. Y’a une solution simple au problème :
    Ne pas indexer les pages de listes.

    facilement gérable via les plugins de SEO disponibles dans wordpress…

    vala, fini le duplicate content avec des articles intégraux dans tous les cas…

  6. N’y a t-il pas une balise HTML indiquant aux moteurs de recherche de ne pas tenir compte d’un contenu ?

    Pour les liens un attribut rel= »nofollow » indique au moteur de ne pas suivre.

    Pour le moteur de recherche yahoo, une rapide recherche indique qu’un class= »robots-nocontent » sur la englobante aurait l’effet voulu.

    Je n’ai rien trouvé pour les autres, mais il y a fort ? parier que Google doit avoir un repère équivalent …

  7. Pour moi clairement je ne pense pas que cela joue car il s’agit du même site d’une part et d’autre part ce ne sont pas les mêmes pages sauf de temps en temps ou un billet par exemple appartient ? un seul tag l? il y a un petit risque. Si le duplicate dans les blogs posait problème les blog ne serait pas aussi bien indexé, il s’avèrent redoutable par rapport au site standard non ? pour les flux ce n’est pas un soucis non plus car gg fait bien la différence l? aussi.

  8. perso le troncage en home ne me gêne pas, même si je pratique pas chez moi.
    Moi je lis tes billets via google reader, puis après je viens sur le site pour commenter. Et pis quand j’ai du retard (le cas en ce moment par un taff énorme) je balaye tes derniers billets directement depuis ton blog.
    Si ton souci est un meilleur référencement, je pense que tes lecteurs suivront sans difficulté car la qualité restera la même.

  9. La solution idéale reste de tronquer ses articles sur la home. Perso, je ne pense pas que ca gene l’internaute.

    1. ceux qui arrivent par l’article ne voit pas de différence
    2. ceux qui arrivent par la home ont un aperçu en un coup d’oeil des derniers articles publiés sans a avoir a entrer dans les details, ce qui est plutot pas mal. Apres, il faut jouer le jeu dans la redaction des articles et faire en sorte de mettre une vrai intro / un peu teasing pour encourager a lire la site de l’article. c’est un vrai effort journalistique, mais ca vaut le coup ? mon avis. Si tu es prêt ? le faire, fonce !

  10. Je pense aussi qu’il faut utiliser l’attribut nofollow sur tous les liens menant ? ces pages.

    Pour ce qui est du flux RSS repris, je ne vois pas de solution ? part les flux tronqués :-/

  11. Bon, j’ai bien réfléchis ? la question et j’ai vraiment pas envie de tronquer la home, j’aime pas ça chez les autres alors je vais pas le faire moi.

    Je vais étudier les questions de plugins/SEO… peut être déj? tronquer dans les recherches, les tags, les catégories… voir dans les pages 2/3/4…

    Merci pour vos avis et conseils.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *