Filtres Google (partie 5)

C'est ici que l'on discute du référencement ciblé sur un moteur de recherche...

Modérateur: david96

Filtres Google (partie 5)

Messagede Yatooweb » Lun 26 Mar 2007 16:44

Articles précédents:
Filtres Google (partie 1) | Filtres Google (partie 2)
Filtres Google (partie 3) | Filtres Google (partie 4)

Filtre Duplicate Content, robots.txt et Google bowling

Le filtre de Duplicate Content est déjà bien connu pour une partie d'entre vous, il est appliqué lorsque le contenu est déjà indéxé sur une autre page. Si je copie une page existante d'un autre site ou même demon propre site, ma page sera considérée comme un Duplicate Content. S'il y a de nombreuses copies d'une page web, Google n'en présentera qu'une partie dans ses résultats.
Erreurs de base du Duplicate Content:
1/ -www.example.com et -example.com
Si vous n'utilisez que la version -www.example.com, pensez à faire pointer -example.com vers -www.example.com, car si les 2 sites sont indéxés, il y a un grand risque de Duplicate Content.
2/ -www.example.com et -www.example.com/index.html
Même chose que le point 1/

La mauvaise utilisation du fichier robots.txt n'est pas réellement un filtre mais peut avoir un effet pénalisant. Le fichier robots.txt vous permet de donner des indications aux moteurs de recherche (ce qu'il a le droit ou non de faire), il est donc nécessaire de l'utiliser correctement.

Google bowling signifie que des concurrents utilisent des techniques de spams de référencement pour pénaliser votre site (Hé oui c'est possible ! :twisted:). Ils utilisent des pages satellites avec redirections javascript, des blogs spams, des liens spams...
Bien que ce soit votre concurrent qui ait utilisé des techniques de spam, Google peut penser que c'est vous dans le but de booster votre référencement.

Comment éviter les filtres pénalisant ?

Afin d'éviter le Duplicate Content, vérifiez tout d'abord que vous n'avez pas commis les 2 erreurs citées plus haut, si c'est le cas utilisez une redirection 301.
Code: Tout sélectionner
RewriteEngine On
RewriteCond %{HTTP_HOST} ^example\.com$
RewriteRule ^(.*)   http://www.example.com/$1 [QSA,R=301,L]
Vérifiez également que vous n'avez pas plusieurs versions indéxées pour un même contenu (version imprimable, version WAP...)

Pour éviter des erreurs d'écriture sur le fichier robots.txt, je vous recommande de lire Le fichier Robots.txt par Abondance.

S'il vous semble avoir été pénalisé injustement suite au Google bowling, vous pouvez demander à Google de réexaminer les pénalités qui pèsent sur votre site. (Lire: Filing a reinclusion request en anglais)

Article original: 15 Google spam filters and how to avoid them - Part 5
Avatar de l’utilisateur
Yatooweb
Administrateur
Administrateur
 
Messages: 1002
Inscription: Mar 30 Jan 2007 14:10
Localisation: Aude

Messagede david96 » Lun 26 Mar 2007 23:25

Pour la première erreur de l'alias du site (www or not www). Le compte Outils pour les webmasters de Google (plus connu sous le nom de Compte sitemap) nous donne la possibilité de choisir lequel des deux bannir de l'index de Google.

Par contre pour ce qui concerne les duplicates d'impression ?

Je m'explique, il n'est point rare de proposer une version impression d'une page ! Je le fais pour un de mes sites, je n'ai pour le moment jamais ressenti de pénalité à ce niveau, Google comprenant intelligemment laquelle doit être indexé (page plus populaire), du moins je le pense... A suivre !
Avatar de l’utilisateur
david96
Modérateur
Modérateur
 
Messages: 950
Inscription: Mar 13 Fév 2007 00:52
Localisation: Grenoble

Messagede Yatooweb » Lun 26 Mar 2007 23:36

Pour le contenu je vois tout à fait ce que tu veux dire, j'ai également ce système sur certains sites qui ne posent en effet pas de problèmes. Tout comme le système de certains forums qui possèdent parfois une version légère...

Une version imprimable est généralement dépourvu de design, la page est agencée différemment, dans ce cas il est vrai que le duplicate content ne semble pas avoir d'effet pénalisant. L'effet se ferait normalement ressentir lors de page (code+contenu) trop semblable.
Avatar de l’utilisateur
Yatooweb
Administrateur
Administrateur
 
Messages: 1002
Inscription: Mar 30 Jan 2007 14:10
Localisation: Aude

Messagede david96 » Mar 27 Mar 2007 00:08

Exact ! J'ai envie de dire Ouf ! Mais jusqu'à quand ? Car comme tu le dis, Google pénalise s'il voit un duplicate quasi comme un copié/collé du code source sur une autre page...
Avec le temps son algorithme va surement être moins généreux à ce niveau !

Au pays d'Internet, y'a les méchants et les gentils...
Certains webmestres changent un mot par ci par là d'une même page, pour l'indexer sur plusieurs url, voir plusieurs nom de domaine (véridique, j'ai vu un site indexé sur deux pages avec ce système !).

Y'a les méchants et les gentils, mais y'a aussi des nuances ! :-D

On peut référencer ses pages par affiliations chez des partenaires, histoire de véhiculer une information rapidement et à un plus grand nombre (C'est aussi ça Internet)

Mais si Google au détriment de la nuance, veut combattre les méchants, il va durcir son algo de duplicate pour éviter ce genre de travers.
Si son algo devient plus strict, genre : prendre une moyenne de mots clefs pour une page en omettant le design ! Comparer ensuite les autres sites ayant la même moyenne de mots clefs, ça peut faire mal !

Ok, je vais loin, je me fais un thriller en 3 dimensions, mais qui sait ? :lol:
Avatar de l’utilisateur
david96
Modérateur
Modérateur
 
Messages: 950
Inscription: Mar 13 Fév 2007 00:52
Localisation: Grenoble

Messagede Yatooweb » Mar 27 Mar 2007 11:07

Je trouve que pour le moment le filtre duplicate content est plutôt efficace, Google sait reconnaître la page "originale" en analysant la qualité du site, la page la plus ancienne dans son index, le développement de backlinks, les fils RSS... Parfois évidemment il y a quelques erreurs mais dans l'ensemble le filtre est bon.
Avatar de l’utilisateur
Yatooweb
Administrateur
Administrateur
 
Messages: 1002
Inscription: Mar 30 Jan 2007 14:10
Localisation: Aude

Messagede david96 » Mar 27 Mar 2007 14:44

Il est vrai, mais j'extrapolai dans ce qui pourrait arriver de pire ! :D

J'ai appris dans le monde du référencement que rien n'étais acquis, on n'est pas l'abri des surprises d'un nouvel algo qui remettrait le tout en question.
Avatar de l’utilisateur
david96
Modérateur
Modérateur
 
Messages: 950
Inscription: Mar 13 Fév 2007 00:52
Localisation: Grenoble

Messagede loren » Ven 20 Avr 2007 15:05

Merçi de tous ces éclaircissements mais comment sait-on si l' on est pénalisé ou non ?

Merçi
loren
YatooNovice
YatooNovice
 
Messages: 2
Inscription: Ven 20 Avr 2007 12:30

Messagede david96 » Ven 20 Avr 2007 15:22

C'est une très bonne question.

A mon avis si tu suis tes positions et que tu vois ton site être déclassé furieusement, il faudra certainement vérifier tout les points qui peuvent te pénaliser.

Pour le duplicate content, j'ai un doute à vrai dire !

Celui-ci ne doit concerner que les sites qui en abusent vraiment ! Genre 10 pages différentes de même contenu pour le même nom de domaine.
Avatar de l’utilisateur
david96
Modérateur
Modérateur
 
Messages: 950
Inscription: Mar 13 Fév 2007 00:52
Localisation: Grenoble

Messagede Yatooweb » Ven 20 Avr 2007 17:41

Pour savoir si tu as été pénalisé et quel type de pénalisation, il faut faire une petite analyse.

Il est beaucoup plus facile de déterminer si tu as été pénalisé sur un site qui existe depuis déjà quelques temps, la chute du nombre de visiteurs te mettra la puce à l'oreille ensuite il suffit de regarder son outil de stat pour savoir le type de pénalisation (totalité des mots clés, juste un groupe, un seul mot clé...) et analyser les erreurs que tu as pu faire sur le site (trop de mots clés sur une page, trop de backlinks d'un coup, trop de backlinks avec un même intitulé...).

Pour un site récent c'est plus difficile de déterminer s'il s'agit d'une pénalité ou le simple fait que tu n'a pas attendu assez longtemps avant de pouvoir te placer sur des mots clés.
Avatar de l’utilisateur
Yatooweb
Administrateur
Administrateur
 
Messages: 1002
Inscription: Mar 30 Jan 2007 14:10
Localisation: Aude

Messagede loren » Ven 20 Avr 2007 17:52

Encore merçi de votre aide.

Il n' existe donc pas d' autre outil que le bon sens pour savoir si un site a été pénalisé et dans quelle mesure.

Hélas, on peut aussi envisager le cas d' un site qui stagnerai, malgré des efforts de réferencement, du fait de pénalités alors difficiles à détecter.
loren
YatooNovice
YatooNovice
 
Messages: 2
Inscription: Ven 20 Avr 2007 12:30

Messagede Yatooweb » Ven 20 Avr 2007 17:57

Hélas, on peut aussi envisager le cas d' un site qui stagnerai, malgré des efforts de réferencement, du fait de pénalités alors difficiles à détecter.

Hé oui c'est malheureusement déjà arrivé qu'un site ait énormément de mal à décoller (ça peut se compter en plusieurs mois...). Il faut en attendant se pencher sur Live Search et Yahoo! qui n'utilisent pas le même algorithme. :wink:
Avatar de l’utilisateur
Yatooweb
Administrateur
Administrateur
 
Messages: 1002
Inscription: Mar 30 Jan 2007 14:10
Localisation: Aude

Messagede david96 » Ven 20 Avr 2007 23:02

Exact suivre MSN et Yahoo nous donne empiriquement ce que pourra donner le positionnement de notre site sur Google dans plusieurs mois ! :lol:
Avatar de l’utilisateur
david96
Modérateur
Modérateur
 
Messages: 950
Inscription: Mar 13 Fév 2007 00:52
Localisation: Grenoble


Retourner vers Référencement Google, Yahoo, MSN...

Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité

W3C XHTML 1.0
W3C CSS 2.1
YATOOWEB © 2005 - 2012


Contact | Logos & liens | Partenaires | Labo | Plan du site