Qu’est ce qu’un environnement de test SEO idéal ?

Régulièrement, nous constatons des études, tests ou encore des infographies en rapport avec le SEO. En effet, nombre d’agences et de référenceurs nous transmettent leurs trouvailles via les réseaux sociaux, blogs ou plus encore.

Cependant, un détail est souvent omis, comment font-ils pour arriver à leurs conclusions ? Est-ce-qu’ils ont testé des facteurs au sein de plusieurs pages ? D’une page complète ? D’un site complet ? Clairement, la technique et l’environnement utilisé pour le test n’est pas souvent indiqué.

C’est pour cela que pour ce second article, je m’en vais vous partager l’une de mes réflexions SEO afin de vous faire réfléchir, réagir et/ou débattre sur les environnements de test et sur leur importance d’être neutre et fiable lors d’études de critères SEO.

Pour appuyer cette réflexion, je mettrai donc en avant notre cher ami Google, mais il est tout à fait possible d’imaginer les mêmes réflexions chez d’autres moteurs.

A noter que je ne suis pas là pour critiquer les tests des uns et des autres. Chacun possède ses méthodes et vous comprendrez d’ailleurs dès la fin de cet article, pourquoi il n’est pas possible de faire des environnements de tests exagérément neutres et fiables.

Fonctionnement général de Google

Tout d’abord, j’aimerais reprendre rapidement les grandes lignes de fonctionnement du moteur Google pour vous permettre de mieux comprendre la suite. Pour ceux qui savent de quoi il s’agit, je vous propose d’aller au dernier paragraphe de cette partie, et pour les autres, vous pouvez continuer la lecture.

En premier lieu, il faut savoir que Google possède un robot d’exploration appelé GoogleBot. Ce robot navigue sur le web en parcourant chaque lien qu’il trouve sur son chemin. C’est ce qu’on appelle le processus de crawl.

Après cela, il s’attèle à scanner vos pages pour en extraire titres, contenus, liens, etc. Ainsi, cela lui permet de trier chaque page et de déterminer leur thématique, type et plus encore. C’est ce qu’on appelle l’indexation. En clair, il scanne et stocke vos pages dans un index hyper bien rangé.

Ensuite, lorsque vous faites une recherche, l’algorithme cherche et évalue les pages les plus pertinentes en rapport avec votre requête. Il pioche ainsi dans l’index et positionne sur votre écran les meilleures pages sous forme de résultats. A noter que le positionnement est évalué à partir de centaines de critères de pertinences (+ de 200) et d’un certain nombre de filtres.

[box type=”info” align=”aligncenter” ]Pour aller au cœur du “rangement” chez Google. Je vous conseille l’excellent article de Christian Méline sur le corpus et le référencement on-page. Cela vous aidera à comprendre la suite de ma réflexion.[/box]

Les Tests Classiques et Actuels

Lorsque nous voulons savoir si tel ou tel facteur est pris en compte par un moteur, nous effectuons généralement des batteries de tests et/ou des recherches sur internet. Pour ce qui est des tests, nous avons souvent le choix entre plusieurs environnements et méthodes :

  • Le test grandeur nature, qui n’est ni plus ni moins qu’un site classique que l’on étudie.
  • Le test simple, qui est un ensemble de matrices avec des facteurs modifiés dans tous les sens.
  • Le test Lorem, qui contient en majorité du latin en guise de contenu.
  • Le test de temps en temps, qui s’effectue… de temps en temps.
  • Etc.

Bref, là où je veux en venir, c’est qu’il y a des tonnes de manières de produire des tests plus ou moins pertinents. Tout dépend de nos compétences, de ce que l’on veut observer, de quels moyens nous disposons, etc.

Mais ce que je trouve dommage, c’est surtout qu’on se retrouve souvent avec des études dont on ne connaît pas le procédé. Clairement, on ne peut pas savoir si l’environnement de test fut neutre et fiable lors de l’observation. En d’autres termes, nous ne pouvons pas savoir si le moteur était purement objectif lors du choix des positions de nos pages.

Prenons un exemple, si je prends le cas du test de la densité tolérée d’un mot-clé au sein d’un texte. Certaines personnes (je suppose) tenteraient de faire plusieurs pages avec du contenu latin, mettraient un mot-clé quelconque au sein de la page un nombre X de fois, puis en observeraient les résultats.

Mais techniquement, aujourd’hui, qui nous dit que la densité tolérée n’est pas calculés en fonction du titre + du nombre de mots + du contexte + de la fréquence de mise à jour + de X autres choses ? Qui nous dis que Panda n’est pas passé par là pour constater une qualité médiocre et nous pénaliser partiellement ?

En clair, qui nous dit que tout facteur n’est pas lié à un autre facteur engendrant ainsi un meilleur résultat (ou le contraire) telle une association ? Nous n’en savons rien (ou pas grand chose).

Et c’est ici pour moi que se trouve un problème. Les résultats ? Sont-il influencés dans les études par un environnement influencé ? Le moteur agit-il de manière objective quand il évalue nos pages de test ? Quel est l’environnement de test idéal ?

L’Environnement Idéal

Maintenant, j’aimerais rentrer dans le cœur de cette réflexion. Par contre, je ne suis pas certain à 100 % d’avoir retranscris le message que je voudrais faire passer, donc posez moi des questions pour davantage de précisions.

Donc, je pourrais vous débouler ma petite liste sur ce qu’est pour moi un environnement idéal de test, mais je vais me contenter de vous dire les grandes lignes. Vous allez d’ailleurs pouvoir comprendre pourquoi je vous ai parlé du fonctionnement de Google et plus précisément du processus d’indexation.

L’environnement neutre et idéal pour moi, c’est déjà d’avoir un hébergement simple et bien configuré. Même pas besoin d’une grosse bécane ou d’une base de données, je ne veux même pas me préoccuper des performances : un robots.txt, un sitemap, des fichiers plats en HTML, et c’est parti.

Ensuite, pour le choix du nom de domaine, je choisis d’en prendre un qui n’a pas d’historique et qui n’existe pas. En fait, ce nom sera celui d’un objet que je vais définir juste après. A noter que j’évite l’inclusion de mots existants car je ne dois pas pouvoir trouver le site avec des mots ou syllabes existantes. Je prends donc pour l’exemple un truc du style jfnsprmtfj.com.

Ainsi,  je peux commencer la création de mon objet, partie difficile puisque je dois faire comprendre au maximum à Google que ce que je vais lui montrer est un objet qui n’existe pas et qui est nouveau pour lui. En clair, j’invente un truc qui vient de je ne sais où pour créer un maximum de flou chez Google et pour le forcer à plus ou moins créer un nouveau corpus, une thématique… (Appelez cela comme vous le voulez).

Ainsi, pour le test, cela aura pour conséquence de n’avoir aucun rapport/lien avec un corpus existant, ce qui est beaucoup plus neutre et fiable puisque le moteur ne pourra même pas contrôler si mes infos sont correctes. Le site sera alors considéré comme “pur”, se trouvera paumé, et je me rapprocherai (si mes réflexions sont bonnes) de la véritable évaluation de mes pages de test par l’algorithme.

 

Si je reprends mon exemple, la création de l’objet ferait donc un peu comme en programmation :

  • Nom : jfnsprmtfj
  • Type : hqsldlzm
  • Création : 12 mars 2013
  • Couleur : Noir et blanc
  • Hauteur : 12 cm
  • Largeur : 3 cm
  • Thématique : jshuekdpmgf
  • Créateur : hdyrjspozm
  • Etc…

Et une fois défini, il ne me restera plus qu’à créer des matrices en HTML5. Je ne me prends pas la tête plus que ça avec du CSS ou autre, car je vais au plus simple, il faut éviter les perturbations.

Et maintenant peuvent commencer les tests. On peut faire ce que l’on veut tant qu’on n’est pas suspecté d’être un spammeur, testeur ou autre. Google doit interpréter les pages comme un site internet classique qui vient de faire une communauté ou présentation sur un objet bidon. Il nous faut donc une base équilibrée et viable (beaucoup plus facile à dire qu’a faire).

En résumé, pour un (début) d’environnement comme celui-ci, vous devez :

  • Posséder une base technique simple et stable sans problème
  • Créer un objet qui n’existe pas
  • Faire du contenu inventé et persuasif en rapport avec l’objet
  • Chercher le ou les facteurs qui vous intéressent
  • Déceler les possibles associations entre facteurs
  • Mettre en place des pages de test différentes avec un repère
  • Vous poser les bonnes questions
  • Faire évoluer l’environnement au maximum
  • Et surtout, être dans votre propre bulle

Vous vous en doutez, tout cela reste un exercice relativement difficile et long et c’est sans parler du coût énorme que cela vous demanderait. Je vous encourage donc à éviter un tel projet, surtout qu’on pourrait aller encore plus loin en créant par exemple plusieurs sites à côté.

Conclusion

Tout cela reste vraiment qu’une réflexion et faire un environnement exagérément neutre serait du travail. De plus, l’environnement de test idéal est quelque chose d’assez expérimental et le sujet est large et nébuleux.

Je vous conseille donc de continuer à lire les tests de tout un chacun, mais surtout de prendre les résultats comme des avis, et non pas comme des faits ou vérités, surtout par le fait que vous ne connaissez rien de la personne en face de vous.

En tout cas, pour finir, je pense que la pratique grandeur nature est de loin la meilleure des solutions pour déceler les critères viables en référencement. Le web change tellement vite que le moyen le plus intéressant reste de s’entrainer sur des sites classiques visibles des internautes.

Sur ce, je vous souhaite à tous de merveilleuses conférences au SEO Camp’Us Paris 2014, en espérant vous retrouver prochainement sur la toile. N’hésitez pas à me faire des retours sur cet article et à le partager !

Commentaires (4)

  • Sylvain Richard

    Très bien cet article !

    En fait, pour avoir fait des tests dans tous les sens, je me dis que l’environnement idéal n’existe pas :-)

    Un site tout neuf ne sera pas adapté pour mettre en œuvre ensuite sur un site qui a de la bouteille, et de toute façon il ne le reste pas.

    En revanche, il est utile que les résultats permettent de voir (ou expliquent) ce qu’était l’environnement et le protocole de test.

    Mais ta méthode reste très bonne pour tester certaines choses sans “pollution” .

    12 mars 2014 at 17 h 20 min
  • Christian Méline

    merci pour la citation Thomas :-)

    Un bon test se fait avec un vrai volume de données (mesure espacées ans le temps, nombre de sites, tailles de site différentes, etc.) et qui soit représentatif d’une population plus grande, pour cela, il faut que ton biais soit faible.
    Cela demande des moyens énormes du coup…

    Si tu veux diminuer une partie des erreurs (entre échantillon et population), une des solutions est de faire tes tests sur une thématique qui est elle-même petite en taille…

    Mais je n’ai rien dit ;-)

    12 mars 2014 at 17 h 36 min
  • Thomas Cubel

    @Sylvain Richard : Merci pour ton commentaire !

    Tu fais bien de te dire que l’environnement idéal n’existe pas, car de toute façon, ça serait un travail monstre et une perte de temps de concevoir un truc pareil qui changerait et s’éclaircirait avec le temps.

    Chaque site est plus ou moins unique de toute façon, comme chaque thématique, etc. Je pourrais même prendre ton test de cette semaine avec le contenu de qualité. Sur ton site, ça marche, sur le mien, pas besoin de tenter pour savoir que non. Et pourtant, ça ne veux pas dire qu’on doit faire comme toi ^^

    Bref, merci pour ton retour, c’est vraiment sympa ! Et bonne continuation !

    @Christian Méline : De rien Christian, avec plaisir ! Merci pour ton commentaire par ailleurs. C’est très intéressant ce que tu dis là, c’est super de voir comment chacun ferait, c’est très enrichissant.

    Pour revenir sur ton explication, c’est bien du lourd que tu proposes. Mais avec tous les changements de poids des critères, les filtres et le temps que ça prendrais, etc… je ne sais pas si ça en vaut le coup de manière générale. C’est à essayer :)

    Merci en tout cas et bonne continuation !

    12 mars 2014 at 17 h 57 min
  • Pullseo

    Un article intéressant mais il est vrai que les tests ne doivent pas être pris au pied de la lettre, quoi qu’il arrive. En effet, il y a trop de paramètres à prendre en compte, et je ne parle ici que de ceux que nous connaissons ou entrevoyons, même pas des ceux que nous ne connaissons pas.

    Parce que, en fin de compte, cette “pollution” évoquée plus haut ne fait-elle par partie des critères ? Les sites ne sont pas que analysés pour ce qu’ils sont, mais aussi comparés les uns par rapport aux autres.

    Bref, j’y vais de mon petit commentaire mais je rejoins ce que disent Sylvain et Christian :
    – L’environnement idéal n’existe pas
    – Les “bons” tests demandent des moyens énormes

    Cependant, on ne peut faire autrement que de mener des expérimentations avec les moyens disponibles.

    JYG

    31 mars 2014 at 14 h 43 min

Commentaires fermés.