Sans que vous vous en rendiez compte, le machine learning fait partie intégrante de votre expérience utilisateur quand vous visitez des sites web. Par exemple, lorsque vous ajoutez un article dans votre panier d’achat et qu’on vous propose d’autres produits qui pourraient vous intéresser, c’est une application concrète de machine learning. De la même façon, lorsque votre plateforme de réseau social vous suggère de nouveaux contacts, elle ne fait qu’appliquer des résultats issus d’un algorithme d’apprentissage automatique. Mais l’application de cette technique ne se limite pas au web : les logiciels de reconnaissance optique de caractères ou de visages, les outils d’estimation des risques pour l’acceptation ou le refus d’un prêt bancaire, (…), sont des exemples d’utilisation du machine learning. Il s’agit de la possibilité pour une machine de traiter un nombre important de données et d’en déduire une règle. On peut rapidement entrevoir les possibilités que cela peut nous offrir en matière de SEO. D’ailleurs, je me suis « amusé » à réaliser un cas pratique pour tester l’utilisation d’un outil possédant un algorithme d’apprentissage automatisé afin d’améliorer le positionnement d’un site. Les premiers résultats sont plutôt encourageants. Mais, avant de détailler cet exemple concret, je pense qu’il est important de bien rappeler ce qu’est le machine learning et de le confronter aux problématiques SEO.

machine learning et SEO

Le machine learning ou apprentissage automatique : qu’est-ce que c’est ?

Aux premiers abords, la notion de machine learning peut paraître complexe, surtout si on n’évolue pas au quotidien dans le domaine de la programmation informatique. En fait, on va apprendre à la machine à penser toute seule, ou plutôt, à prévoir des comportements et à les retranscrire à l’utilisateur. Pour cela, on va l’alimenter en données d’apprentissage. Celles-ci peuvent être des exemples que la machine devra ensuite généraliser pour en déduire une règle. Ainsi, à partir de l’âge, des revenus, de la catégorie socio-professionnelle, (…), d’un individu, elle sera en mesure d’estimer s’il doit être considéré à risque ou non dans le cadre d’une demande de crédit. Dans ce premier cas, on parle d’apprentissage supervisé car on demande à la machine d’appliquer un modèle existant. Mais on peut également apprendre à la machine à déduire une règle à partir des données brutes et en l’absence même de modèle préexistant. Elle va alors déterminer des éléments communs à chacune de ces données et procéder automatiquement à leur classification et à leur traitement. C’est ce modèle d’apprentissage non supervisé qui est présent dans l’algorithme de Google. Dans ce cas, la machine va apprendre d’elle-même et va faire évoluer la règle au fur et à mesure de son expérience.

Quelle application possible en matière de SEO ?

Maintenant qu’on comprend mieux ce qu’est le machine learning, je vais vous montrer comment il peut être utile en matière de SEO. D’ailleurs, l’apprentissage automatique intervient déjà dans le référencement de vos sites internet. En effet, connaissez-vous RankBrain ? C’est un des critères utilisés par l’algorithme de Google. D’après Greg Corrado (lien en anglais), senior research scientist chez Google, c’est même devenu le 3ème critère en termes d’importance (bon faut pas non plus les croire sur parole… mais une chose est sûre ce critère va prendre de l’ampleur). Or il s’agit purement et simplement d’un algorithme d’apprentissage automatique.

Lorsqu’un internaute tape une requête complexe que le moteur de recherche a du mal à comprendre, RankBrain va lui permettre de deviner sa signification et de lever certaines ambiguïtés. Comment ? En appliquant l’apprentissage non supervisé : les mots sont des vecteurs que la machine va associer à d’autres vecteurs en fonction de leur affinité sémantique. C’est ainsi que le moteur saura que la requête qui contient le mot « jaguar » porte sur l’animal ou sur la voiture. C’est pourquoi dorénavant l’optimisation d’une page d’un site doit automatiquement inclure un travail sur l’univers sémantique.
Mais le machine learning peut aussi être utilisé par les référenceurs comme l’a montré Julien Deneuville dans sa présentation lors du SEO Camp’US Paris. C’est d’ailleurs, en regardant les slides de son intervention, que j’ai eu l’idée de parler sur le blog de l’étude de cas concrète que j’ai réalisé sur un site pour étudier une des applications du machine learning en matière d’optimisation on-site. En effet, les algorithmes d’apprentissage automatique sont présents dans des outils tels que Gephi et leur permettent de traiter rapidement un nombre important de données et de retranscrire les résultats de façon pertinente afin de nous aider à prendre les bonnes décisions quant au linking interne, l’organisation des pages, etc.

Un exemple concret d’utilisation de machine learning sur un site : optimiser le maillage interne

Dans l’exemple que je vais détailler ci-dessous, je me suis servi des possibilités offertes par le machine learning pour analyser les données d’un site afin de retravailler son architecture et son maillage interne.
Je suis parti volontairement d’un petit site pour rendre mon expérience plus lisible et plus pédagogique. Mais elle est également valable pour un gros site.
Voici les infos nécessaires pour planter le décor : Le site est un Wordpress en ligne depuis un an et le webmaster l’avait réalisé en pensant une architecture en silo. Il dispose de 43 pages de contenu statiques et non réactualisées (le site n’a pas de blog). Enfin, il compte 46 domaines référents et aucune action de netlinking n’était en cours.
J’ai collecté l’ensemble des données du site à l’aide de Screaming Frog (la liste des pages et la liste des liens internes… Je vous passe les détails techniques, ce n’est pas le but de l’article). J’ai ensuite utilisé Gephi qui, grâce à son algorithme d’apprentissage automatique, a pu classer les pages, détecter tous les liens entre les pages et déterminer celles qui recevaient le plus de jus (le PageRank interne. Et non le PageRank n’est pas mort).

Voici la première carte que j’ai obtenue :

cartographie linking interne avec Gephi

Il en ressort un maillage interne complexe, trop de liens, des pages secondaires qui recevaient trop de jus par rapport aux pages principales, etc. Mais on aperçoit tout de même l’envie de bien faire du webmaster qui a tenté de regrouper ses pages par thématique (silo). Je ne parle pas de cocon sémantique, mais bien de silo dans le cas de ce site. La différence entre le silo thématique et le cocon sémantique est expliquée ici. J’ai alors décidé de réorganiser le menu ainsi que les liens présents dans le footer. J’ai également créé une sidebar personnalisée afin de mieux catégoriser les pages par silos. J’ai ensuite de nouveau collecté les données (screaming Frog) et les ai transmises à Gephi.

Voici la seconde carte que j’ai obtenue :

Visualiser son maillage interne avec Gephi

Le résultat est meilleur mais n’est pas encore totalement satisfaisant. Je décide donc de réduire les liens entre les différents silos afin d’augmenter leur étanchéité et de repousser les pages non pertinentes (comme les mentions légales, la page de contact).

Voici la troisième carte que j’ai obtenue :

améliorer son maillage interne

Le résultat me plait plus et je décide d’attendre quelques jours pour voir l’impact sur le positionnement du site. Pour cela, j’utilise Yooda Insight pour avoir une vision du site sur le long terme. Pour ceux qui ne connaissent pas cet outil, Yooda ne montre que les mots-clés pour lesquels le site apparaît sur la première page de résultat de Google. Il donne un bon aperçu de la visibilité globale d’un site.

On constate, durant la première année, une montée progressive du site jusqu’à atteindre 129 mots-clés en première page le 9 mars 2016. C’est ce jour-là que je mets en place la nouvelle architecture du site. On voit une certaine stabilité du site les jours qui suivent, le temps que Google digère les modifications. Puis, passé ce laps de temps, une augmentation rapide et significative du nombre de mots-clés en première page : 152 le 13 avril 2016. A la date de parution de ce billet soit le 27 avril le site est monté encore (156 mots clés)

suivi de positions
Je pensais mettre à jour régulièrement cet article pour suivre l’évolution des positions, mais ce ne sera pas possible puisque le site va subir désormais d’autres actions pour améliorer encore sa visibilité. Les résultats seront donc faussés. Mais je suis déjà très satisfait de ce que j’entrevois. Les chiffres parlent d’eux-mêmes : il est temps de saisir les opportunités offertes par le machine learning !

Mise à jour au 04 juillet 2016 : 

La courbe continue de grimper de manière importante puisqu’au dernier pointage 152 mots clés étaient positionnés en première page Google. Le dernier passage de Yodainsight au 1er Juillet 2016 affiche 331 mots clés. Soit plus de 100% d’augmentation ! Je vous laisse juger par vous même dans la capture ci-dessous :

résultat d'un bon maillage interne

Quelques précisions importantes : Aucun contenu n’a été ajouté sur le site, il conserve le même nombre de page. Ce sont des contenus statiques avec quelques liens d’affiliation ou adsense. A ce jour les 331 mots clés sont positionnés sur 24 pages (de mémoire c’était 22 pages au 13 avril). Aucune action de netlinking n’a été menée sur cette période. Voila qui est plutôt encourageant non ? 😉

Les commentaires sont ouverts pour ceux qui souhaitent partager des expériences similaires ou pour les sceptiques 🙂 Si vous souhaitez améliorer la visibilité de votre site n’hésitez pas à me contacter.

Le machine learning au service du référencement naturel
5 (100%) 2 votes