Moteurs de recherche et SEO : genèse d’un mariage forcé !

SEO, histoire d’un métier né des entrailles du web et de plus en plus algorithmo-dépendant !

Le web qui bouleverse nos vies, nos usages, en s’appropriant une part exponentielle de l’économie, compterait actuellement environ (difficile de dire précisément) 1000 milliards de pages ! Pour en arriver là, il doit être loin ce temps où s’est affichée la première page internet sur un écran ! Que faisiez-vous le 13 novembre 1990 ? Pas sûr que ce soit l’apparition de cette première page web qui ait marqué nos mémoires ce jour-là… Et pourtant !

25 ans plus loin, le web représente un enjeu économique mondial et rendre son site web visible sur les moteurs de recherche est un passage obligé pour toute personne ou entreprise qui souhaite renforcer sa notoriété, générer des contacts ou vendre sur Internet. Or, dans ce monde immense, cette visibilité indispensable n’est pas automatique ! Elle relève d’une conscience stratégique de plus en plus pointue. Un métier original, communément appelé « SEO », s’est donc forgé au fil de cette croissance exponentielle et des évolutions technologiques qui l’ont accompagnée. Voici son histoire…

Petite histoire du référencement naturel

Qu’est-ce que le « référencement naturel » ?

Pour commencer cette histoire, il faut comprendre en quoi consiste ce métier. En effet, c’est sa nature-même qui dessine son histoire. Concrètement, le SEO fait en sorte d’optimiser la visibilité des sites internet en leur permettant de se positionner au mieux dans les résultats des moteurs de recherche. Cette action se nomme communément « le référencement ». Il consiste à mettre en œuvre diverses techniques visant à rendre un site « seo-friendly ». SEO pour : Search Engine Optimization (Optimisation pour le Moteur de Recherche). Pour illustrer ce qu’est le SEO, une infographie « Le référencement en une image » permet de résumer la mise en œuvre des techniques liées à ce métier. Google lui-même propose un guide d’optimisation pour les moteurs de recherche.

Le terme « référencement » se doit aussi d’être expliqué. Il se décompose en effet en 2 phases :

  • L’indexation : consiste à faire connaître l’existence d’une page web à un moteur. Celui-ci l’indexera dans sa base de données. Cela n’implique pas pour autant qu’il la proposera dans ses résultats. Mais cette étape est incontournable pour passer à la seconde phase.
  • Le positionnement : indispensable pour obtenir une véritable visibilité. Cette phase nécessite d’optimiser une page, ou de renforcer sa popularité, pour qu’un moteur la juge suffisamment pertinente pour l’afficher (en bonne place) lors d’une recherche effectuée par un internaute.

Le SEO, intimement lié à la naissance des moteurs de recherche

On le voit sur cette infographie, le métier de SEO est directement lié à la naissance des moteurs de recherche, eux-mêmes émanation directe de la croissance d’Internet.

Avant l’apparition des moteurs de recherche, les quelques sites web existants furent classés dans des annuaires1. Un travail réalisé par des humains et qui promettait de devenir fastidieux lorsque le nombre de sites commença à s’accroître. Les moteurs de recherche tels que nous les connaissons aujourd’hui s’affranchissent de cette action manuelle grâce à des « crawlers2 » qui explorent le web en suivant les liens hypertexte d’un site à l’autre.

Au cours des 3 ou 4 premières années de navigation de liens en liens, au sein d’un réseau d’à peine quelques milliers de sites,  les moteurs de recherche étaient plus utiles à l’internaute en quête d’informations, qu’en termes de visibilité stratégique pour les sites. Dès lors, cela ne justifiaient pas encore pleinement de recourir à des stratégies de positionnement. A peine peut-on observer quelques initiatives individuelles de quelques amateurs curieux et enthousiastes pour tester les réactions de ce monde étrange !

Mais le numérique a comme marqueur génétique une accélération fulgurante à l’instar du « Boson de Higgs » au cœur de son accélérateur de particules ! Aussi, lorsqu’en 1997 le nombre de sites web dépasse le million… la donne change ! Surtout avec l’apparition d’un nouvel entrant, visionnaire à l’époque pour avoir parfaitement compris les enjeux économiques liés à l’organisation de l’information. Au point d’en avoir fait cet ambitieux slogan : « organiser les informations à l’échelle mondiale dans le but de les rendre accessibles et utiles à tous » ! En s’appuyant sur cette mission, Google va bouleverser la recherche sur internet. Pour donner à son moteur la crédibilité et l’efficacité nécessaires lui permettant de briguer le leadership sur ses concurrents, il inventera le PageRank, la « petite barre verte » qui s’affiche sur les navigateurs et va faire fantasmer toute une première génération de référenceurs !

En effet, les résultats de recherche servis par ce nouveau moteur ne sont pas une simple cascade de liens indexés comme l’avait fait les premiers moteurs apparus dans le paysage internet. Les deux étudiants à l’origine de Google, Larry Page et Sergey Brin, revendiquent un classement de pertinence, à l’origine basé sur le nombre de fois où les termes faisant l’objet de recherche apparaissent dans les pages du Web. Pour affiner le processus, ils développent donc un système d’algorithme, le « PageRank ». pagerankL’algorithme permet d’attribuer une pondération numérique sur le principe qu’un site faisant un lien vers un autre site lui accorde un « vote ». Les sites obtenant le plus de liens, donc de votes, se classent mieux. La notation de 0 à 10 conditionne la longueur de la petite barre verte, ressentie comme indicateur de notoriété d’une part, mais aussi comme la promesse de voir son site courtisé par les référenceurs en quêtes de liens hypertextes puissants aux yeux de Google.

Cette logique de pertinence appuyée sur le nombre, va nourrir un cercle vertueux (ou pas…) qui va contribuer à la croissance exponentielle du web, susciter des appétits et/ou des vocations pour faire émerger des sites cette multitude ! Le métier de référenceur en tant que tel était né !

D’autant que Google se distingue également de ses ainés avec le design ultra-minimaliste de son unique page web. Ce look « épuré » va d’ailleurs devenir une philosophie sur le web. Jusque-là, les sites qui souhaitaient attirer l’attention du visiteur, autant que montrer un savoir-faire technologique, arboraient des bannières flash et des scintillements divers et variés dont le poids d’affichage n’avait rien à envier à un certain manque de finesse graphique ! Sous l’influence de Google, distinguer son site web prend une autre direction : les résultats de recherches servis par le moteur de recherche. On est en 1998, le web compte plus d’un million de sites, et le métier de SEO prend véritablement son envol !

Evolution des techniques de référencement

Avant Google, les moteurs suivaient les liens et indexaient au fur et à mesure le contenu des pages. Les contenus en quantité faisaient référence pour leur classement. Les prémisses du travail de référencement consistaient donc essentiellement à générer des contenus. Très vite des abus ont vu le jour, comme par exemple insérer des textes blancs sur fond blanc bourrés de mots-clés destinés aux moteurs et que l’internaute ne devait pas voir !

Avec Google, son PageRank et surtout la notoriété que le moteur acquiert très vite3, de telles techniques « rudimentaires » de référencement doivent s’élaborer. Elles tournent alors autour de l’obtention d’un maximum de liens (puisque considérés comme des plébiscites par le moteur). Autre levier de positionnement retenu par les algorithmes du moteur et que le SEO doit prendre en compte : les « ancres » des liens, c’est à dire le texte sur lequel sont faits les liens. Les mots qu’ils contiennent impactent en effet directement le positionnement de la page vers laquelle le lien est fait.

Les référenceurs tirent rapidement parti de cette possibilité en tentant d’obtenir des liens de manière pas très naturelle : inscription à outrance dans les annuaires de sites, création de réseaux de sites destinés à faire des liens, spam de blogs pour insérer des liens en signature, etc.

Mais depuis 2011 le moteur, souhaitant préserver la pertinence de ses résultats de recherche et celle du marché publicitaire qui l’accompagne, riposte. Il lâche sur le web une petite ménagerie algorithmique, d’abord avec le filtre Panda, puis en 2012 avec le filtre Pingouin. Avec cette évolution marquante de ses algorithmes, Google limite considérablement les  impacts des techniques de référencement agressif. Destinés à filtrer les contenus de mauvaise qualité ou les liens artificiels, ces filtres arrivent aujourd’hui a refréner les ambitions des référenceurs qui tiraient sur la corde (black hat). Intégrés à l’algorithme ou lancés de manière régulière, ces filtres pénalisent automatiquement les sites utilisant des techniques conçues pour manipuler son index et que Google juge inacceptables. On trouvera ici la longue liste des mises à jour (updates) de google depuis 2000.

Dès lors, qu’ils aient ou non utilisé des techniques agressives, les professionnels du SEO voient de nouveau leur métier évoluer. Ils doivent se rapprocher davantage de la logique qui prévaut à Mountain View, portée par les propos d’Éric Schmidt : « Google Search est construit pour les internautes, pas pour les sites ». Autrement dit, ils doivent s’attardent beaucoup plus sur la façon de produire des contenus de qualité, utiles pour l’internaute.

Ils se sensibilisent également aux nouveaux critères retenus par Google, comme récemment une prime de visibilité aux sites légers, rapides, ou encore « mobile friendly », facilitant le search sur smartphones (exemple du site CIGREF). Désormais ces critères impriment également les stratégies des référenceurs forçant le métier à une évolution en temps réel.

histoire-moteurs-recherchePetite histoire des moteurs de recherche

Sans vouloir être exhaustif, cet aperçu de l’histoire des moteurs de recherche, repérés selon leur date de création dans le paysage internet ou selon leur spécificité, permet de contextualiser le métier de SEO. On remarque que l’aube du web voit s’implanter sur ce nouveau territoire en pleine croissance une multitude d’outils destinés au classement et à la recherche de sites. Même si le web poursuit une croissance exponentielle, après 1998 et l’entrée de Google sur ce marché, on constate un net ralentissement de l’émergence de nouveaux entrants.

1990, Archie, l’embryon à l’origine des moteurs de recherche
Archie est un logiciel conçu en 1990 par Adam Emtage, étudiant de l’université Mc Gill au Québec. Ce logiciel contient les principes de base des futurs moteurs de recherche. Il repose sur une base de données qu’il fait correspondre aux requêtes de l’utilisateur. Pour les connaisseurs, la recherche avec Archie s’effectuait avec la commande Unix « grep ».

1993, Wanderer
Wanderer (le vagabond), est un moteur conçu par Matthew Gray. Il est le premier à crawler le web avec des robots d’indexation. Bien qu’internet ne comptabilise guère plus de 500 sites actifs, il ouvre la voie à une déferlante de spiders qui commencent à scruter les contenus qui s’implantent sur le web.

1994, WebCrawler et Yahoo
Brian Pinkerton, étudiant en informatique à l’Université de Washington, met au point Webcrawler. Au départ, simple application de bureau, il s’émancipe en avril 94 pour devenir un moteur capable d’analyser le contenu complet des pages web. En novembre de la même année, il atteint le million de requêtes. Webcrawler a été le premier moteur à indexer le texte intégral des pages visitées. Il sera racheté en 1995 par AOL (America Online).
Yahoo n’est pas à proprement parler un moteur de recherche, mais un annuaire constitué par des humains. Il propose une longue liste de sites Web, également catalogués en un réseau de répertoires régionaux. Yahoo a également utilisé les services de moteur de recherche, nouant des partenariats avec Inktomi et plus tard avec Google. En combinant divers outils, il dispose de son propre index de recherche.

1995, Lycos et Excite
Cette année voit l’arrivée de deux outils, Lycos, qui fut le premier moteur capable de proposer des résultats, mais en se basant exclusivement sur le titre des pages web.
Né en parallèle, Excite est un projet universitaire qui voit le jour en 1993. Au départ, pas encore moteur de recherche, il vise à analyser les relations entre les mots pour améliorer la pertinence de la recherche sur internet. Il prend son envol en tant que moteur de recherche en 1995.

1996, AltaVista et Inktomi
Le 18 décembre 1995, des chercheurs de l’entreprise informatique Digital Equipment Corporation (dont le Français Louis Monnier), livrent le moteur de recherche AltaVista. Le nom « AltaVista » est emprunté à une expression espagnole qui veut dire « vue d’en haut ». Rapide,  il offre de nombreuses fonctionnalités de recherche, dont notamment un choix par langues.
Le moteur de recherche Inktomi Search Engine est né du besoin des chercheurs Eric Brewer et Paul Gauthier de montrer la validité de leurs technologies réservées à de très grandes entreprises ou organisations. Alors que les autres moteurs s’orientent de préférence vers des prestations de portails grand public, tirant leurs ressources de la publicité, Inktomi se spécialise dans la recherche internet pour les entreprises. Il reçoit ses requêtes d’autres outils comme Hotbot, Lycos, GoTo…

1997, Yandex
Yandex est un moteur de recherche qui nait à Moscou en 1997, à l’initiative Arkadi Voloj. Il est très populaire en Russie où il est actuellement privilégié à Google.

1998, Google
Google fait son entrée sur internet le 27 septembre 98. Au premier regard, il se distingue de ses ainés grâce au design ultra-minimaliste de son unique page. Ce look « épuré » va d’ailleurs devenir une philosophie sur le web. On va voir peu à peu se réduire le nombre de bannières flash et les scintillements divers et variés qui souhaitaient attiré l’attention du visiteur autant que montrer un savoir-faire technologique. Voici comment Google présentait le fonctionnement d’une recherche en 2010 :

1999, Fast
La réussite de Google inspire des chercheurs de l’université d’Oslo créent Fast Search & Transfer. En 1999, Fast se positionne comme Inktomi, sur le secteur des entreprises. Rapide au point de titiller Google, ses algorithmes supportent 46 langues différentes. En 2000, FAST Site Search™ sera incorporé avec succès chez IBM pour indexer la totalité de ses pages dans le monde.

2000, Baidu
Baidu, moteur de recherche chinois, dont le nom signifie « Cent degrés », est né en janvier 2000 à Beijing. Il devient très vite leader par sa technologie qui lui permet des recherches en mandarin. D’ailleurs, pour se positionner face à Google, il se détermine ainsi : « Baidu connaît mieux le chinois ».

2006, Exalead
Exalead s’ouvre au grand public en tant que moteur de recherche en octobre 2006. Il avait fait ses premiers pas comme solution logicielle ayant pour objectif de servir de l’information métier pour les entreprises. Moteur français, dès 2007, il propose d’inclure ou non de la recherche les blogs ou les forums. En 2008, il reçoit le prix AFDEL comme éditeur logiciel ayant eu la plus forte croissance.

2009, Bing
Bing arrive sur le marché des moteurs de recherche en juin 2009. Il s’intègre dans une stratégie de Microsoft pour concurrencer l’hégémonie de Google. Bing s’inscrit dans le prolongement de Live Search et MSN Search. Il intègre de nouvelles fonctionnalités comme des comparateurs de prix.

2013, Qwant
Qwant voit le jour 4 juillet 2013. Moteur de recherche européen, il revendique d’une part de préserver la vie privée des internautes en ne traçant pas ses utilisateurs, d’autre part plus de neutralité que ses concurrents dans l’affichage des résultats de recherche. Selon sa devise « Tout le web sur une seule page Qwant », il affiche plusieurs types de résultats pour une seule requête : sites classiques, sites marchands, sites d’actualité, mais aussi réseaux sociaux.

Petite synthèse et « mise en prospective » du métier SEO…

On peut dire que le référencement aura longtemps été un « jeu du chat et de la souris » entre les moteurs et les référenceurs. Si celui-ci est certainement loin d’être terminé, les plus récentes mises à jour et filtres des moteurs ont sans doute ramené la plupart des SEO à utiliser et conseiller des techniques plus viables et durables.

Sur les basiques du SEO 2015

– Publier des pages qui répondent parfaitement aux besoins des internautes, sans chercher à manipuler les moteurs.
– Offrir aux visiteurs d’un site une expérience de navigation simple et fonctionnelle.
– Adapter les sites au format de l’appareil utilisé (smartphones, tablettes, ordinateur).
– Faire partager ses contenus au travers des réseaux sociaux.

Les plus du pro !

– Faciliter la compréhension et le crawl des moteurs avec une arborescence structurée, des pages légères et bien codées.
– Optimiser les aspects sémantiques des contenus.
– Proposer aux moteurs des pages optimisées techniquement (url, title, alt d’image, Hn,  microformat).
– Créer des contenus encourageant naturellement l’obtention de liens entrants.
– Utiliser les supports favorisant la recherche locale, si celle-ci est justifiée par l’activité du site.

Les acteurs de l’histoire du référencement

Même si le métier de SEO reste encore assez méconnu du grand public, il s’est très largement professionnalisé au fil des années. Certains de ses acteurs contribuent largement au partage des connaissances et techniques.

On pourra citer aux États-Unis :
– Dany Sullivan qui fonda en 1997 le site SearchEngineLand.com
– Rand Fishkin qui fonda en 2004, Le site SEOmoz, devenu depuis Moz.com

Ou en France :
– Olivier Andrieu (pape du SEO français) qui créa le site Abondance.com en 1998.
– Olivier Duffez qui lança en 2002 le site Webrankinfo.com et son forum d’aide aux webmasters
– Sylvain Richard qui publie des conseils SEO chaque semaine, inlassablement depuis 2008 sur le blog Axe-Net.

Quelques temps forts du référencement

– S’ils sont moins à la mode aujourd’hui, les concours de référencement ont longtemps été un moyen de tester des techniques et de se mesurer aux autres SEO.
– Les métiers du référencement se sont très largement professionnalisés et possèdent aujourd’hui leurs Salons ou événements (SMX, Teknseo, Seo camp, Webcampday, etc.)

Et le SEO bientôt…

Les plus grands bons en avant auxquels les référenceurs doivent s’attendre seront sans doute apportés par la recherche vocale qui risque de profondément modifier la manière dont l’internaute cherchera les réponses à ses questions.

________________________________

1 Les annuaires sont des listes de sites. Ils peuvent être généralistes ou thématiques.
2 Robots d’indexation, autrement dit logiciel qui explore le web pour permettre à un moteur de recherche d’en indexer le contenu.
3 Le moteur de recherche passe de 10.000 requêtes par jour dans sa phase de développement en septembre 1998, à 500.000 requêtes/jour dès février 1999 et en août 99, il franchit la barre des 3 millions de recherches quotidiennes.

Flashback sur 20 ans de référencement (en anglais)

Ligne

Catégories
21 Comments
  1. Laetitia

    Que de découvertes ! Merci ! On peut être internaute “presque” addict sans se rendre compte de l’ampleur de ce maillage ni de certaines interactions entre les outils, les métiers… Notamment le SEO est une vraie découverte ! On sait que ça existe, mais là on comprend !!!

  2. Nicolas Jean

    Avec ce billet, je découvre le référencement comme “métier en tant que tel”. Et j’avoue que ça a dû être particulièrement fun, dans les débuts, de chercher à comprendre le fonctionnement de ce nouveau monde, de tester ses réactions !

    Encore plus fun ensuite (pour de “petits humains”) de faire le bras de fer avec les algorithmes de Google, le symbole-même de la puissance internet !

    Maintenant c’est peut-être devenu plus technique et un peu “écrasant” mais ça doit être passionnant quand même.

    Merci pour cette belle histoire !

  3. Merci pour cet article qui a le double mérite de donner une vision de l’histoire du SEO et d’apporter cette vision avec des termes plutôt “accessibles”, y compris pour les lecteurs qui ne sont pas de la partie.

  4. Une histoire du référencement qui donne à voir d’où nous venons. Une démarche importante face aux nouvelles générations de référenceurs. D’ailleurs, ce travail me rappelle d’autres synthèses notamment sur les premiers référenceurs. Notre histoire est en train de s’écrire ! Merci à vous.

  5. Très beau récapitulatif. C’est vrai que depuis Google, le référencement se base essentiellement sur ce moteur. Les nouveaux entrants peinent à emerger. On notera l’apparition de Qwant qui ne trace pas l’internaute tout comme DuckDuckGo qui n’est pas mentionné ici. Aujourd’hui, j’ai l’impression qui si l’on veut concurrencer Google sur son territoire, il faut avoir une politique anti Google. L’internaute doit rester anonyme, neutre et ne pas être pisté. A part cela, depuis quelque temps, la qualité du contenu semble être plus qu’indispensable pour le référencement et tricher ne sert à rien(cela dessert même).

  6. Merci pour ce superbe et long article.

    Il est parfait comme introduction pour un cours de SEO
    les étudiants et les jeunes SEO apprécieront

    Je ne connaissais pas la signification du mot “baidu”

    Concernant la recherche vocal, l’avenir nous le dira 🙂

  7. Merci pour cet article complet et détaillé. Je connaissais Archie et les serveurs Wais ainsi que Gopher qui sont je crois toujours utilisables. Les vénérables ancêtres du protocole HTTP. Et effectivement la recherche vocale est un des prochains défis pour les référenceurs dont je fais modestement partie.

    • Loic

      Merci pour cette rétrospective très appréciable sur le métier du SEO et des moteurs de recherches. Un plaisir à lire et à relire pour les pros ainsi que les initiés !

  8. Bonjour,

    Un très bon sujet d’article.

    D’ailleurs, j’ai écrit un article sur le même sujet en Janvier 2015 sur mon blog (vous le trouverez facilement en cliquant sur mon nom). Je suis plutôt content d’avoir motivé (directement ou indirectement) d’autres personnes à le faire.

    Bonne journée,
    Thomas.D

    • Histoire CIGREF

      @Thomas : comme quoi les grands esprits… parce que nous ne connaissions pas votre publication !
      Comme vous l’aurez remarqué, notre site Histoire CIGREF aborde tous les angles de l’histoire de l’informatique, ses technologies et ses usages… Le sujet du SEO et les moteurs de recherche en font partie, sans qu’il soit besoin de motivation particulière ! 😉

  9. Maxime

    à Thomas

    Ça va les chevilles ? 🙂
    Pas tout à fait le même niveau comme article quand même.
    Et puis on ne te trouve pas dans les 3 premières pages de réponses de Google pour les recherches : histoire des moteurs de recherche, histoire du référencement, histoire du seo.

    Sais tu ce que l’on dit ? Qu’on peut cacher un cadavre au delà de la 3e page de résultats, personne n’y va jamais 🙂

  10. Olivier Duffez

    Au fait, vous indiquez au début que le web aurait 1000 milliards de pages.
    Même si c’est très difficile à évaluer en effet, la réalité est qu’il y en a vraiment beaucoup plus.
    D’ailleurs, dans l’infographie c’est indiqué comme étant la taille de l’index de Google, ce qui est différent de la taille du web.
    Et par exemple en 2012 déjà, Google annonçait un index de 30 000 milliards de documents : http://www.webrankinfo.com/dossiers/google-search/evolutions-aout-2012

    • Histoire CIGREF

      @ Olivier Duffez : Oui, comme nous l’indiquons en préalable, le web est très difficile à évaluer ! Mais quand on aime on ne compte pas… du moins pas au millimètre ! 😉
      En l’occurrence, il faut penser à distinguer les “pages” auxquelles doivent s’ajouter dans l’index Google les “documents” comme les images, les PDF, et tous les autres types de fichiers excel, etc.

  11. Belle synthèse. Savez vous que c’est en 1997, que le terme “Search Engine Optimization” SEO « optimisation pour les moteurs de recherche » a été utilisé pour la première fois. D’abord par John Audette et Bruce Clay, et peu de temps après le référencement devenait un terme largement utilisé.

0 Pings & Trackbacks

Laisser un commentaire