Google Caffeine ou l'indexation en ''Real Time''
Google passe à l'indexation en temps réel...

L'algorithme de Google répondant au nom de code déjà bien connu de "Caffeine", délivre depuis cette semaine des résultats de recherche prenant en compte les sites mis à jour après seulement quelques minutes.
Jusqu'a présent, Google n'effectuait la mise à jour de son index qu'une fois par mois et s'employait à parcourir qu'une partie de la toile, puis indexait les nouveaux éléments selectionnés.
Comme Google l'avait d'ailleurs annoncé lors du Search Marketing Expo de Seattle, avec l'algorithme "Caffeine" mis en place cette semaine, le moteur de recherche de Google indexe immédiatement les informations mises à jour à mesure que ses robots explorent la toile.
On peut dors et déjà constater sur les SERPs (Search Engine Results Page ou Page de résultats d'un moteur de recherche) que le moteur de Google affiche des modifications quasi instantannées. Pour preuve, le blog i4u.com vient de mettre à l'épreuve l'indexation de l'algorithme de Google, en incluant dans le titre d'un post un keyword assez rare : Cyberreblaus.
Résultat, après seulement quelques minutes, le titre contenant le keyword en question ainsi testé est apparu dans les SERPs de Google.
Le "Real Time" fait belle et bien désormais partie intégrante du SERP de Google, ce qui est en soit, une excellente nouvelle, notamment pour les blogs, les sites ayant une actualités importante ou encore les sites e-commerce via les Feeds XML (Les flux XML permettent un contrôle sur la façon dont les informations ou les produits apparaissent dans les moteurs de recherche et comparateurs de prix).
Cette notion de "Real Time" est survenu à la suite des attentats du 11 septembre, incitant Google à offrir sur ses pages de résultats de recherche des mises à jour beaucoup plus réactive.
« Ce fut un véritable déclic qui nous a amenés à décider d'être très attentif à la fraîcheur des informations affichées. Nous le savions déjà auparavant, mais nous pensions que l'indexation faite tous les 30 jours était convenable » a déclaré le chef de l'équipe Web en charge de la lutte contre le spamming chez Google, Matt Cutts (Twitter).
Matt Cutts a effectué la semaine dernière une mini tournée européenne en donnant deux conférences à Paris et à Bruxelles.
« L'information inscrite dans les resultats de recherche de Google et indexée immédiatement avec Caffeine, et indiquera qu'elle a été mise à jour il y a quelques secondes » a également expliqué Matt Cutts.
Cependant, tous les ajouts ou modifications réalisés n'apparaîtront pas forcément immédiatement. « Google se base sur des critères comme le classement de la page (Page Rank) dans les résultats pour déterminer quels sites mettre à jour plus rapidement» et « Google parcourt également les sites d'information et de blogs plus souvent que d'autres» a ajouté Matt Cutts.
Google s'appuie également, et ce de plus en plus, sur de nouveaux outils déclaratifs "clients", pour savoir en "Real Time" à quel moment les sites sont mis à jour.