L’information a été divulguée par un employé de Google, Ben Darnell, dans une vidéo confidentielle qui a été supprimée depuis de Google Video. Dans cette vidéo, cet employé explique plusieurs informations sur les infrastructures qui se cachent derrière le lecteur RSS de la firme de Moutain View agrémentées de pas mal de chiffres :

  • deux tiers des flux RSS n’ont qu’un seul abonné Google Reader. Ces flux sont mis à jour tous les 3heures. En revanche plus il y a d’abonnés à un même flux et plus ce flux est mise à jour régulièrement : toutes les heures au maximum.
  • Google Reader est l’un des rares lecteurs RSS a conservé l’intégralité de l’historique de chaque flux.
  • Sa base de données représente plus de 10terabytes soit plus de 12500Go de données.
  • Cette base de données grossit de 4% toutes les semaines.
  • Google Reader surveille plus de 8 millions de flux RSS.
  • L’infrastructure de Google Reader est utilisé pour les flux par de nombreux autres services de Google : iGoogle, Orkut, les webclips deGmail, les widgets de Blogger, Google Spreadsheets ou encore l’API Ajax.
  • Le taux de croissance du nombre d’utilisateurs de Google Reader est égale au taux de croissance du nombre de flux dans la base.
  • 70% des utilisateurs de Google Reader utilise Firefox.
  • Google Reader n’a que 2 applications de Google qui génèrent plus de trafic que lui : Gmail et Orkut.
  • Seulement 6 employés travaillent sur Google Reader : 3 sur le Bakend et 3 autres sur le Frontend aidés d’un stagiaire.
  • La nouvelle fonctionnalité de recherche dans les flux demande beaucoup de ressources et Google Reader utilise deux indexs pour les recherches :
    • Un arbre géant mis à jour 2fois par jour (150 machines et 600millions de documents)
    • 40arbres plus petits pour les articles récents et mis à jour tous les 5minutes (40machines et 40millions de documents)
  • En ce qui concerne les évolutions de Google Reader :
    • Très prochainement : internalisation, la recommandation de flux RSS et accepter les pings envoyés à Google Blog Search.
    • Prochainement : possibilité de commenter les articles partagés et une organisation basée sur les liens (articles pointant vers une même page)
    • Possibilité de monétisation pour Google Reader : proposer aux auteurs des flux de partager de l’Adsense.

Il est vraiment très rare que des informations comme celles-ci parviennent à être rendues (brièvement) publiques. Les prochaines évolutions semblent vraiment prometteuses avec l’ajout d’un côté plus social et surtout la monétisation que beaucoup avait imaginé suite au rachat de Feedburner par Google.

Article trouvé et traduit sur un forum de Blogoscoped.com