Navigation

Toutes les catégories

Filtrer par auteur

Voir les derniers articles

Twitter se détache du langage SQL

C’est une bien drôle de nouvelle que vient d’annoncer Ryan King, ingénieur de Twitter. En effet, Twitter est en pleine migration de ses bases de données MySQL vers le...

Publié par Team WebActus

Logo de TwitterC’est une bien drôle de nouvelle que vient d’annoncer Ryan King, ingénieur de Twitter. En effet, Twitter est en pleine migration de ses bases de données MySQL vers le système cassandra. Ce dernier a la particularité de ne pas utiliser le langage SQL et son intérêt principal est de gérer de grandes quantités de données distribuées, à la manière d’un cluster de serveurs. Ce qui s’adapte complétement à l’architecture du réseau social de microblogging.

Alors oui vous avez bien compris, Twitter change radicalement sa méthode d’accès aux données. En effet, Ryan King explique que MySQL coûtait cher à Twitter : « Mais celui-ci finissait par coûter horriblement cher en main-d’œuvre. Nous avions besoin d’un système qui puisse rapidement monter en charge, tout en restant hautement disponible et sans nécessiter autant d’interventions humaines ». Du coup Twitter est parti à la recherche d’un système performant qui lui coûterait moins cher à maintenir.

Twitter  a donc tester les solutions comme HBase, Voldemort, MongoDB, MemcacheDB, Redis, Hypertable et Cassandra. C’est cette solution qui a été retenu après un test grandeur nature sur 100 To de données et 150 machines ce qui a séduit Twitter. Ryan explique ce choix en trois raisons majeurs :

  • Cassandra n’a pas de « point individuel de défaillance »
  • elle monte rapidement en charge en écriture : idéal pour l’augmentation des tweets
  • la communauté open source qui gravite autour de cette base est riche et productive

Le projet Cassandra a été récupéré par Apache qui vient de le propulser dans les projets les plus urgents. Il a été créer par Facebook qui l’a ouvert au monde de l’open source en 1998 2008. Ce que Ryan King ne précise pas c’est que ce système ne dispose pas de système de restauration, encore moins de migration. Cependant normalement ce système n’a pas besoin d’être implémenté puisque Cassandra est capable de répliquer les données sur différents nodes pour ainsi les reconstruire en cas de pertes (un peu comme le système RAID5).

Cassandra peut paraître comme un projet en développement mais il est adopté par de grands noms. On retrouve entre autre Facebook, Digg et plus récemment Twitter. Le projet est encore en cours d’amélioration mais semble assez stable et assez bien documenté pour être mis en place en production. Personnellement je ne connaissais pas du tout ce projet.

Twitter devrait donc entrer dans une phase de migration de ses bases de données et doit commencer par la table la plus importante, celle des statuts. Nous verrons si ce système améliore la continuité de service puisque PingDom estime que Twitter a été indisponible pendant 23 heures et 45 minutes en 2009.

Source : 01net Pro

Newsletter WebActus

Abonnez-vous pour recevoir notre sélection des meilleurs articles directement dans votre boîte mail.

Nous ne partagerons pas votre adresse e-mail.

Articles similaires

Webmarketing

Inbound marketing  : externaliser ou internaliser sa stratégie  ?

Depuis ces dernières années, on observe une importante évolution et l’augmentation du type de stratégies marketing. C’est d’ailleurs le cas de l’inbound marketing qui en ce moment...

Publié le par Elodie
Webmarketing

Facebook sous surveillance renforcée pour les 20 prochaines années ?

L’accord entre la FTC et Facebook sera bientôt dévoilé. La commission devrait renforcer sa surveillance du réseau social, durant les 20 prochaines...

Publié le par Thomas Coeffe