Paxos

Publié le 19 novembre 2025 à 11h00. L’architecture du « cloud » est en pleine mutation, poussée par des impératifs économiques et des avancées technologiques, avec une séparation croissante des ressources de calcul, de stockage et de gestion des données.

Les architectures cloud traditionnelles, associant étroitement calcul et stockage, sont de plus en plus jugées inefficaces et rigides.
Les acteurs majeurs du secteur adoptent des architectures « désagrégées », permettant une plus grande flexibilité et une meilleure optimisation des coûts.
Les progrès des réseaux à haut débit, notamment l’accès direct à la mémoire à distance (RDMA) et le Compute Express Link (CXL), rendent cette évolution possible.

L’informatique en nuage (cloud computing) connaît une transformation architecturale majeure, motivée principalement par des considérations économiques, selon Murat Demirbas lors d’une récente présentation sur les systèmes désagrégés. Les architectures cloud classiques, qui couplent étroitement les ressources de calcul et de stockage dans une conception dite « sans partage », montrent leurs limites face aux exigences d’élasticité des applications modernes.

Ces architectures « sans partage » présentent une inadéquation inhérente : le calcul est une ressource coûteuse et volatile, tandis que le stockage est relativement bon marché et stable. L’industrie s’oriente donc rapidement vers des architectures « désagrégées », dissociant le calcul, le stockage et, de plus en plus, la gestion des journaux (logging). Des bases de données cloud telles que Amazon Aurora, Google AlloyDB, Microsoft Socrates et Snowflake illustrent cette tendance, en permettant une mise à l’échelle indépendante et une simplification de la gestion.

Plusieurs facteurs clés motivent ce changement. L’élasticité est accrue, car les nœuds de calcul peuvent être augmentés ou diminués instantanément sans déplacer d’énormes quantités de données (pétaoctets). L’isolation des anomalies est également améliorée : la défaillance d’un composant isolé, comme un nœud de calcul, permet un basculement plus rapide. De plus, la gestion est simplifiée, le stockage partagé facilitant les opérations complexes de maintenance, de réplication et de sauvegarde. Enfin, les modèles de paiement à l’utilisation permettent une optimisation économique, les clients ne payant que pour les cycles de calcul et les blocs de stockage réellement consommés.

Cette évolution architecturale est rendue possible par les progrès des réseaux à haut débit, en particulier l’accès direct à la mémoire à distance (RDMA) et le Compute Express Link (CXL), qui fournissent une infrastructure à faible latence pour remplacer les entrées/sorties locales traditionnelles.

La désagrégation modifie fondamentalement la manière dont les tâches principales des bases de données sont exécutées, déplaçant la complexité vers la couche de stockage partagé. Par exemple, dans Amazon Aurora, le nœud de calcul principal transmet uniquement le journal de relecture (redo log) (ou journal d’écriture anticipée) à un quorum de stockage. Les nœuds de stockage matérialisent ensuite l’état de la base de données, permettant au nœud de calcul d’accuser rapidement réception des écritures et de déléguer la réplication et le consensus au cluster de stockage.

Murat Demirbas a relié ces conceptions modernes à la théorie classique des systèmes distribués en évoquant le protocole Paxos de Leslie Lamport. Cette approche suggère que la désagrégation crée une nouvelle séparation naturelle des rôles dans une base de données :

Rôle Paxos	Fonction de base de données
Proposeurs	Nœuds de calcul (lancement des modifications)
Accepteurs	Quorum de journal/stockage partagé (garantir la durabilité)
Apprenants	Magasin de pages partagé (offrir la disponibilité)

Cette séparation structurelle permet à ces systèmes d’évoluer, de tomber en panne et de se rétablir en douceur. Cependant, elle n’est pas sans compromis : le goulot d’étranglement des performances se déplace du processeur vers le réseau, nécessitant des mesures d’atténuation telles qu’une mise en mémoire tampon et une prélecture agressive des données pour surmonter la lenteur inhérente aux E/S distantes.

La tendance à la désagrégation ouvre de nouvelles perspectives en matière de conception de bases de données :

Calcul déroulant (roll-out computing) : Exécution de la logique de requête complexe directement sur les nœuds de stockage (à proximité des données) pour minimiser les transferts de données coûteux sur le réseau.
Désagrégation de la mémoire : Séparation du pool de mémoire/tampon des nœuds de calcul à l’aide de CXL, permettant une mise à l’échelle élastique et indépendante de la mémoire.
Unification des charges de travail : Faciliter la fusion des charges de travail transactionnelles (OLTP) et analytiques (OLAP) sur le stockage partagé, comme on le voit avec Google AlloyDB.

Murat Demirbas a conclu en citant une phrase percutante de Ralph Waldo Emerson :

« Il existe de nombreuses méthodes, mais peu de principes. Si vous maîtrisez les principes, vous pouvez choisir vos méthodes. »

Ralph Waldo Emerson, essayiste, philosophe et poète américain

Il a souligné qu’à mesure que de nouveaux matériels et de nouveaux modes de défaillance, tels que la métastabilité dans les environnements dynamiques, émergeront, une compréhension approfondie des principes des systèmes distribués sera essentielle pour concevoir l’avenir des données dans le « cloud » : un ensemble de bases de données capables de s’auto-assembler et de traiter le centre de données comme un ordinateur géant.

Séparer les nuages ​​: l’essor des systèmes désagrégés par Murat Demirbas au QCon SF 2025

Séparer les nuages : l’essor des systèmes désagrégés par Murat Demirbas au QCon SF 2025