Bref – gestion des ressources réparties

Le nom le dit : ceci n'est qu'un bref, pas une description exhaustive des sujets couverts.

Ce petit document se base sur :

Tanenbaum, pp. 448-453 (algorithme du banquier);
Tanenbaum, pp. 454-456 (éviter les Deadlocks);
Distributed Systems, chapitre 8 (systèmes de fichiers répartis, NFS); et
le Dinosaur Book, pp. 490-496 (NFS).

Ce qui suit décrit très brièvement quelques sujets importants pour la question plus générale de la gestion des ressources réparties. C'est une question vaste qui mériterait un cours à elle seule; conséquemment, chacun de ces sujets n'est que survolé par la présente. N'hésitez pas à pousser plus loin votre étude.

Algorithme du banquier

L'algorithme du banquier est l'un des algorithmes les plus connus pour gérer des ressources réparties tout en évitant les Deadlocks. Cet algorithme nous vient de Dijkstra en 1965[1]. L'idée générale est de passer par un médiateur (le système d'exploitation) pour obtenir des ressources, mais de faire en sorte que le service de la demande soit remis à plus tard si le médiateur détermine que la desservir immédiatement pourrait provoquer un Deadlock. Son intérêt est surtout historique.

L'idée va comme suit :

Tout consommateur transite par un tiers médiateur pour obtenir des ressources
Ce tiers joue un rôle analogue à celui d'un banquier. Ce faisait, il n'accorde le droit à la ressource que si cela conserve ses propres réserves (celles du système) dans un état jugé sécuritaire
Un état est jugé sécuritaire s'il permet de satisfaire la pire demande possible pour chaque client potentiel

Il est sous-entendu ici que le tiers conserve aussi la trace de toutes les ressources ayant été allouées pour chaque client potentiel, car évaluer le pire cas de demande possible dépend de ce savoir – si un client possède trois ressources et n'en demandera jamais plus de cinq, alors le pire cas possible pour ce client est de deux.

C'est un algorithme conservateur, manifestement. Bien qu'il fonctionne bien en théorie, cet algorithme exige que le tiers connaisse d'avance le pire cas de demande de chaque client – en pratique, on ne le sait que rarement. Il peut être généralisé de manière à couvrir le pire cas par type de ressource (il suffit alors d'avoir plusieurs banquiers).

Pour en savoir plus, voir http://en.wikipedia.org/wiki/Banker%27s_algorithm

Éviter les interblocages

Par Deadlock, on entend une situation où deux processus, $P_0$ et $P_1$ , se bloquent mutuellement de manière inextricable pour eux. Le cas le plus simple implique deux ressources $R_a$ et $R_b$ de manière telle que $P_0$ possède $R_a$ et bloque en attente de $R_b$ alors que $P_1$ possède $R_b$ et bloque en attente de $R_a$ . Cela dit, des situations bien plus complexes sont possibles, et le nombre de processus participant dans un cycle de Deadlocks peut être arbitrairement grand.

Par Livelock, on entend une situation où deux processus, $P_0$ et $P_1$ , se bloquent mutuellement de manière inextricable pour eux, mais sans cesser de s'exécuter. Dans un Livelock simple, $P_0$ veut la ressource $R_a$ et possède la ressource $R_b$ , alors que $P_1$ veut la ressource $R_b$ et possède la ressource $R_a$ . Constatant qu'il n'est pas en mesure d'accomplir sa tâche, chacun relâche « sa » ressource puis la reprend et s'essaie à nouveau. Il est alors possible que les deux se butent à la même situation encore et encore... Un Livelock survient si cette situation perdure ad vitam aeternam.

Quelques trucs pour éviter les interblocages, en pratique :

Viser l'exclusion mutuelle :
- si tout processus ne prend qu'une seule ressource à la fois et la relâche systématiquement, il n'y a pas de Deadlock possible
- alternative : faire en sorte que tout processus convoitant plusieurs ressources relâche au préalable toutes les ressources qu'il possède, puis essaye de prendre tout ce dont il a besoin. Ceci peut par contre mener à un Livelock
Numéroter les ressources :
- tout processus désireux d'obtenir plus d'une ressource doit alors toujours tenter de les obtenir dans le même ordre, p. ex. : en ordre croissant de numéro
- ceci évite les cycles, car si un processus possède une ressource dont le numéro est haut, alors ce processus ne demandera jamais une ressource de plus faible numéro

Dans les deux cas, une part de discipline de programmation est requise, mais cette discipline peut être renforcée par les langages et les outils. Par exemple, certains éléments de C++ 11 formalisent l'obtention ordonnancée des ressources (on peut par exemple demander avec la fonction std::lock() un groupe de mutex, et cette fonction fait en sorte que la demande se fasse toujours selon un ordre imposé par le programme).

Systèmes de fichiers répartis

Qui dit traitement réparti et systèmes réparti dit aussi répartition des ressources. L'un des cas les plus étudiés est, sans surprises, celui des systèmes de fichiers répartis. Ce bref survol s'intéresse aux caractéristiques souhaitées de tels systèmes de fichiers. Le cas particulier de NFS, bien connu, est survolé un tout petit plus en détail un peu plus bas.

Caractéristiques souhaitées d'un système de fichiers réparti

Un système de fichiers réparti, pour être pertinent, doit offrir un certain nombre de caractéristiques. Ce qui suit liste quelques-unes des principales caractéristiques souhaitées d'un tel système.

On souhaite qu'un système de fichiers réparti soit transparent, à plusieurs niveaux :

on souhaite un accès transparent, au sens des modalités, peu importe comment les fichiers sont répartis sur les divers médias physiques (qu'il y ait de la redondance ou non, des variations matérielles, des variations de version, etc.)
on souhaite une transparence quant au lieu, donc accéder aux fichiers à travers un système de nommage logique. La transparence quant au lieu s'exprime aussi par le souhaite que les clients puissent être mobiles, donc qu'un même fichier puisse être accédé indépendamment du lieu où est exécuté le code client
on souhaite une transparence quant aux performances, donc obtenir des performances se rapprochant le plus possible de celles d'un accès sur un système de fichiers local. Ici, évidemment, il y a un jeu d'équilibre entre les performances obtenues et les ressources investies. Certains parleront ici d'efficacité

On souhaite qu'un système de fichiers réparti soit échelonnable (néologisme personnel pour Scalable). En effet, il faut pouvoir y ajouter des clients, des médias d'entreposage, des fichiers et des dossiers en fonction des besoins.

On souhaite que plusieurs clients puissent réaliser des mises à jour concurrentes au contenu et à la structure du système de fichiers (chose que NFS permet plus ou moins, d'ailleurs).

On souhaite aussi d'un système de fichiers réparti :

qu'il supporte un ensemble hétérogène de plateformes
qu'il soit tolérant aux pannes. Ceci est particulièrement important du fait que plus il y a de noeuds participant au système et plus grandes sont les probabilités que l'un d'eux se trouve en panne à un instant donné
on veut une capacité de réplication de fichiers et de dossiers, ce qui rejoint plusieurs autres souhaits, en particulier celui d'être tolérant aux pannes
on souhaite que le système offre une forme homogène de sécurité (droits d'accès, chiffrement, etc.). Notez que ceci est difficile à réaliser en harmonie avec l'atteinte de certains autres souhaits; par exemple, supporter un ensemble hétérogène de plateformes signifie qu'on doive implémenter des mécanismes de sécurité distincts de ceux des plateformes sous-jacentes
enfin, on souhaite une forme de conséquence qu'on nomme candidement le One-Copy-Update Semantics. Ceci signifie qu'une fois une écriture faite sur le système de fichiers par un client, elle doit être rendue visible à tous les clients

Typiquement, un système de fichiers réparti reposera sur les systèmes de fichiers des plateformes sous-jacentes et assurera le volet réparti par une interface de plus haut niveau.

Cas particulier : NFS

Le système de fichiers réparti NFS est un cas particulier bien connu. Ce qui suit donne un exemple sous forme d'une vue aérienne et sans prétention des traits caractéristiques de ce système, à titre informatif. Voir comment ce système résout ses problèmes et rencontre les exigences attendues d'un système de fichiers réparti donne des pistes pour penser nos propres systèmes.

Comme bien des systèmes de fichiers répartis, NFS est en fait un métasystème de fichiers. Il est implémenté selon une approche RPC. L'implémentation originale fut réalisée chez Sun Microsystems mais ses interfaces sont du domaine public depuis 1989.

Comme tout métasystème de fichiers, NFS offre une gamme d.'opérations peu importe la plateforme sous-jacente. Ces opérations incluent :

chercher un fichier dans un dossier
lire les éléments d'un dossier
manipuler les liens symboliques ou autres
manipuler les dossiers
accéder aux attributs d'un fichier
lire d'un fichier
écrire dans un fichier

Depuis sa version 3, NFS est en fait un système client/ serveur avec serveurs sans états, sauf pour une tenue à jour de la liste des clients. Il utilise des proxy côté client (avec possibilité de cache locale) alors que le serveur réalise des opérations idempotentes.

Lorsqu'un client soumet ds requêtes, il est responsable de les numéroter de manière unique avec croissance monotone. Ceci permet de détecter les requêtes manquantes ou hors-séquence.

Le serveur étant sans états, il ne peut pas implémenter une cache des écritures. Conséquemment, chaque appel RPC menant à une écriture est synchrone au sens faible du terme (l'écriture a lieu sur le système de fichiers avant que l'appel de fonction ne soit complété). Pour que les performances demeurent acceptables, NFS a recours à des mémoires non-volatiles et à des disques en mémoire (RAM Disks). Il reste que, sans grandes surprises, NFS montre de meilleures performances en lecture qu'en écriture, surtout si plusieurs petites écritures doivent être réalisées.

Au sens de NFS, chaque écriture est atomique pour un serveur donné. Le protocole que NFS utilise pour véhiculer les données est RPC/XDR alors qu'il a recours à son propre protocole (le protocole NFS) pour les opérations.

De manière générale, NFS est intégré à bas niveau avec le système d'exploitation, particulièrement les variantes de Linux ou de Unix.

NFS tend à maintenir une correspondance directe, 1:1 avec le modèle Unix pour la plupart des opérations, mais le fait qu'un serveur NFS soit sans état influence la signature de ses services.

Dns l'esquisse proposée à droite, remarquez le descripteur de fichiers, fd, passé à toutes les fonctions sans exception. Ce descripteur doit être riche, et ne peut se limiter à un int car le serveur ne peut retenir à quelle ressource est associé chaque descripteur. Le client porte seul cette responsabilité.

fd = open(...);
fd = creat(...);
stat = close(fd);
n = read(fd, ...);
n = write(fd, ...);
pos = lseek(fd, ...);
stat = unlink(fd, ...);

[1]Note historique sympathique : le texte original de Dijkstra se nommait, dans sa version anglaise, An algorithm for the prevention of the deadly embrace. J'ai eu vent que certains utilisent en français le terme « Étreinte fatale » comme traduction pour Deadlock. C'est charmant et, manifestement, pas fou du tout.