Dans le domaine du cloud computing, notamment celui du cloud privé, les solutions actuelles pour les services de type IaaS (Infrastructure As a Service), qui permettent l’administration et l’utilisation d’un ensemble de ressources physiques et virtuelles à travers le réseau en employant les technologies du Web et celles de la virtualisation, adoptent des architectures de supervision centralisée. De plus, ces solutions ne supportent pas la tolérance aux pannes dans leurs architectures ; ce qui est susceptible d’entraîner des ruptures de services en cas de panne du nœud central du système. Afin de contribuer à la résolution de ce problème, nous avons proposé un nouveau système basé sur un algorithme de supervision distribué des différentes machines du réseau en employant le principe de privilège tournant. La solution se base sur une représentation en arbre des différents nœuds du réseau en déléguant des nœuds « fils » dont le rôle consiste à superviser les nœuds « parents » jugés critiques. De cette manière, une panne quelconque survenue au niveau de ces nœuds est automatiquement perçue par le nœud « fils » élu qui s’auto-attribue les fonctions et charges du nœud sortant par changement d’état. La solution a été appliquée aux services IaaS et les différents tests effectués ont montré sa capacité à assurer la disponibilité des services dans un environnement de cloud privé.
Mots clés : Virtualisation, Cloud computing privé, Système distribué, Algorithme de contrôle distribué, Tolérance aux pannes.