LAMONAHD: Modelling and developing the information to manage an Internet Data Centre

Cet article propose un prototype d'un data model destiné à la gestion d'un data center.
Un data center est une zone qui contient des systèmes automatisés qui ont pour but de fournir un ensemble de service comme par exemple le monitoring sur les activités des serveurs, trafique web et la performance de réseau. Ces systèmes reportent toute anomalie aux personnels pour une éventuelle intervention. Un autre exemple peut être le CDN (Content Data Center) qui permet de stocker les données.

Un data center fournit un service avec une garantie de performance. Donc il faut maximiser l'utilisation des ressources tout en minimisant le cout. D'où la nécessité d'administrer ces systèmes.
Cette administration est réalisée à travers un vertex:

Le protocole de communication qui est utilisé pour échanger l'information.
Le format des messages (balise XML par exemple).
L'information qui est défini par un data model.

Vergara et al. exposent deux approches afin d'adopter un data model pour les Data centers:
1 - CIM (Common Information Model) : un modèle de donnée proposé par le DMTF(Distributed Management Task Force) qui rassemble les principaux constructeurs et vendeurs des équipements (système, réseau et d'autres). CIM a pour but d'unifier les data model déjà existants.
Dans le cadre des DC, CIM contient des informations trop détaillés (parfois inutiles) et manquent d'autres informations qui sont très utiles pour la gestion des DC. En plus, l'équipe suggère d'utiliser un système de base de donnée pour stocker et gérer l'information. Les BDs utilisent une approche plutôt relationnelle. Donc un passage de l'approche objet vers l'approche schéma relationnelle est nécessaire. Or la manipulation des objets permet une meilleur flexibilité.

2- Un modèle de donnée sur mesure: l'idée de proposer un autre modèle de donnée n'est pas trop favorable. En effet, le nouveau modèle de donnée ne sera pas un standard donc il faut intégrer à chaque fois qu'un nouveau équipement apparait dans le modèle alors qu'avec le DMTF c'était au constructeurs/vendeurs de s'aligner au modèle de donnée CIM.

Le nouveau modèle de donnée est réalisé à partir d'un mélange des deux approches.
Utiliser CIM tout en appliquant un ensemble d'extensions/réductions afin de l'adapter aux besoins des data centers. Comme CIM est un standard ceci évitera de proposer un nouveau modèle. Donc ils proposent d'adapter CIM au besoin.
CIM offre une approche objet qui permet une meilleure gestion et flexibilité. Les base de donnée relationnelles permettent une meilleur gestion et stockage des informations donc un passage du modèle objet au modèle relationnelle est appliqué.

Ce nouveau modèle de donnée est divisé en deux sous modèles:
Le premier permet de gérer la configuration et le deuxième un modèle de donnée matériel.

Le modèle de donnée de configuration est basé sur CIM mais avec des extensions/réductions
Une fois le modèle de donnée écrit en CIM, ils le translatent en schéma relationnel avec un ensemble de règle.
(Figure CIM étendue avec date de déploiement etc, click pour agrandir)

Un exemple d'une extension de CIM mappé vers le modèle relationnel.

Pour le modèle de donnée matériel, Le DC à HP utilise un système qui scanne tous les serveurs du réseau et génère un fichier XML contenant toutes les informations (espace mémoire, nombre de partitions etc). Le fichier XML a une DTD tout à fait différente de celle de CIM.
Représenter ces informations avec CIM leur semble compliqué. Donc ils décident de mapper de fichier XML vers un modèle relationnel.

Une fois les deux sous modèles sont mappés vers un modèle relationnel alors ces deux modèles peuvent être reliés en utilisant des clés uniques. C.à.d en utilisant un identifiant d'une machine (clé unique) on peut regarder le modèle de configuration et le modèle matériel. Cet identifiant permettra de relier les deux modèles.

Conclusions:
Cet article propose un prototype d'un modèle de donnée constitué de deux sous modèles pour la gestion des DC.
L'approche utilisée consiste à proposer un modèle de configuration basé sur CIM mais plutôt simplifié. Ceci implique qu'en utilisant CIM, ils ne proposent pas un nouveau modèle mais ils ré-affinent un modèle de donnée standardisé et l'utilisent pour leurs besoins.
Le deuxième sous modèle propose de mapper le fichier XML des machines scannées vers un modèle relationnel. Ces deux modèles seront reliés par des identifiants uniques qui permettront de passer de l'un vers l'autre.
Ce n'est pas trop claire comment garantir le même identifiant unique qui permettra de passer d'un modèle à l'autre, cette opération ne nécessite-t-elle pas l'intervention d'un personnel?

LAMONAHD

Thursday, October 1, 2009

Modelling and developing the information to manage an Internet Data Centre

No comments:

Post a Comment

Twitter

Charbel's profile

Blog Archive

Ch@rBeL's RSS

Followers