Une analyse des coûts de la supervision [Partie 1]

Au travers de ce retour, nous lançons notre section de retours « à forte valeur ajoutée » pour nos clients. N’hésitez pas à nous faire part de vos remarques, elles sont bienvenues.

Définition: la supervision informatique

La « supervision informatique » pouvant désigner bien des choses, je pense qu’il est judicieux de préciser ce que j’entends par « supervision informatique » avant d’aller plus loin. Dans le cadre de cet article, La supervision informatique est traitée au sens large, incluant les diverses couches pouvant être supervisées, les différents outils pouvant être utilisés, l’hypervision et le reporting. Le schéma ci-dessous précise mon propos :

supervision global

Vue de la supervision au sens large

Donc quand je vous parle de supervision informatique, en terme d’outillage et de couverture, je fais référence au périmètre précisé ci-dessus. Mais là encore, ça n’est pas tout. Parler de supervision informatique, c’est aussi parler de processus, d’organisation, de ressources, et de prise en compte du contexte.

 supervision_perimetre

Périmètre de la supervision

Mon propos portera donc sur la globalité de ce périmètre, et vous apportera un éclairage selon l’angle que je jugerais pertinent à sa compréhension.

Coût de la Supervision

La supervision, ça coûte cher!

Cette phrase, j’ai dû l’entendre au moins une fois chez chacun des clients pour qui la supervision avait de l’importance.

Je mets de côté les entreprises où la disponibilité des applications n’est pas au cœur de l’activité, parce que bien souvent dans celles-ci la supervision est réalisée sur un coin de bureau (avec aucune ressource dédiée), avec un Nagios paramétré pour assurer le service minimum (et qui répond aux attentes). Je parle ici des entreprises où la supervision est un enjeu, quelle qu’en soit la raison :

  • La société rend un service à des clients exigeants,
  • La société doit rendre des comptes sur sa disponibilité à un organisme tiers,
  • L’indisponibilité de l’outil informatique a un impact direct sur le chiffre d’affaire de la société,

La supervision dans le cadre défini ci-dessus est évidemment un enjeu d’importance, mais elle est bien souvent perçue comme très/trop coûteuse. Le fait est qu’il est difficile d’évaluer le ratio apports/coûts de la supervision. Le but de cet article est de lister les « coûts/apports » de la supervision afin de vous aider à en maîtriser les enjeux.

Apports de la supervision

La supervision n’est pas un organe critique de la chaîne applicative de l’entreprise.

L’indisponibilité de la supervision n’entraîne pas de facto l’indisponibilité des applications. Elle est par contre un élément majeur de l’exploitation. Si l’on prend la définition de wikipedia : « L’exploitation informatique est l’activité qui consiste à maintenir opérationnel de manière stable, sûre et sécurisée un outil informatique dans un environnement de développement, de qualification, de formation, ou de production, dans ses parties matérielles et logicielles. »

Or comment peut-on imaginer maintenir un outil informatique si l’on n’est pas en capacité de connaître son état ? C’est là le rôle essentiel de la supervision. Et ce rôle essentiel est perçu différemment selon les attentes que portent les applications supervisées ; si l’indisponibilité de votre application, comme pour le cas d’un site marchand par exemple, entraîne une perte financière directe, vous avez tout intérêt à être réactif dans la résolution d’un incident afin de minimiser la perte. Ce ne sera pas forcément la même chose pour une application qui est utilisée 1 mois par an et qui ne présente pas d’impact financier.

Peut-on alors considérer cette « économie » comme un « gain » ?

Il y a peu encore, un responsable d’exploitation me disait : « mon meilleur outil de détection d’incidents, c’est mon client. Il sera toujours plus réactif que les outils de supervision à détecter un problème, parce que lui est en 24/7 devant sa console et qu’il m’avertit directement du moindre dysfonctionnement. » J’avoue que sur le moment sa remarque m’avait choqué, sans que j’ai le temps de lui formuler une réponse correcte afin de lui prouver ses torts. Et pourtant, la réponse était évidente ! bien sûr, le client est le premier à pouvoir détecter un incident, mais ça n’est pas suffisant, car ce qui intéresse réellement ce n’est pas de détecter un problème, mais c’est d’être en mesure d’en connaître la cause rapidement, afin de limiter l’indisponibilité. Au vu de la complexité des applications d’aujourd’hui, bâties sur de nombreuses couches et reposant sur des progiciels qui se complexifient d’année en année, rien n’est moins simple.

C’est la qu’intervient la supervision, qui non seulement est capable d’alerter sur un incident, mais permet aussi d’aller directement au cœur du problème, de pouvoir mobiliser au plus vite les bons intervenants et de limiter ainsi les temps d’indisponibilité.

La supervision, parce qu’elle permet d’identifier un incident de manière claire et précise permet donc de facto de réaliser des économies conséquentes sur les temps d’indisponibilité des applications.

Ces économies sont à mettre en face des besoins, car c’est là bien souvent qu’il y a mélange des genres. Bien que ce ne soit que rarement le message porté par les éditeurs (qui préfèreraient évidemment que vous investissiez dans toute leur suite sur tout votre périmètre), il n’existe pas une seule supervision mais bien des usages de la supervision, et tout comme vous n’apportez pas le même niveau d’engagement pour une production que pour une intégration, il n’y a pas de raison que vous apportiez le même niveau de supervision pour toutes vos applications. La supervision doit être elle aussi adaptable au contexte, aux besoins, aux impératifs clients.

La supervision est un ensemble de briques qu’il est possible de choisir et de paramétrer selon ses besoins. L’homogénéisation des supervisions mise en place est une contrainte plus souvent apportée par l’organisation interne et le souci d’industrialisation que par les solutions fournies par les éditeurs.

Les outils de supervision peuvent d’ailleurs aller très loin. Lorsque vous souhaitez définir des SLA pour une application, aujourd’hui, vous pouvez avec justesse faire reposer ces SLA sur des outils de type « robots » (ip-label newtest, BMC TMART, sikuli, …) plutôt que sur la capacité du client à remonter les indisponibilités (en mettant de côté celles qu’il aurait pu ne pas voir), ce qui met en avant un autre rôle dans la maîtrise du SI apporté par la supervision :

Elle permet de garantir un terrain neutre d’analyse de la disponibilité des applications entre les clients et l’exploitation informatique (rôle de « tiers de confiance »).

Donc, pour conclure cette section, la supervision peut être vectrice de gains financiers si elle est bien réalisée, elle doit être adaptée au besoin, et elle permet d’assurer un pont « neutre » entre l’exploitation et les clients.

(suite: coût de la supervision)

0 réponses

Répondre

Vous souhaitez vous joindre à la discussion ?
N'hésitez pas !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *