Comment calculer le MTBF et le MTTR ?

Le clavier d'ordinateur se présente en une teinte blanche, mais la touche Shift se démarque en bleu. Sur cette touche, on peut lire en lettres majuscules l'inscription "MEAN TIME BETWEEN FAILURES".
Avant de s’attarder sur les définitions du MTBF et du MTTF, il faut bien comprendre l’enjeu des mesures de performance des actifs au sein d’une entreprise. En effet, il est primordial de suivre attentivement les éléments pouvant potentiellement tomber en panne pour réduire drastiquement les interruptions et donc pour optimiser la disponibilité des équipements.

Introduction à la notion de défaillance

Pour les entreprises ayant une dépendance directe aux équipements, il est primordial de mesurer la fiabilité et la performance des actifs opérationnels. Entre autres, prendre connaissance de la disponibilité informatique lorsque l’outil occupe une place prépondérante au sein de l’entreprise. En mesurant précisément la fiabilité de ces éléments, les interruptions sont réduites et la disponibilité maximale. Dans des conditions optimales, les équipes de maintenance sont en mesure d’anticiper les pannes informatiques en réalisant des planifications. Une intervention nécessaire pour éviter l’accumulation des anomalies et parfois des échecs potentiels au cours d’un projet. Voilà pourquoi, des indicateurs de maintenance ont été développés comme le MTBF et le MTTR.

Définition du MTBF

Le MTBF ( Mean Time Between Failure ) ou temps moyen entre les pannes est un indicateur permettant de connaître la fiabilité d’un produit, d’un composant ou d’un équipement. Le mtbf détermine alors le laps de temps durant lequel l’équipement informatique est en mesure de fonctionner avant de connaître une panne non planifiée. En d’autres termes, c’est une métrique définissant le temps moyen entre chaque défaillance pour un système réparable. Le MTBF prend en considération toutes les pannes susceptibles de perturber le bon fonctionnement de l’unité, aboutissant à une mise hors service afin de pouvoir le réparer via la maintenance. Cependant, le mtbf n’intègre pas l’arrêt des systèmes dans le cadre d’une intervention programmée comme pour un entretien, un étalonnage, une maintenance préventive ou le remplacement d’une pièce. C’est une mesure d’une très grande utilité, permettant de déterminer les équipements informatiques susceptibles de connaître une panne et donc l’intervention d’une maintenance. L’organisation est en mesure d’anticiper la défaillance en réduisant les temps d’arrêt. Plus la valeur est importante, moins le système ou l’équipement informatique a de chances de tomber en panne.

Comment calculer le MTBF ?

Pour déterminer la fiabilité et donc le laps de temps entre deux pannes du système, il faut additionner la durée de fonctionnement et diviser le résultat par la totalité des pannes, ce qui donne la formule suivante : MTBF = la durée totale de fonctionnement / la quantité de pannes. Pour une meilleure représentation du calcul, nous allons prendre un exemple concret avec un serveur fonctionnant 24 heures sur 24. Malheureusement, celui-ci subit quatre défaillances. La première entraîne une interruption d’une durée de 30 minutes, la deuxième un arrêt d’une heure, la troisième un dysfonctionnement de 30 minutes et la quatrième panne une interruption de deux heures. Donc, la durée totale de travail est de 24 heures. Concernant la durée des défaillances cumulées, il suffit d’ajouter le temps total des 4 pannes, soit 4 heures. Puis d’appliquer la formule précédente : MTBF = ( 24 – 4 ) / 4 = 5. Le MTBF est un indicateur très utile pour déterminer la probabilité de défaillance de fonctionnement d’un équipement, mais également pour obtenir une estimation de la fréquence des pannes. Une donnée absolument incontournable pour l’ingénierie.

Qu’est-ce que le MTTR ?

Le MTTR ( Mean Time To Repair ) ou temps moyen de réparation est une métrique permettant de définir le temps moyen pour effectuer la réparation d’un système connaissant une panne de fonctionnement. En d’autres termes, c’est une façon de mesurer la capacité à maintenir un service réparable, mais le mttr peut également concerner un composant. En fonction de la situation et de la difficulté du problème, le mttr peut s’exprimer en jour ou en minutes. Le temps de réparation incorpore à la fois la période de test, mais également la restauration de toutes les fonctions du système.

Comment calculer le MTTR ?

Pour déterminer la valeur du MTTR, il faut additionner le temps total de maintenance et diviser ce résultat par la totalité des actions de maintenance au cours d’une période définie. Reprenons l’exemple d’un serveur fonctionnant en continu, mais rencontrant deux pannes au cours de ce laps de temps. L’équipe technique est intervenue à chaque fois pendant 30 minutes afin que l’équipement informatique puisse être de nouveau fonctionnel. Le MTTR est alors de : 1 / 2 = 30 minutes. Il s’agit d’un exemple très simple, mais il faut savoir que les défaillances sont variables avec un niveau de gravité plus ou moins conséquent. Il n’est pas rare qu’une panne soit résolue en quelques minutes, mais dans d’autres cas, plusieurs jours seront nécessaires pour une résolution totale. Pour préserver l’efficacité des équipes de maintenance, le MTTR est une donnée essentielle afin de déterminer une moyenne de temps à prévoir pour la maintenance d’un élément. Bien évidemment, le niveau de compétence de l’équipe reste essentiel dans le but de fiabiliser le MTTR. D’où la nécessité de vous adresser à du personnel expérimenté en interne ou en déléguant cette opération à un prestataire informatique comme Weodeo. En effet, nous sommes un partenaire informatique et infogérance reconnu pour la qualité de nos services. Nous gérons toutes les maintenances informatiques avec des solutions adaptées aux besoins de l’entreprise.

Pourquoi le MTBF et le MTTR sont des indicateurs différents ?

Le MTBF mesure uniquement la fiabilité d’un équipement alors que le MTTR s’attarde sur l’efficacité des réparations. Lorsque vous disposez d’un MTTR avec une valeur élevée, alors les équipements ne seront pas utilisables pendant un laps de temps conséquent lorsqu’une défaillance se produit. Il est donc primordial de privilégier un MTBF élevé, synonyme de fiabilité. À l’inverse, un MTTR faible signifie un temps d’arrêt plus bas. L’opposition du MTBF et du MTTR n’est pas utile, car ils sont complémentaires pour les gestionnaires.