Comment éviter des défaillances coûteuses comme celle de Toyota

0
42

Fin août, une panne géante chez Toyota paralysait toutes ses usines au Japon pendant deux jours. En cause, « un espace de stockage sur disque dur insuffisant, entraînant l’arrêt du système » selon les déclarations du groupe.

Tribune – Toyota n’avait vraisemblablement pas suffisamment anticipé ce risque pourtant élémentaire, les principes de base consistant à savoir ce que l’on sauvegarde, à partir de quoi et vers où, et en mettant en place une surveillance, des garde-fous et un système de contre-mesures pour pallier le risque de faille.

Pour Jean Baptiste Grandvallet, Directeur Technique EMEA chez Cohesity, l’un des leaders de la sauvegarde et de la sécurisation des données, « Les entreprises doivent impérativement classer leurs systèmes de sauvegarde par ordre d’importance. La catégorie la plus élevée correspond aux données, systèmes et processus indispensables, dont la perte ou la défaillance entraînerait les plus grands dommages économiques. Les serveurs de Toyota devraient idéalement être classés dans la catégorie de résilience la plus élevée, car leur défaillance, comme cela s’est malheureusement produit, entraîne l’arrêt de toute la production et des coûts élevés. »

Une erreur humaine pouvant survenir, il est conseillé de fixer des valeurs limites pour les données critiques telles que l’utilisation de disque, afin de réduire au maximum la fenêtre de temps d’arrêt, car chaque heure d’indisponibilité peut coûter des millions à l’entreprise.

« Aujourd’hui, les outils assistés par l’IA peuvent aussi accompagner les équipes IT en informant sur les capacités de stockage en temps réel et suggérer immédiatement des contre-mesures appropriées qu’un membre de l’équipe informatique peut vérifier et déclencher » précise Jean-Baptiste Grandvallet.

D’autres étapes importantes peuvent être définies via les catégories de résilience élevée, par exemple des intervalles plus courts entre les sauvegardes. « Lorsque les entreprises mettent l’accent sur les données, notamment celles provenant d’autres environnements de calcul et de stockage, elles améliorent leurs capacités de gouvernance, de détection, de réponse et de récupération, nécessaires pour atteindre un niveau de résilience plus élevé » conclut Jean-Baptiste Grandvallet.