Résilience des données : l’importance des tests, de l’orchestration et de la préparation

0
188

Les cyberattaques fragilisent la continuité d’activité à l’échelle mondiale. Outre les coûts de perte de données, qui peut être considérable, les temps d’arrêt sont également très onéreux. Gartner les estime même jusqu’à plus de 5 000 euros par minute. L’impact d’une attaque s’étend bien au-delà de la perte financière et fragilise même la réputation.

Lorsqu’elle n’est pas disponible pour répondre aux besoins des clients, la marque est en effet endommagée et cela peut être difficile à rétablir. L’approche la plus efficace pour atténuer les conséquences négatives reste d’investir dans une architecture de sauvegarde et de restauration orchestrée qui garantit la résilience des données.

Grâce à celle-ci, l’entreprise est prête à faire face à tout incident, que ce soit une cyberattaque ou une catastrophe naturelle. Avec un plan bien défini et les bons outils en place, il est possible de minimiser ces impacts et d’assurer la continuité des activités.

C’est pourquoi 77 % des décideurs informatiques investissent dans de telles infrastructures de sauvegarde et de restauration orchestrées, selon une récente étude menée par Dimensional Research. Ce chiffre est très encourageant puisque ces éléments sont essentiels à tout plan de résilience des données et donnent la possibilité aux entreprises cibles d’éviter le pire.

3 étapes pour assurer une résilience optimale

De nombreuses variables et inconnues surviennent lors d’un incident. Des stratégies de sauvegarde et de reprise après sinistre solides aident à s’y préparer, mais uniquement lorsqu’on les teste régulièrement. Ainsi, l’entreprise est capable de déterminer et documenter les procédures nécessaires pour restaurer les opérations et les systèmes de l’entreprise en cas de sinistre. Une fois cela fait, elle peut valider le plan et corriger les éventuelles lacunes.

Ce n’est donc que par des tests précis que ces aspects critiques peuvent être vérifiés.
L’orchestration, qui implique l’utilisation de l’automatisation pour accélérer la restauration de bout en bout, est le deuxième aspect de cette stratégie de résilience. Elle détermine la séquence optimale pour le lancement des divers systèmes interconnectés au cours d’une restauration. Concrètement, elle décrit l’ordre idéal dans lequel l’entreprise doit restaurer ses données, identifie toutes les étapes intermédiaires avec une validation à chaque étape et assure une restauration fluide et ordonnée.

Le dernier élément est la préparation. Prenons l’exemple d’un exercice d’incendie dans un immeuble de bureaux. Pendant celui-ci, une alarme avertit les employés de la menace. Des panneaux de sortie de secours les guident pour qu’ils utilisent les escaliers plutôt que l’ascenseur et se rassemblent à des endroits sécuritaires désignés et prédéterminés. Appliqué aux données, cela fonctionne de la même manière. Les employés font alors régulièrement des exercices pour s’assurer que tout le monde connaît les actions et les processus à exécuter en cas d’urgence.

RPO, RTO et temps d’arrêt autorisés

Dans le contexte actuel, les entreprises ont beaucoup à faire et beaucoup n’accordent ainsi pas le temps et l’attention nécessaires aux tâches de sauvegarde et de restauration. Elles peuvent alors effectuer des tests de reprise après sinistre lors de la configuration de nouveaux logiciels de sauvegarde ou serveurs de stockage, mais ne parviennent pas forcément à établir un rythme régulier et à donner suite à ces tests. Les entreprises doivent en effet effectuer des tests de sauvegarde réguliers, qu’ils soient trimestriels ou annuels, lors d’événements importants tels qu’une fusion, le déploiement d’un nouveau système informatique ou l’expansion des employés.

Idéalement, il convient de concevoir une stratégie complète de test de sauvegarde, et il y a certains éléments clés à considérer. Deux d’entre eux sont l’objectif de point de récupération (RPO) et celui de temps de récupération (RTO). Une entreprise peut déterminer son RPO en mesurant le volume de perte de données qu’elle peut tolérer en cas d’incident. Cela donne alors un temps acceptable qui peut s’écouler pendant l’incident avant que la quantité de données perdues dépasse le seuil de tolérance. Ainsi, le RPO est calculé pour établir la fréquence optimale des sauvegardes, que ce soit toutes les heures, 24 heures ou sept jours.

Le RTO, quant à lui, représente le temps toléré pour récupérer et restaurer les opérations après un incident. La reprise perturbe autant les entreprises que les employés et les opérations quotidiennes.

Il convient donc de valider les hypothèses concernant l’impact et le temps de récupération admissible dans le cadre de leur stratégie de test. Dans l’étude mentionnée ci-dessus, 83 % des répondants ont indiqué que 12 heures ou moins était un temps acceptable de temps d’arrêt pour les systèmes critiques avant qu’il n’y ait un impact négatif mesurable sur l’entreprise. Pourtant, seules 52% ont déclaré qu’elles pouvaient se rétablir d’une perte de données grave en moins de 12 heures, tandis que 29% ont déclaré qu’elles ne pouvaient pas restaurer les données en un jour ou plus.

Les résultats de l’enquête mettent en évidence un écart entre les attentes et la capacité réelle. Les entreprises doivent donc se concentrer sur l’amélioration de leurs capacités pour résoudre ce problème et véritablement s’aligner sur leurs temps d’arrêt acceptables. Pour ce faire, il peut être nécessaire de mettre en œuvre des solutions de sauvegarde et de restauration plus robustes et d’améliorer les plans de reprise après sinistre. Cela implique également de tester et de mettre à jour régulièrement les processus pour s’assurer de leur efficacité. En comblant cette lacune, les entreprises peuvent atténuer les impacts négatifs de la perte de données et minimiser les temps d’arrêt, protégeant ainsi leurs opérations et leur réputation.

Dans un contexte de cybermenaces omniprésentes – le rapport Cost of a Data Breach 2022 d’IBM a révélé que 83 % des entreprises ont subi au moins une violation de données l’année dernière. Il convient donc de comprendre les menaces pour atténuer les risques et élaborer des stratégies de reprise optimales. Une telle attitude proactive peut faire une différence significative dans la capacité d’une entreprise à résister et prospérer.

Comme de nombreux ransomwares nous l’ont enseigné, les organisations non préparées font souvent face à de graves conséquences, pouvant même conduire à la faillite pure et simple. D’autre part, celles qui donnent la priorité à la préparation ont de meilleures chances de résister.

Tribune par Guillaume Maidon, Responsable Partenaire pour la France et le BeLux chez Arcserve