Surmonter les difficultés liées à la sécurisation du Big Data

3
106
USB data security

Le Big Data et la Data Science trouvent de plus en plus d’écho auprès des entreprises dans le monde et tout particulièrement en Europe.

Tribune par Bertrand De Labrouhe – Area Vice President Southern EMEA & Mediterranean chez Imperva – En effet, sur le vieux continent, plus de 20% des sociétés de plus de 10 personnes traitent les données de masse. En France, l’utilisation du Big Data est encore en revanche assez limitée. Méfiance, manque de moyens, de connaissances… autant de paramètres qui empêchent beaucoup d’entreprises de franchir le pas. Il faut dire que le Big Data présente des défis et des risques très spécifiques…

Autrefois réservé à une poignée d’entreprises, le Big Data devient de plus en plus commun, en particulier dans les secteurs des transports, de la santé (en particulier l’assurance), de l’information et de la communication. Il tourne autour de la collection et de l’exploitation des données, comme celles de géolocalisation, issues des réseaux sociaux ou des objets connectés. En France, une étude de l’INSEE montre que 11% des sociétés de 10 personnes, 14% de celles de 20 à 249 employés et 24% des sociétés de plus de 250 personnes utilisent le Big Data.

L’un des facteurs les plus importants du Big Data est celui de la sécurité. En effet, les bases de données renferment une quantité sans précédent de données particulièrement sensibles. Sécuriser ces dernières est donc primordial, mais le processus est compliqué et complètement différent des bases de données relationnelles (SGBDR). Le Big Data étant un secteur en constante évolution, les mesures de sécurité se doivent de suivre le rythme de ces changements.

Sécuriser le Big Data, une tâche complexe

La grande différence entre les Big Data et les SGBDR est l’absence de langage « commun ». Il n’est pas possible de se contenter d’un simple module de sécurité universel, car les technologies Big Data varient grandement d’un éditeur à l’autre.

La même solution de sécurité n’est donc pas applicable pour une entreprise qui utilise différentes bases de données (SGBDR classiques, bases structurées, semi-structurées, non structurées…). Des applications maisons sont aussi développées par chaque entreprise afin de se connecter aux référentiels Big Data, ce qui accroît encore la variété des modes d’accès aux données. Des applications qui demandent, elles aussi, d’être sécurisées.

Les solutions de sécurité Big Data évoluent également à un rythme bien plus rapide que les bases de données classiques, et doivent être mises à jour bien plus régulièrement. A titre d’exemple, Cloudera avait publié une douzaine de versions rien que pour l’année 2016.

Depuis son apparition, le Big Data représente un volume sans cesse croissant de données, de plus en plus sensibles, et ce, sur toutes les technologies, qu’elles soient sur site ou sur cloud.

Un environnement Big Data nécessite donc la mise en place d’un véritable réseau de mesures de sécurité, une mise en place rendue encore plus compliquée par l’arrivée prochaine de la loi de conformité au RGPD (Règlement Général sur la Protection des Données).

Prévue pour le 25 mai 2018, elle sera le nouveau texte de référence européen en matière de protection des données à caractère personnel. Ses dispositions, unifiées pour tous les pays européens, forceront beaucoup d’entreprises à mettre en place une stratégie de sécurité des données Big Data, ou à revoir celle déjà en place.

L’art et la manière

Pour sécuriser le Big Data, vous devez d’abord identifier où sont stockées les données. C’est-à- dire, découvrir où résident les bases de données, déterminer si elles contiennent des données sensibles et si oui, de quel type. Etant donné que le volume et la variété de ces données a tendance à changer, c’est une activité qui doit en plus être réalisée ponctuellement, et qui est loin d’être facile. En fonction du degré de structure de l’architecture Big Data, il devient presque impossible de la réaliser manuellement, d’où le recours fréquent à des solutions de découverte.

Si l’on imagine toujours un hacking ou une violation être opérée par un acteur externe malveillant, les menaces internes composent une bonne partie des profils des assaillants. Beaucoup sont encore ignorées, à tort. Que ce soit les employés amenant un virus de manière non intentionnelle, un Administrateur de Bases de données qui se connecte de manière anormale, ou un collaborateur quittant la société qui emporte avec lui des données. Il est donc indispensable d’élaborer des solutions vérifiant les accès anormaux aux données et capables d’identifier les accès potentiellement malveillants. Mieux vaut prévenir que guérir !

D’autant qu’il n’existe que quelques benchmarks de sécurité pour les bases de données Big Data. C’est par exemple le cas de MongoDB pour lequel CIS a récemment lancé un benchmark de sécurité. Effectuer régulièrement des tests de sécurité est encore aujourd’hui la meilleure manière pour les entreprises de déceler les failles de sécurité. Hélas, beaucoup de correctifs visant à y remédier demandent une reconfiguration des systèmes. La preuve d’une immaturité significative du Big Data par rapport au SGBDR. Il faudra donc encore attendre pour le voir rattraper son retard en matière de benchmarks.

Surveiller au quotidien l’activité des utilisateurs et applications sur les bases de données Big Data est une nécessité pour déceler toute activité suspecte. Une bonne partie des entreprises définissent des alertes et règles afin d’interdire automatiquement aux utilisateurs ou applications les accès inappropriés. De même, dans le cas où une base Big Data contient des données sensibles, en surveiller (et/ou limiter) l’accès pour des raisons de conformité est une méthode généralisée.

Une solution universelle ?

La protection des Big Data n’est pas à prendre à la légère. La variété des bases de données, architectures, applications et technologies qui entrent en jeu nécessite une solution complète pour sécuriser un environnement Big Data. Les entreprises doivent opter pour une solution qui assure la découverte et l’analyse des bases de données, la prévention des menaces internes et le test des vulnérabilités, ainsi qu’une surveillance et un audit en continu dans le but d’identifier les activités inappropriées ou suspectes.

C’est une fois cette solution acquise qu’elles peuvent se considérer comme armées pour le monde en perpétuelle évolution du Big Data.

3 Commentaires

  1. Big data est une solution et permettre à tout le monde d’accéder en temps réel à des bases de données géantes. Il vise à proposer un choix aux solutions classiques de bases de données et d’analyse. Pour profiter de cette évolution information et gagnez votre temps participez à cette grande formation de Big Data

  2. Les big data sont à la mode1. Dans les médias comme dans le débat public, le terme est évoqué de manière récurrente. Des entreprises dédiées au traitement de ces masses d’informations sont créées chaque jour, d’autres réorganisent radicalement leurs activités autour de la gestion de ces données.

Les commentaires sont fermés.