L’anonymisation de données personnelles

Blog > RGPD > L’anonymisation de données personnelles

L’anonymisation permet de rendre impossible l’identification d’une personne depuis un ensemble de données. Une opportunité pour de nombreuses personnes afin de préserver leur vie privée.

Définition de l’anonymisation

Il s’agit d’un traitement regroupant un ensemble de techniques pour rendre quasiment impossible l’identification d’une personne et cela peu importe les moyens utilisés et de façon réversible. Néanmoins, il convient de ne pas confondre l’anonymisation avec la pseudonymisation.

Dans ce cas, c’est un traitement de données personnelles qui sera réalisé pour que les données propres à une personne physique ne puissent plus être retrouvées, sans la moindre information complémentaire. Dans ce processus, il faut remplacer les données identifiantes tels que le nom et le prénom par des données indirectement identifiantes comme un numéro séquentiel ou un alias.

L’importance de l’anonymisation dans les données personnelles

Selon le RGPD, c’est-à-dire le règlement général sur la protection des données il n’y a pas l’obligation d’appliquer l’anonymisation. À vrai dire, c’est une solution parmi d’autres pour éviter que les données personnelles ne soient exploitées par des tierces personnes.

L’anonymisation présente l’avantage de conserver le potentiel de réutilisation des données, bien évidemment à caractère personnel et pour les acteurs de partager ses informations, sans porter atteinte à la vie privée. De plus, l’anonymisation permet de conserver des données dans un délai plus important par rapport à la durée de conservation légale. En effet, la législation encadrant la protection des données personnelles ne s’applique pas, car l’utilisation des données n’impacte pas la vie privée des personnes concernées.

Comment mettre en place l’anonymisation ?

Le cœur même du processus de l’anonymisation repose sur l’impossibilité d’identifier une personne, mais également l’exploitation de ses futures informations pour

d’autres utilisations. Dès le début du projet, ces différentes contraintes sont à prendre en considération. Alors pour mettre en place un processus d’anonymisation, il est important de respecter les quatre éléments suivants :

  • Tout d’abord, l’identification des informations qui devront être conservées par rapport à leur pertinence.
  • La suppression de tous les éléments d’identification directe qui pourrait permettre d’identifier une personne physique. C’est le cas lorsque l’âge de l’individu est connu pour une personne centenaire.
  • Mais il faudra également séparer les informations importantes par rapport aux informations inutiles.
  • Enfin, calibrer la finesse acceptable en fonction des informations conservées.

En répondant aux quatre éléments précédents, il est alors possible de déterminer le meilleur procédé d’anonymisation. Autrement dit, les différentes techniques à mettre en place et elles peuvent être regroupées en deux familles distinctes à savoir la généralisation et la randomisation.

La généralisation s’appuie sur la modification d’échelle des attributs pour un jeu de données afin de les rendre communs à un groupe de personnes. Cela évite l’individualisation.

La randomisation modifie les attributs dans un jeu de données pour les rendre moins précises, tout en préservant leur répartition globale.

Comment s’assurer que l’anonymisation soit efficace ?

Il est impératif de prendre en considération les directives européennes concernant la protection des données. En effet, les autorités ont dégagé trois critères essentiels permettant de dire qu’un jeu de données est considéré comme efficace :

  • Dans le jeu de données, il sera impossible d’isoler à l’individu, c’est ce qu’on appelle l’individualisation. Pour prendre un exemple concret, attardons-nous sur une base de données incorporant de nombreux CV. Ils sont alors rattachés aux prénoms et aux noms d’une personne, mais ces données peuvent être remplacées par un numéro pour individualiser l’information.
  • Le deuxième élément de l’autorité de protection des données européennes s’appuie sur la corrélation. Il est impossible de relier deux éléments distincts. Par exemple, si une base de données utilise les adresses personnelles d’un particulier, ces informations ne pourront pas être recoupées avec d’autres bases de données permettant l’identification des individus.
  • Enfin, l’inférence. Il doit être impossible de déduire de nouvelles informations sur un individu. En reprenant l’exemple d’un jeu de données anonymes sur le montant des impôts, de nombreuses personnes ont répondu à un questionnaire. Si les hommes âgés entre 30 et 35 ans ont déclaré ne pas être imposables, il est possible de déduire que n’importe quel homme dans cette tranche d’âge a répondu qu’il n’était pas imposable.

Comment lutter contre les risques de l’anonymisation ?

Lorsque ces trois critères ne sont pas réunis, c’est la personne responsable du traitement qui devra démontrer que l’identification ne sera pas possible en utilisant des moyens raisonnables. Dans ce contexte, une évaluation approfondie sera nécessaire.

Par ailleurs, les techniques d’anonymisation évoluent régulièrement, impliquant que le responsable du traitement effectue une veille régulière pour garantir le caractère anonyme des informations.

Si jamais un jeu de données considéré comme anonyme se retrouve en ligne avec en réalité de nombreuses informations personnelles, cette situation peut être considérée comme une violation de données. Il faut donc impérativement retirer le jeu de données le plus rapidement possible, mais également informer les personnes concernées et la CNIL.

Pour finir il apparait important de se former sur les évolutions du sujet

Pour toujours plus d'informations, vous pouvez nous contacter en remplissant le formulaire ci-dessous.