L. Sondeck and . Frey, et 3): le Discrimination Rate (DR) est une nouvelle métrique qui fournit une approche centrée sur les attributs pour la mesure de la vie privée et qui est pratique et suffisamment flexible pour s'adapter à divers domaines d'application. Le DR calcule la capacité d'un attribut (évaluée entre 0 et 1) à raffiner un ensemble de sujets; plus un attribut peut affiner un ensemble de sujets, plus son DR est élevé. Par exemple, un identifiant a un DR égal à 1 car il permet d'isoler chacun des sujets de l'ensemble. Grâce au DR, nous fournissons une première évaluation précise ainsi qu'une comparaison de deux des techniques d'anonymisation les plus utilisées, à savoir le k-anonymat et la l-diversité, Le Discrimination Rate: une métrique centrée sur les attributs pour mesurer la vie privée, vol.1, 2017.

, est une amélio-ration du DR qui prend en compte des considérations sémantiques. Le SeDR permet plus de flexibilité pour ses mesures d'anonymat et est utilisé pour comparer la l-diversité à la la t-proximité qui sont deux des meilleures techniques d'anonymisation de type k-anonymat. De plus, comme la t-proximité est considérée meilleure que la l-diversité, le SeDR montre que, selon les considérations sémantiques, la proximité t-proximité peut être pire que la l-diversité, Ce travail a été publié dans la conférence Security and Cryptography (SECRYPT) en 2017 (Sondeck, Laurent, and Frey, 2017.

, Après avoir utilisé notre métrique (SeDR) pour la mesure de l'anonymat, nous montrons comment il peut être utilisé pour fournir une évaluation de l'utilité a posteriori pré-cise pour tout type de données anonymisées. L'évaluation a posteriori est l'approche la plus pratique car elle est réalisée uniquement à partir des données anonymisées et d'un besoin prédéfini d'utilité alors que l'évaluation de type a priori vise à évaluer dans quelle mesure les données désinfectées reflètent les données originales et donc basée sur des données originales, Evaluation d'utilité a posteriori de données anonymisées avec la mesure Discrimination Rate

, ? La conclusion et les perspectives

, Evaluation du besoin d'utilité à partir du SeDR Exemple d'évaluation d'un besoin d'utilité a posteriori Nous proposons un modèle permettant de capturer un besoin d'utilité a posteriori dans une microdonnée (cf. Section A.5.1). Pour ce faire nous considérons 2 critères: ? Un ensemble d'attributs d

, Considérons l'exemple suivant pour qui illustre l'évaluation de l'utilité à posteriori où la table A.7 est un 3-anonymat de la table A.6. Considérons maintenant une étude qui vise à fournir un traitement aux sujets en fonction de leur âge et qui serait basée sur les données anonymisées de la table A.7. Ainsi, le besoin de l'utilité serait de savoir à partir de l'attribut Age* l'attribut Disease correspondant. Par conséquent, les attributs d'intérêt sont Age* et Disease et nous pouvons considérer comme partition d'intérêt la partition prédéfinie (représentée par les valeurs 2*, ? 40 et 3* tels qu'ils sont générés par le mécanisme d'anonymisation) pour évaluer le besoin d'utilité, Ces deux critères nous permettent d'exprimer notre besoin d'utilité qui est par la suite évalué avec le SeDR

, Considérant la partition prédéfinie nous pouvons évaluer le besoin de d'utilité

, Nous utilisons le SeDR pour calculer la capacité des valeurs de Age* à affiner les valeurs de Disease pour calculer ce degré de corrélation. Le résultat est représenté dans la table A.8. Nous observons que la capacité globale (SeDR) à répondre à l'utilité, c'est-à-dire de prescrire un traitement selon l'âge est 0.6. Nous pouvons également observer que la valeur "2*" fournit l'utilité la plus élevée (SeDR = 1) comme pour les sujets qui ont une vingtaine d'années, Le besoin d'utilité dans ce cas fait référence au degré de corrélation entre la partition d'intérêt de Age* et chaque valeur de l'attribut Disease

, Cette méthode s'applique a toutes les mécanismes d'anonymisation car il suffit d'avoir la microdonnée, de choisir les attributs d

A. , Conclusion et perspectives

, En effet, le nouveau règlement sur la protection des données (RGPD), qui entrera en vigueur en mai 2018, transformera complètement la manière dont les données de masse -reconnues comme la nouveau pétrole de notre époque -seront traitées. Le RGPD modifiera radicalement la façon dont les données sont collectées, stockées, exploitées, partagées et supprimées; avec pour les contrevenants, La protection des données n'a jamais été aussi cruciale qu'aujourd'hui

. Cependant, alors que le règlement a déjà été adopté et entrera en vigueur en mai 2018, certains points restent à éclaircir, notamment: 1. Définir précisément les identifiants et donc les données personnelles

, Fournir des mesures d'anonymisation précises permettant des recommandations claires quant à l

, Fournir des mesures d'utilité précises pour calculer le degré d'utilité des données tout en prenant en compte les besoins spécifiques des processeurs de données

