• Media type: Electronic Thesis; E-Book; Text
  • Title: Privacy risk analysis of large-scale temporal data : application to electricity consumption data ; Analyse des risques liés à la publication de données temporelles : application aux données de consommation électriques
  • Contributor: Voyez, Antonin [Author]
  • imprint: theses.fr, 2023-07-11
  • Language: English
  • Keywords: Séries temporelles ; Data science ; Données électriques ; Open data ; Privacy ; Time series ; Données ouvertes ; Electricity consumption data
  • Origination:
  • Footnote: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Description: Enedis est le principal gestionnaire de distribution d’électricité en France. Les distributeurs sont légalement obligé de mesurer et de publier la consommation électrique française. Les mesures contiennent de nombreuses informations personnelles et sensibles. De fait, la publication est anonymisée à l’aide d’agrégats par seuils. Ce travail étudie la vulnérabilité liée à la publication des mesures de consommation électrique. Notre première contribution est une étude statistique à grande échelle des mesures d’électricité française. En particulier, nous réalisons une étude d’unicité montrant que les séries non anonymisées sont très facilement identifiables. Notre deuxième contribution est une attaque par inférence d’appartenance qui permet de trouver toutes les séries formant un agrégat. Cette attaque est basée sur une variante du problème de la somme des sous-ensembles. Notre troisième contribution est une attaque par inférence d’appartenance modélisée comme un problème de classification de séries temporelles. Cette attaque nécessite peu de connaissances préalables et permet de trouver une cible spécifique dans un agrégat. Nous réalisons des expériences approfondies sur les attaques. Les résultats permettent de mieux choisir le seuil de publication. Enfin, nous proposons une méthode pour estimer la vulnérabilité des séries. ; The leading French electricity distribution manager, Enedis, legally must collect and publish electricity consumption time series. Series from households and companies are highly privacy sensitive. Therefore, the publication is anonymized using threshold aggregates. This work studies the vulnerability of open-sourcing electricity consumption time series. Our first contribution performs a large-scale statistical study of French electricity measurements. In particular, we perform a unique study showing un-anonymized series’ high vulnerability against identification attacks. Our second contribution is a membership inference attack that finds every series forming an aggregate. This attack is ...
  • Access State: Open Access