Résumé - Estimation de la fréquence des données multi-attributs corrélées sous la protection de la confidentialité différentielle locale

Titre
Estimation de la fréquence des données multi-attributs corrélées sous la protection de la confidentialité différentielle locale

Temps
2025-07-23 13:52:45

Auteur
{"Shafizur Rahman Seeam","Ye Zheng","Yidan Hu"}

Catégorie
{cs.CR}

Lien
http://arxiv.org/abs/2507.17516v1

PDF Lien
http://arxiv.org/pdf/2507.17516v1

Résumé

Ce document présente Corr-RR, un mécanisme novateur en deux phases pour l'estimation de la fréquence sous la protection de la vie privée locale (LDP) qui utilise les corrélations inter-attributs pour améliorer l'utilité. Contrairement aux méthodes traditionnelles de LDP qui répartissent soit le budget de confidentialité sur tous les attributs, soit traitent chaque attribut indépendamment, Corr-RR concentre le budget de confidentialité complet sur un seul attribut choisi au hasard par utilisateur et infère les autres attributs en utilisant un schéma de réponse aléatoire informé des corrélations. Cette approche permet d'améliorer l'utilité sans engendrer de coût supplémentaire en matière de confidentialité. ### Contributions Clés : 1. **Premier Cadre LDP Informé des Corrélations** : Ce document introduit le premier cadre LDP qui exploite explicitement les corrélations inter-attributs pour améliorer l'exactitude de l'estimation dans l'analyse de fréquence multi-attributs. 2. **Instantiation Concrète : Corr-RR** : Corr-RR est un mécanisme novateur qui satisfait la vie privée locale différentielle et améliore l'utilité dans la collecte de données multi-attributs. Il sélectionne aléatoirement un attribut et le perturbe en utilisant le budget de confidentialité complet, tout en synthétisant les autres attributs à l'aide d'une transformation probabiliste basée sur les corrélations apprise. 3. **Garanties de Confidentialité Prouvées** : Corr-RR est formellement prouvé satisfaisant la vie privée locale différentielle ϵ dans le cadre multi-attributs. 4. **Évaluation Complète** : Des expériences sur des ensembles de données synthétiques et réels montrent que Corr-RR outperforme constamment les mécanismes LDP les plus avancés, en particulier dans des scénarios avec de nombreux attributs et des corrélations inter-attributs fortes. ### Cadre en Deux Phases : 1. **Phase I : Apprentissage des Dépendances** : Un petit sous-ensemble d'utilisateurs perturbe tous les attributs indépendamment à l'aide d'un mécanisme de LDP standard comme le Budget de Séparation (SPL). Le serveur agrège ensuite ces rapports bruts pour apprendre les dépendances inter-attributs approximatives sans violer les garanties de LDP. 2. **Phase II : Collecte Informée des Corrélations** : Chaque utilisateur restant sélectionne aléatoirement un attribut à perturber en utilisant le budget de confidentialité complet. Les attributs restants non sélectionnés sont ensuite inférés à l'aide des corrélations inter-attributs appris. ### Avantages de Corr-RR : * **Amélioration de l'Utilité** : Corr-RR utilise les corrélations inter-attributs pour améliorer l'exactitude de l'estimation, ce qui permet une meilleure utilité par rapport aux méthodes LDP traditionnelles. * **Échelle** : Corr-RR est bien échelable avec le nombre d'attributs, ce qui le rend adapté aux ensembles de données à haute dimensionnalité. * **Protection de la Confidentialité** : Corr-RR satisfait la vie privée locale différentielle ϵ, assurant fortes garanties de confidentialité. ### Conclusion : Corr-RR est une approche prometteuse pour l'estimation de la fréquence sous LDP qui utilise les corrélations inter-attributs pour améliorer l'utilité tout en préservant la confidentialité. Les résultats expérimentaux démontrent son efficacité et son utilité pratique dans divers scénarios.


Articles Recommandés

KMT-2024-BLG-0404L : Un système de microlentille triple composé d'une étoile, d'un nain brune et d'une planète

Radiation de Cherenkov chiral à potentiel chimique chirale dépendant du temps

Inégalité de Fenchel-Willmore pour les sous-variétés dans des variétés avec une courbure de Ricci $k$-non-négative

Complexité en circuit monotone de la correspondance

Bootstrapping du point critique quantique le plus simple déconfiné

Modules interferométriques monolithiques pour positionnement de coordonnées multi-axes avec une précision de quelques nanomètres

Critères simples pour les singularités rationnelles supérieures

VisionThink : Modèle de langage visuel intelligent et efficace par apprentissage par renforcement

Découverte manquante en physique grâce à l'apprentissage automatique basé sur des éléments finis à différentiabilité complète

Observation du décalage de bord induit par la supraconductivité dans les films minces de $\mathrm{La}_{3}\mathrm{Ni}_{2}\mathrm{O}_{7}$ dopés au strontium