Zusammenfassung - Frequenzschätzung korrelierter Multiattributdaten unter lokaler Differential Privatsphäre

Titel
Frequenzschätzung korrelierter Multiattributdaten unter lokaler Differential Privatsphäre

Zeit
2025-07-23 13:52:45

Autor
{"Shafizur Rahman Seeam","Ye Zheng","Yidan Hu"}

Kategorie
{cs.CR}

Link
http://arxiv.org/abs/2507.17516v1

PDF Link
http://arxiv.org/pdf/2507.17516v1

Zusammenfassung

Dieses Papier stellt Corr-RR, ein neues zweiphasiges Mechanismus für Frequenzschätzung unter lokaler Differential-Privatsphäre (LDP) vor, das inter-attributäre Korrelationen nutzt, um die Nutzbarkeit zu verbessern. Im Gegensatz zu traditionellen LDP-Methoden, die entweder das Privatsphärebudget über alle Attribute aufteilen oder jedes Attribut unabhängig behandeln, konzentriert sich Corr-RR den vollständigen Privatsphärenbudget auf ein einziges zufällig gewähltes Attribut pro Benutzer und schätzt die verbleibenden Attribute mithilfe eines korrelationsbewussten zufälligen Antwortmechanismus. Dieser Ansatz ermöglicht eine verbesserte Nutzbarkeit ohne zusätzliche Privatsphärenkosten in Kauf zu nehmen. ### Hauptbeiträge: 1. **Erster Korrelationsbewusster LDP-Framework**: Dieses Papier stellt den ersten LDP-Framework vor, der explizit inter-attributäre Korrelationen nutzt, um die Schätzungsgenauigkeit in der Mehrattributfrequenzanalyse zu verbessern. 2. **Konkretes Instantiieren: Corr-RR**: Corr-RR ist ein neuer Mechanismus, der lokale Differential-Privatsphäre erfüllt und die Nutzbarkeit in der Mehrattributdatenbeschaffung verbessert. Er wählt zufällig ein Attribut aus und stört es mithilfe des vollständigen Privatsphärenbudgets, während die verbleibenden Attribute mithilfe einer auf gelernten Korrelationen basierenden wahrscheinlichkeitstheoretischen Transformation synthetisiert werden. 3. **Formelle Privatsphärengarantien**: Corr-RR ist formell bewiesen, um ϵ-lokale Differential-Privatsphäre im Mehrattributsetting zu erfüllen. 4. **Komplette Bewertung**: Experimente sowohl auf synthetischen als auch realen Datensätzen zeigen, dass Corr-RR durchgehend die besten LDP-Mechanismen übertrifft, insbesondere in Szenarien mit vielen Attributen und starken inter-attributären Korrelationen. ### Zweiphasen-Framework: 1. **Phase I: Abhängigkeitslernen**: Eine kleine Benutzergruppe stört alle Attribute unabhängig mithilfe eines Standards LDP-Mechanismus wie Split Budget (SPL). Der Server aggregiert diese gestörten Berichte dann, um approximate inter-attributäre Abhängigkeiten zu lernen, ohne die LDP-Garantien zu verletzen. 2. **Phase II: Korrelationsbewusste Sammlung**: Jeder verbleibende Benutzer wählt zufällig ein Attribut aus, um es mithilfe des vollständigen Privatsphärenbudgets zu stören. Die verbleibenden nicht ausgewählten Attribute werden dann mithilfe der gelernten inter-attributären Korrelationen geschätzt. ### Vorteile von Corr-RR: * **Verbesserte Nutzbarkeit**: Corr-RR nutzt inter-attributäre Korrelationen, um die Schätzungsgenauigkeit zu verbessern und führt zu einer besseren Nutzbarkeit im Vergleich zu traditionellen LDP-Methoden. * **Skalierbarkeit**: Corr-RR skaliert gut mit der Anzahl der Attribute und ist daher für hochdimensionale Datensätze geeignet. * **Privatsphärenbewahrung**: Corr-RR erfüllt ϵ-lokale Differential-Privatsphäre und stellt starke Privatsphärengarantien sicher. ### Schlussfolgerung: Corr-RR ist ein vielversprechender Ansatz für Frequenzschätzung unter LDP, der inter-attributäre Korrelationen nutzt, um die Nutzbarkeit zu verbessern und gleichzeitig die Privatsphäre zu wahren. Die experimentellen Ergebnisse demonstrate seine Effektivität und praktische Nutzbarkeit in verschiedenen Szenarien.


Empfohlene Papiere

Erste Ordnungs-Contинуum-Modelle für nichtlineare dispersible Wellen in der Granularkristallgitterstruktur

Nahezu schnelle rechnerische tiefe thermische Entropie (Fast computational deep thermalization)

Verbesserte Aufwachzeit für das Euclidische Freezing-Tag-Problem

Über die Wechselwirkung von Kompressibilität und adversärischer Robustheit

Eine kosmische Amplifikation für die Muon-zu-Positron-Conversion in Nukeln

Oberste erwartete Treffenzeiten für abhängige stochastische Akteure

TyDi QA-WANA: Ein Benchmark für Informationssuch-Question-Answering in Sprachen des Westasiens und Nordafrikas

Fristenbewusste gemeinsame Aufgabenplanung und Offloading in mobilen Edge-Computing-Systemen

Entwerfen von leistungsfähigen und thermisch machbaren Multi-Chiplet-Architekturen, ermöglicht durch nicht biegsame Glas-Interposern

Ein semi-empirischer Descriptor für die Offene-Kreis-Spannung