Resumen - Estimación de Frecuencia de Datos Multietapa Correlacionados bajo Privacidad Diferencial Local

Título

Estimación de Frecuencia de Datos Multietapa Correlacionados bajo Privacidad Diferencial Local

Tiempo

2025-07-23 13:52:45

Autor

{"Shafizur Rahman Seeam","Ye Zheng","Yidan Hu"}

Categoría

{cs.CR}

Enlace
http://arxiv.org/abs/2507.17516v1

PDF Enlace
http://arxiv.org/pdf/2507.17516v1

Resumen

Este documento presenta Corr-RR, un mecanismo novedoso de dos fases para la estimación de frecuencia bajo Privacidad Diferencial Local (LDP) que aprovecha las correlaciones entre atributos para mejorar la utilidad. A diferencia de los métodos tradicionales de LDP que o bien reparten el presupuesto de privacidad entre todos los atributos o tratan cada atributo de manera independiente, Corr-RR concentra el presupuesto de privacidad completo en un solo atributo elegido aleatoriamente por usuario y infiere los atributos restantes utilizando un esquema de respuesta aleatoria con conocimiento de correlaciones. Este enfoque permite mejorar la utilidad sin incurrir en costos adicionales de privacidad. ### Contribuciones Clave: 1. **Primer Marco de LDP con Conocimiento de Correlaciones**: Este documento introduce el primer marco de LDP que explícitamente aprovecha las correlaciones entre atributos para mejorar la precisión de la estimación en análisis de frecuencia multi-atributo. 2. **Instanciación Concreta: Corr-RR**: Corr-RR es un mecanismo novedoso que satisface la privacidad diferencial local y mejora la utilidad en la recopilación de datos multi-atributo. Se selecciona aleatoriamente un atributo y se perturba utilizando el presupuesto de privacidad completo, mientras que los atributos restantes se sintetizan utilizando una transformación probabilística basada en correlaciones aprendidas. 3. **Garantías de Privacidad Probables**: Corr-RR se demuestra formalmente que satisface la privacidad diferencial local ϵ en el entorno multi-atributo. 4. **Evaluación Completa**: Experimentos en conjuntos de datos sintéticos y de mundo real demuestran que Corr-RR consistently outperforms los mecanismos de LDP más avanzados, especialmente en escenarios con muchos atributos y fuertes correlaciones entre atributos. ### Marco de Dos Fases: 1. **Fase I: Aprendizaje de Dependencias**: Un pequeño subconjunto de usuarios perturba todos los atributos de manera independiente utilizando un mecanismo de LDP estándar como Split Budget (SPL). El servidor luego agrega estos informes ruidosos para aprender dependencias inter-atributo aproximadas sin violar las garantías de LDP. 2. **Fase II: Recopilación con Conocimiento de Correlaciones**: Cada usuario restante selecciona aleatoriamente un atributo para perturbar utilizando el presupuesto de privacidad completo. Los atributos no seleccionados se infieren utilizando las correlaciones inter-atributo aprendidas. ### Ventajas de Corr-RR: * **Mejora de la Utilidad**: Corr-RR aprovecha las correlaciones entre atributos para mejorar la precisión de la estimación, resultando en una mejor utilidad en comparación con los métodos de LDP tradicionales. * **Escalabilidad**: Corr-RR se escala bien con el número de atributos, haciendo que sea adecuado para conjuntos de datos de alta dimensionalidad. * **Preservación de Privacidad**: Corr-RR satisface la privacidad diferencial local ϵ, asegurando fuertes garantías de privacidad. ### Conclusión: Corr-RR es un enfoque prometedor para la estimación de frecuencia bajo LDP que aprovecha las correlaciones entre atributos para mejorar la utilidad mientras preserva la privacidad. Los resultados experimentales demuestran su efectividad y utilidad práctica en diversas situaciones.

Artículos Recomendados

Problemas de coloreo de bordes con patrones prohibidos y colores plantados

Efectos de la optimización de la matriz de densidad reducida de un partícula en los solucionadores cuánticos variacionales de autovectores

Reducción Tukey generalizada entre conjuntos directos $\sigma$-dirigidos

Un método de descenso de gradiente fraccional de Caputo adaptativo para problemas de optimización multiobjetivo

RADAR: Análisis basado en radio para la asociación dinámica y reconocimiento de pseudónimos en VANETs

Clasificando anillos integrales de Grothendieck hasta el rango 5 y más allá

Predicción conformal condicional por clasificación para múltiples entradas mediante agregación de valores p

La álgebra de Jacobi de rango dos

Condiciones de salto Rankine-Hugoniot-MHD para ondas de choque en gases de van der Waals

Marco de Espacio Fase para Redes Neurales Ópticas Cuánticas de Escala Intermedia Ruidosas