Este documento presenta Corr-RR, un mecanismo novedoso de dos fases para la estimación de frecuencia bajo Privacidad Diferencial Local (LDP) que aprovecha las correlaciones entre atributos para mejorar la utilidad. A diferencia de los métodos tradicionales de LDP que o bien reparten el presupuesto de privacidad entre todos los atributos o tratan cada atributo de manera independiente, Corr-RR concentra el presupuesto de privacidad completo en un solo atributo elegido aleatoriamente por usuario y infiere los atributos restantes utilizando un esquema de respuesta aleatoria con conocimiento de correlaciones. Este enfoque permite mejorar la utilidad sin incurrir en costos adicionales de privacidad.
### Contribuciones Clave:
1. **Primer Marco de LDP con Conocimiento de Correlaciones**: Este documento introduce el primer marco de LDP que explícitamente aprovecha las correlaciones entre atributos para mejorar la precisión de la estimación en análisis de frecuencia multi-atributo.
2. **Instanciación Concreta: Corr-RR**: Corr-RR es un mecanismo novedoso que satisface la privacidad diferencial local y mejora la utilidad en la recopilación de datos multi-atributo. Se selecciona aleatoriamente un atributo y se perturba utilizando el presupuesto de privacidad completo, mientras que los atributos restantes se sintetizan utilizando una transformación probabilística basada en correlaciones aprendidas.
3. **Garantías de Privacidad Probables**: Corr-RR se demuestra formalmente que satisface la privacidad diferencial local ϵ en el entorno multi-atributo.
4. **Evaluación Completa**: Experimentos en conjuntos de datos sintéticos y de mundo real demuestran que Corr-RR consistently outperforms los mecanismos de LDP más avanzados, especialmente en escenarios con muchos atributos y fuertes correlaciones entre atributos.
### Marco de Dos Fases:
1. **Fase I: Aprendizaje de Dependencias**: Un pequeño subconjunto de usuarios perturba todos los atributos de manera independiente utilizando un mecanismo de LDP estándar como Split Budget (SPL). El servidor luego agrega estos informes ruidosos para aprender dependencias inter-atributo aproximadas sin violar las garantías de LDP.
2. **Fase II: Recopilación con Conocimiento de Correlaciones**: Cada usuario restante selecciona aleatoriamente un atributo para perturbar utilizando el presupuesto de privacidad completo. Los atributos no seleccionados se infieren utilizando las correlaciones inter-atributo aprendidas.
### Ventajas de Corr-RR:
* **Mejora de la Utilidad**: Corr-RR aprovecha las correlaciones entre atributos para mejorar la precisión de la estimación, resultando en una mejor utilidad en comparación con los métodos de LDP tradicionales.
* **Escalabilidad**: Corr-RR se escala bien con el número de atributos, haciendo que sea adecuado para conjuntos de datos de alta dimensionalidad.
* **Preservación de Privacidad**: Corr-RR satisface la privacidad diferencial local ϵ, asegurando fuertes garantías de privacidad.
### Conclusión:
Corr-RR es un enfoque prometedor para la estimación de frecuencia bajo LDP que aprovecha las correlaciones entre atributos para mejorar la utilidad mientras preserva la privacidad. Los resultados experimentales demuestran su efectividad y utilidad práctica en diversas situaciones.