Guardián de datos - Enciclopedia
Un guardián de datos es un rol de supervisión o gobernanza de datos dentro de una organización y se encarga de garantizar la calidad y la idoneidad para el propósito de los activos de datos de la organización, incluyendo los metadatos de esos activos de datos. Un guardián de datos puede compartir algunas responsabilidades con un guardián de datos, como la conciencia, el acceso, la liberación, el uso adecuado, la seguridad y la gestión de los datos. Un guardián de datos también participaría en el desarrollo e implementación de los activos de datos. Un guardián de datos podría buscar mejorar la calidad y la idoneidad para el propósito de otros activos de datos en los que su organización depende pero por los que no es responsable.
Los guardianes de datos tienen un rol especializado que utiliza los procesos, políticas, directrices y responsabilidades de gobernanza de datos de una organización para administrar todos los datos de la organización en cumplimiento con las obligaciones políticas y/o regulatorias. El objetivo general de un guardián de datos es la calidad de los activos de datos, los conjuntos de datos, los registros de datos y los elementos de datos. Esto incluye documentar metainformación para los datos, como definiciones, reglas/gobernanza relacionadas, manifestación física y modelos de datos relacionados (la mayoría de estas propiedades son específicas de una relación atributo/concepto), identificar las diversas responsabilidades de los propietarios/guardianes, insights sobre relaciones relacionadas con la calidad de los atributos, ayudar con la facilitación de datos de requerimientos de proyecto y la documentación de las reglas de captura.
Los guardianes de datos inician el proceso de guardianía con la identificación de los activos de datos y elementos que se encargarán de administrar, con el resultado final siendo estándares, controles e ingreso de datos. El guardián trabaja de cerca con analistas de estándares de glosario comercial (para estándares), con arquitectos/modeladores de datos (para estándares), con analistas de QD (para controles) y con miembros del equipo de operaciones (datos de alta calidad entrando según las reglas comerciales) mientras ingresa datos.
Los roles de guardianía de datos son comunes cuando las organizaciones intentan intercambiar datos de manera precisa y consistente entre sistemas informáticos y reutilizar recursos relacionados con datos. El manejo de datos maestros a menudo hace referencia a la necesidad de la guardianía de datos para que su implementación tenga éxito. La guardianía de datos debe tener un propósito preciso, idoneidad para el propósito o adecuación.
Responsabilidades del guardián de datos
Un guardián de datos asegura que cada elemento de datos asignado:
Tiene una definición de elemento de datos clara y no ambigua
No conflictúa con otros elementos de datos en el registro de metadatos (elimina duplicados, superposiciones, etc.)
Tiene definiciones de valores enumerados claras si es de tipo Código
Aún se utiliza (elimina elementos de datos no utilizados)
Se utiliza de manera consistente en varios sistemas informáticos
Se utiliza, idoneidad para el propósito = Idoneidad de datos
Tiene documentación adecuada sobre el uso adecuado y notas
Documenta la procedencia y las fuentes de autoridad de cada elemento de metadatos
Está protegido contra acceso o cambio no autorizados
Las responsabilidades de los guardianes de datos varían entre diferentes organizaciones e instituciones. Por ejemplo, en la Universidad Técnica de Delft, los guardianes de datos se perciben como el primer punto de contacto para cualquier pregunta relacionada con los datos de investigación. También tienen un fondo específico del área que les permite conectar fácilmente con los investigadores y contextualizar problemas de gestión de datos para tener en cuenta las prácticas disciplinarias.
Tipos de guardianes de datos
Dependiendo del conjunto de responsabilidades de guardianía de datos asignadas a un individuo, hay 4 tipos (o dimensiones de responsabilidad) de guardianes de datos que se encuentran típicamente dentro de una organización:
Guardián de datos de objeto - responsable de gestionar datos de referencia y atributos de una entidad de datos empresariales
Guardián de datos empresariales - responsable de gestionar datos críticos, tanto de referencia como transaccionales, creados o utilizados por una función empresarial. El guardián de datos también puede actuar como liaison entre los usuarios de datos de la organización y los equipos técnicos, ayudando a bridge el gap entre las necesidades empresariales y los requisitos técnicos. También pueden desempeñar un papel en educar a otros dentro de la organización sobre las mejores prácticas de gestión de datos y en abogar por la toma de decisiones basada en datos.
Guardián de datos de proceso - responsable de gestionar datos a través de un proceso empresarial
Guardián de datos de sistema - responsable de gestionar datos para al menos un sistema de TI
Beneficios de la guardianía de datos
Una gestión de datos sistemática puede fomentar:
Análisis más rápidos
Uso consistente de recursos de gestión de datos
Facilidad en el mapeo de datos entre sistemas informáticos y documentos de intercambio
Reducción de costos asociados con la migración a (por ejemplo) Arquitectura Orientada a Servicios (SOA)
Mitigación de riesgos de datos
Mejor control de los peligros asociados con la privacidad, la legalidad, los errores, etc.
Asignación de cada elemento de datos a una persona a veces parece ser un proceso sin importancia. Pero múltiples grupos han encontrado que los usuarios tienen mayor confianza y tasas de uso en sistemas donde pueden contactar a una persona con preguntas sobre cada elemento de datos.
Ejemplos
La Universidad Técnica de Delft (TU Delft) ofrece un ejemplo de implementación de la guardianía de datos en una institución de investigación. En 2017, se inició el Proyecto de Guardianía de Datos en TU Delft para abordar las necesidades de gestión de datos de investigación de manera disciplinaria en todo el campus. Se nombraron guardianes de datos dedicados con un fondo específico del área en cada facultad de TU Delft para apoyar a los investigadores con preguntas de gestión de datos y actuar como punto de enlace con otros servicios de apoyo institucionales. El proyecto se coordina centralmente por la Biblioteca de TU Delft y tiene su propio sitio web, blog y canal de YouTube.
El registro de metadatos de la [1]EPA ofrece un ejemplo de la guardianía de datos. Note que cada elemento de datos therein tiene un "POC" (punto de contacto).
En 2023, la ETH Zurich lanzó la Red de Guardianía de Datos (DSN) para facilitar la colaboración entre empleados involucrados en la gestión, análisis y desarrollo de código en grupos de investigación. La DSN actúa como una plataforma para la red y el intercambio de conocimientos, con el objetivo de profesionalizar el rol de los guardianes de datos que apoyan la gestión de datos de investigación y flujos de trabajo reproducibles. Fundada por el equipo de Gestión de Datos de Investigación y Curación Digital en la Biblioteca de ETH, la DSN colabora con los Servicios Técnicos Científicos para proporcionar experiencia en áreas como la infraestructura de almacenamiento y flujos de trabajo reproducibles.
Aplicaciones de la guardianía de datos
Está emergiendo un nuevo mercado para aplicaciones de gobernanza de datos, en el que tanto el personal técnico como el comercial (guardianes) gestionan políticas. Estas nuevas aplicaciones, como las generaciones anteriores, ofrecen una capacidad robusta de glosario comercial, pero no se detienen allí.
Las aplicaciones de gestión de información son soluciones empresariales utilizadas por usuarios comerciales actuando en el rol de guardián de información (interpretando y aplicando políticas de gobernanza de información, por ejemplo). Estas soluciones en desarrollo representan, en su mayoría, una amalgama de una serie de herramientas dispares ya disponibles en el mercado centradas en TI, pero organizadas y presentadas de manera que los guardianes de información (un rol comercial) puedan apoyar la aplicación de políticas de información como parte de su trabajo normal, centrado en el negocio, en una variedad de casos de uso.
El impulso inicial para la formación de esta nueva categoría de software empacado vino de casos de uso operativos, es decir, el uso de datos comerciales en y entre aplicaciones comerciales transaccionales y operativas. Es aquí donde se realizan la mayoría de los esfuerzos de gestión de datos maestros en las organizaciones. Sin embargo, también hay un interés creciente en el nuevo campo de los pozos de datos para casos de uso más analíticos.
Ver también
Metadatos
Registro de metadatos
Curación de datos
Elemento de datos
Definición de elemento de datos
Gobernanza de datos
Término de representación
ISO/IEC 11179
Referencias
Leer más
Plotkin, David (31 October 2020). Data Stewardship: An Actionable Guide to Effective Data Management and Data Governance (2 ed.). Morgan Kaufmann. ISBN 978-0128221327. OCLC 1197764106.
Smallwood, Robert F. (2019). Information governance : concepts, strategies and best practices (2 ed.). John Wiley and Sons, inc. ISBN 9781119491446. OCLC 1097466578.
Marco, David; Jennings, Michael (2004). Universal Meta Data Models. Wiley. pp. 93–94. ISBN 9780471081777. OCLC 54978224.
Solución de metadatos por Adrinne Tannenbaum, Addison Wesley, 2002, página 412
Building and Managing the Meta Data Repository, por David Marco, Wiley, 2000, páginas 61–62
The Data Warehouse Lifecycle Toolkit, por Ralph Kimball et. al., Wiley, 1998, también menciona brevemente el rol del guardián de datos en el contexto de la gestión de proyectos de almacén de datos en la página 70.
Developing Geospatial Intelligence Stewardship for Multinational Operations, por Jeff Thomas, US Army Command General Staff College, 2010, www.dtic.mil/dtic/tr/fulltext/u2/a524227.pdf.