perforación de datos - Enciclopedia

El sondeo de datos (también conocido como drilldown) se refiere a cualquier una de varias operaciones y transformaciones sobre datos tabulares, relacionales y multidimensionales. El término se utiliza de manera generalizada en diversos contextos, pero está principalmente asociado con software especializado diseñado específicamente para análisis de datos.


Operaciones comunes de sondeo de datos
Hay ciertas operaciones que son comunes en aplicaciones que permiten el sondeo de datos. Entre ellas se incluyen:
Operaciones de consulta:

consulta tabular
consulta pivote


= Consulta tabular =
Las operaciones de consulta tabular consisten en operaciones estándar en tablas de datos. Entre estas operaciones se incluyen:

búsqueda
ordenación
filtrado (por valor)
filtrado (por función extendida o condición)
transformación (por ejemplo, agregando o eliminando columnas)
Consideremos el siguiente ejemplo:
Tabla de Fred y Wilma (Figura 001):

género, nombre, apellido, país
masculino, fred, chopin, Polonia
masculino, fred, flintstone, bedrock
masculino, fred, durst, usa
femenino, wilma, flintstone, bedrock
femenino, wilma, rudolph, usa
femenino, wilma, webb, usa
masculino, fred, johnson, usa

Lo anterior es un ejemplo de una tabla plana en formato de valores separados por comas. La tabla incluye nombre, apellido, género y país de varias personas llamadas fred o wilma. Aunque el ejemplo está formateado de esta manera, es importante subrayar que las operaciones de consulta tabular (así como todas las operaciones de sondeo de datos) pueden aplicarse a cualquier tipo de datos concebible, independientemente del formato subyacente. La única condición es que los datos sean legibles para la aplicación de software en uso.


= Consulta pivote =
Una consulta pivote permite múltiples representaciones de datos según diferentes dimensiones. Este tipo de consulta es similar a la consulta tabular, excepto que también permite representar los datos en formato resumen, según una jerarquía flexible seleccionada por el usuario. Este tipo de operación de sondeo de datos es formalmente y de manera imprecisa conocida por diferentes nombres, incluyendo consulta en cuadrante, tabla pivote, data pilot, jerarquía selectiva, intertwingularity y otros.
Para ilustrar los principios básicos de las operaciones de consulta pivote, consideremos la tabla de Fred y Wilma (Figura 001). Un rápido análisis de los datos revela que la tabla tiene información redundante. Esta redundancia podría consolidarse utilizando un esquema o una estructura en árbol o de alguna otra manera. Además, una vez consolidada, los datos podrían tener muchos diferentes formatos alternativos.
Utilizando un simple esquema de texto como salida, los siguientes formatos alternativos son todos posibles con una consulta pivote:
Resumir por género (Figura 001):

femenino
flintstone, wilma
rudolph, wilma
webb, wilma
masculino
chopin, fred
flintstone, fred
durst, fred
johnson, fred

(Dimensiones = género; Campos tabulares = apellido, nombre;)

Resumir por país, apellido (Figura 001):

bedrock
flintstone
fred
wilma
Polonia
chopin
fred
usa
...

(Dimensiones = país, apellido; Campos tabulares = nombre;)


Usos
Las operaciones de consulta pivote son útiles para resumir un conjunto de datos de múltiples maneras, ilustrando diferentes representaciones de la misma información básica. Aunque este tipo de operación es prominente en las hojas de cálculo y el software de bases de datos de escritorio, su flexibilidad es, con razón, subutilizada. Hay muchas aplicaciones que permiten solo una jerarquía 'fija' para representar datos, lo que representa una limitación sustancial.


Subida =
La subida (drillup) es lo opuesto al sondeo (drilldown). Por ejemplo, si realiza un sondeo para ver los ingresos de un producto, es posible que desee subir para ver los ingresos de todos los productos.


Referencias