Saltar la navegación

Agregadas y Preagregadas

Las tablas de Hechos Agregadas y Preagregadas se utilizan para almacenar un resumen de los datos, es decir, se guardan los datos en niveles de granularidad superior a los que inicialmente fueron obtenidos y/o gestionados.

Para generar tablas de Hechos Agregadas o Preagregadas, es necesario establecer un criterio con el cual realizar el resumen. Por ejemplo, esto ocurre cuando se desea obtener información de ventas sumarizadas por mes.

Cada vez que se requiere que los datos en una consulta se presenten en un nivel de granularidad superior al que se encuentran almacenados en el DW, se debe llevar a cabo un proceso de agregación.

El objetivo general de las tablas de Hechos Agregadas y Preagregadas es el mismo, pero cada una de ellas tiene una manera de operar diferente:

  • Tablas de Hechos Agregadas: se generan luego de que se procesa la consulta correspondiente a la tabla de Hechos que se resumirá. En muchos casos, estos resúmenes son utilizados por las herramientas de software de análisis de forma automática a fin de mejorar la respuesta.
  • Tablas de Hechos Preagregadas: se generan antes de que se procese la consulta correspondiente a la tabla de Hechos que se resumirá. De esta manera, la consulta se realiza contra una tabla que ya fue previamente agregada. Posee un nivel de granularidad menor al de la tabla de Hechos. Estos resúmenes deben generarse y almacenarse al momento de poblar/actualizar el DW, utilizando procesos ETL.

Más sobre las tablas de Hechos Preagregadas

Beneficios:

  • Reduce la utilización de recursos de hardware en la que se incurre en el momento de calcular las agregaciones.
  • Reduce el tiempo utilizado en la generación de consultas por parte de l@s usuari@s.
  • Son muy útiles en los siguientes casos generales:
  • Cuando los datos a nivel detalle (menor nivel granular) son innecesarios y/o NO son requeridos.
  • Cuando una consulta a determinado nivel de granularidad es solicitada con mucha frecuencia.
  • Cuando el volumen de datos es muy grande y las consultas demoran en ser procesadas.

Desventajas:

  • Requieren de la creación y mantenimiento de nuevos procesos ETL.
  • Requieren espacio de almacenamiento adicional en el DW.
  • Resulta complejo reconocer qué agregaciones son necesarias mantener en tablas.