4.2) Actualización
Cuando se haya ejecutado la carga inicial del DW, se deben establecer las políticas y estrategias de actualización periódica.
Entonces, se deben llevar a cabo las siguientes acciones:
- Determinar el proceso de limpieza de datos y calidad de datos, definir los procesos ETL, etc., que deberán realizarse para actualizar los datos del DW.
- Especificar de forma general y detallada las acciones que deberá realizar cada Software.
Caso práctico
Las políticas de Actualización que se han convenido con l@s usuari@s son las siguientes:
- La información se refrescará: todos los días a las 00:00hs.
- Los datos de las tablas de Dimensiones dimProductos y dimClientes serán cargados siempre en su totalidad.
- Los datos de la tabla de Dimensión dimFechas se cargarán de forma incremental teniendo en cuenta la fecha de la última actualización.
- Los datos de la tabla de Hechos factVentas que corresponden al último mes (30 días) a partir de la fecha actual, serán reemplazados cada vez.
- Estas acciones se realizarán durante un período de prueba, para analizar cuál es la manera más eficiente de generar las actualizaciones, basadas en el estudio de los cambios que se producen en los Data Sources y que afectan al contenido del DW.
Para evitar que se extienda demasiado la aplicación del ejemplo, el caso práctico solo incluirá lo que debería realizar el proceso ETL para actualizar el DW.
El proceso ETL para la actualización del DW es similar al de Carga Inicial, con las siguientes diferencias:
- Inicio: iniciará la ejecución de los pasos todos los días a las doce de la noche.
- Establecer variables Fecha_Desde y Fecha_Hasta:
- La variable Fecha_Desde obtendrá el valor resultante de restarle a la fecha actual treinta días.
- La variable Fecha_Hasta obtendrá el valor de la fecha actual.
- Carga de Dimensión dimClientes: a la serie de pasos que realiza esta tarea, se le antepondrá un nuevo paso que borrará los datos que contenga la Dimensión dimClientes.
- Carga de Dimensión dimProductos: a la serie de pasos que realiza esta tarea, se le antepondrá un nuevo paso que borrará los datos que contenga la Dimensión dimProductos.
- Carga de Dimensión dimFechas: en este paso, se establecerá la variable Fecha_Desde, tomando la fecha del último registro cargado en la Dimensión dimFechas.
- Carga de Tabla de Hechos factVentas:
- a la serie de pasos que realiza esta tarea, se le antepondrá un nuevo paso que borrará los datos que contenga la tabla de Hechos factVentas en el intérvalo entre Fecha_Desde y Fecha_Hasta.
- en el paso Obtener datos de Datasource se modificará la sentencia SQL agregando la siguiente condición:
- WHERE Facturas_Venta.Fecha >= {Fecha_Desde} AND Facturas_Venta.Fecha <= {Fecha_Hasta}
Obra publicada con Licencia Creative Commons Reconocimiento No comercial Sin obra derivada 4.0