Integrada
La integración implica que todos los datos provenientes de orígenes heterogéneos deben ser analizados a fin de asegurar su calidad y limpieza para luego ser consolidados en el DW. El proceso que permite esta consolidación, se denomina Integración de Datos, y cuenta con diversas técnicas y subprocesos para llevar a cabo sus tareas. Una de estas técnicas es el proceso ETL: Extracción, Transformación y Carga de datos (Extraction, Transformation and Load).
A continuación se describirán los orígenes de datos más comunes:
- Producidas por tipos de usuari@s:
- Operacional: produce datos diariamente, en gran cantidad, muchos de los cuales son poco relevantes para el análisis por sí mismos, y la granularidad de estos datos es muy fina. Por ejemplo cuando se registran ventas de productos.
- Medio: utiliza los datos operacionales para producir otros datos nuevos que tienen implicancia a corto/medio plazo. Por ejemplo, un control de stock, requerirá una o varias compras a fin de realizar el abastecimiento.
- Gerencial: utiliza datos altamente procesados. En general, este perfil de usuari@ será el destinatario del DW, siempre produce una retroalimentación que permite generar nueva información para el análisis.
- Producidas por áreas o departamentos de la organización:
- Las organizaciones se subdividen en áreas con responsabilidades bien definidas y diferentes. Cada una de estas áreas produce sus propios datos; éstos serán compartidos con otras áreas.
- Las subdivisiones suelen ser geográficas, este tipo de división produce nuevos datos que deben ser incorporados. Por ejemplo: localización, cotizaciones, tipos de cambio, etc.
- Producidas por diferentes data sources:
- Fuentes internas: datos que genera la empresa en sus actividades diarias.
- Fuentes externas: datos que complementan y suplementan los datos internos. Por ejemplo: datos climáticos, análisis de tendencia, estadísticas, censos, etc.
Obra publicada con Licencia Creative Commons Reconocimiento No comercial Sin obra derivada 4.0