Saltar la navegación

Integrada

La integración implica que todos los datos provenientes de orígenes heterogéneos deben ser analizados a fin de asegurar su calidad y limpieza para luego ser consolidados en el DW. El proceso que permite esta consolidación, se denomina Integración de Datos, y cuenta con diversas técnicas y subprocesos para llevar a cabo sus tareas. Una de estas técnicas es el proceso ETL: Extracción, Transformación y Carga de datos (Extraction, Transformation and Load).

A continuación se describirán los orígenes de datos más comunes:

  • Producidas por tipos de usuari@s:
    • Operacional: produce datos diariamente, en gran cantidad, muchos de los cuales son poco relevantes para el análisis por sí mismos, y la granularidad de estos datos es muy fina. Por ejemplo cuando se registran ventas de productos.
    • Medio: utiliza los datos operacionales para producir otros datos nuevos que tienen implicancia a corto/medio plazo. Por ejemplo, un control de stock, requerirá una o varias compras a fin de realizar el abastecimiento.
    • Gerencial: utiliza datos altamente procesados. En general, este perfil de usuari@ será el destinatario del DW, siempre produce una retroalimentación que permite generar nueva información para el análisis.

  • Producidas por áreas o departamentos de la organización:
    • Las organizaciones se subdividen en áreas con responsabilidades bien definidas y diferentes. Cada una de estas áreas produce sus propios datos; éstos serán compartidos con otras áreas.
    • Las subdivisiones suelen ser geográficas, este tipo de división produce nuevos datos que deben ser incorporados. Por ejemplo: localización, cotizaciones, tipos de cambio, etc.

  • Producidas por diferentes data sources:
    • Fuentes internas: datos que genera la empresa en sus actividades diarias.
    • Fuentes externas: datos que complementan y suplementan los datos internos. Por ejemplo: datos climáticos, análisis de tendencia, estadísticas, censos, etc.