Performance
En el momento de diseñar los procesos de Integración de Datos, el enfoque NO debe estar centrado en solucionar el problema en el menor tiempo posible.
Los procesos de Integración de Datos insumen gran esfuerzo de construcción ya que deben ser, eficaces y eficientes desde el inicio; esto se debe a que con el transcurrir del tiempo se manejará un gran volumen de datos, ergo, el espacio en disco se tornará un recurso fundamental y los tiempos de procesamiento y acceso a los datos serán esenciales, y más aún si el DW es tomado como un sistema de misión crítica.
Resulta fundamental, entonces, la correcta selección y configuración del SGBD que dará soporte al DW, y la elección de las mejores estrategias para modelar las estructuras de datos.
En cuanto a la configuración del SGBD, los puntos más importantes a tener en cuenta son:
- Configuración y asignación de Buffers Caché
- Indexación
- Algoritmos de acceso
- Particionamiento
- Distribución
Para mejorar la performance del DW, se deben considerar las siguientes acciones:
- Seleccionar cuidadosamente los tipos de datos, por ejemplo, para valores enteros pequeños conviene utilizar tinyint o smallint en lugar de int, con el fin de NO desperdiciar espacio. Esto toma vital importancia cuando se aplica en las claves primarias, debido a que formarán parte de la tabla de Hechos que es la que conforma el volumen del DW, además de que toda clave primaria tiene asociado un índice que la implementa.
- Utilizar Claves Subrogadas.
- Utilizar técnicas de indexación.
- Utilizar técnicas de particionamiento.
- Crear diferentes niveles de agregación.
- Utilizar técnicas de administración de datos en memoria Caché.
- Utilizar distribución de datos.
- Utilizar técnicas de multiprocesamiento distribuido, con el objetivo de agilizar la obtención de resultados, a través de la realización de procesos en forma concurrente.
Obra publicada con Licencia Creative Commons Reconocimiento No comercial Sin obra derivada 4.0