Claves Subrogadas
Las claves existentes en los Data Sources se denominan claves naturales; en cambio, las claves subrogadas son aquellas que se definen artificialmente:
- son de tipo numérico secuencial,
- NO tienen relación directa con ningún dato y
- NO poseen ningún significado en especial.
Lo anterior, es solo una de las razones por las cuales utilizar claves subrogadas en el DW, pero se pueden definir una serie de ventajas más:
- Ocupan menos espacio y son más performantes que las tradicionales claves naturales, y más aún si estas últimas son de tipo texto.
- Son de tipo numérico entero (autonumérico o secuencial).
- Permiten que la construcción y mantenimiento de índices sea una tarea sencilla.
- El Data Warehouse NO dependerá de la codificación interna de los Data Sources.
- Si se modifica el valor de una clave en el Data Source, el DW lo tomará como un nuevo elemento, permitiendo de esta manera, almacenar diferentes versiones del mismo dato.
- Permiten la correcta aplicación de técnicas SCD (Dimensiones lentamente cambiantes).
Esta clave subrogada debe ser el único campo que sea clave principal de cada tabla de Dimensión.
Una forma de implementación sería, a través de la utilización de herramientas ETL, mantener una tabla que contenga la clave primaria de la tabla del Data Source y la clave subrogada correspondiente a la Dimensión del DW.
En la tabla de Dimensión Tiempo, es conveniente hacer una excepción y mantener un formato tal como yyyymmdd, ya que esto provee dos grandes beneficios:
- Se simplifican los procesos ETL.
- Brinda la posibilidad de realizar particiones de la tabla de Hechos a través de ese campo.
Obra publicada con Licencia Creative Commons Reconocimiento No comercial Sin obra derivada 4.0