Introducción al área de Modelado, DWH, Business Intelligence

El Gobierno del DATO abarca una amplia cantidad de perspectivas, desde la arquitectura, operación y gestión de las BBDD, pasando por la seguridad y la calidad de los DATOS y llegando hasta las verdaderas preguntas a las que nos gustaría que diesen respuesta esos DATOS.

En nuestra área de Modelado, Almacenamiento o “DataWareHouse” y Business Intelligence nos centramos precisamente en las preguntas y respuestas que requiere nuestro Negocio.

Tenemos conocimiento de la Infraestructura y la operación de BBDD, pero en una capa de Gobierno, como también sabemos de los distintos tipos de datos que se emplean en nuestros proyectos, la privacidad que deben respetar, su calidad y la gestión de la seguridad y ciclo de vida, desde una visión de Gobierno.

Nosotros no entramos a gestionar estos aspectos, aunque son muy importantes en el resultado final de nuestro trabajo.

De nuevo dentro de nuestra área de influencia, también hay distintas aproximaciones, lógicamente atendiendo al DMBok: 

  • Teniendo en cuenta el método a emplear, Modelos en Estrella idealmente.
  • Las distintas tecnologías, local, nube o mixta, almacenes físicos o lógicos de datos.
  • Y por supuesto las distintas Herramientas, PowerBI, Tableau, Clik, etc.

Considero “el arte” de Modelar el cimiento sobre el cual edificamos toda la estrategia de DATOS. Por este motivo y a modo de introducción entramos con algo más de detalle para tener claros unos conceptos bastante simples.

Entidades: Datos, Registros y Tablas

Un número de teléfono es un Dato.

Un registro agrupa todos los datos de una persona, por ejemplo, un cliente. La clave o código único, el nombre, la dirección, población, país, teléfono, web, email, Agente comercial, etc.

Y finalmente, siguiendo el ejemplo una tabla agrupa los registros de todos nuestros clientes.

Tablas de Hechos y Dimensiones

Una factura es un Hecho. Nos dice, por ejemplo, que en fecha 26-05-2020 el cliente 00101 a comprado 5 unidades del artículo AA12 a un precio de 12 Euros.

El importe de venta 5 x 12 = 60 Euros es un campo calculado, no es un dato “físico”.

El calendario o tiempo, el cliente y el articulo son Dimensiones de análisis.

Puedo analizar, filtrar, segmentar las ventas por la dimensión Año, Mes, Semana o Día

También por la dimensión País, Agente, Cliente.

Y finalmente por la dimensión Familia, Artículo.

Relaciones

Las tablas de dimensiones suelen tener más campos y menos registros

Las tablas de hechos por contra tienen menos campos y muchos más registros

En las tablas de dimensiones la clave es la fecha, el código de cliente o de artículo

En las tablas de hechos la clave es el número de factura y línea (en realidad son 2 tablas)

Un cliente se Relaciona con muchas facturas, esa relación se llama de uno a muchos.

Y la dirección del filtrado es de cliente a factura, es decir si seleccionas un cliente te muestra solo sus facturas

Nos encanta divulgar sobre Entidades, Modelos, Business Intelligence, Gobierno del DATO y Tecnología en General, pero siempre teniendo en cuenta que el valor reside en cómo ayudamos al éxito de la Estrategia de Negocio.

Enrique Mora
Enrique Mora

 

Autor: Enrique Mora. Responsable del Área de Modelado, DWH y Business Intelligence