Cómo sacar valor a los datos de tu empresa

activos intangibles

¿Sabías que cuando un servicio o producto es gratis, el producto o servicio eres tú? 

Estamos asistiendo a un cambio en el que las empresas se están convirtiendo en grandes generadores de datos. Apoyándose en una tecnología cada vez más accesible, sectores tan tradicionales como el del calzado, están aplicando soluciones de IoT para monitorizar las eventuales caídas de personas mayores.  En el sector bancario, la normativa PSD2 permite que, bajo la aprobación del cliente, las entidades bancarias cedan sus datos a las empresas Fintech. Los ejemplos son muchos.

En efecto, el valor de los activos intangibles que incluye derechos de propiedad intelectual, datos y software, ha crecido de forma exponencial desde hace 35 años, según un estudio de Ocean Tomo. ¿La causa? En un mundo volátil como el actual, es precisamente la capacidad de adaptarse e innovar la que marca la diferencia entre el éxito y el fracaso. Para adaptarse e innovar hace falta información y para obtener información hacen falta datos.

El reto primordial de una compañía es asegurar la confianza de sus inversores a través de un crecimiento sostenible en el tiempo. A tal fin, los datos y, sobre todo, la medida en que se extrae información valiosa de ellos se ha constituido en el factor clave diferencial del éxito.

Ahora bien, todos sabemos que los datos tienen valor, pero teniendo en cuenta que los datos son prácticamente “infinitos” ¿cómo calcular cuánto aportan a tu empresa? ¿Cómo definir si es necesario adquirir nuevos sets de datos y cuánto debes pagar por ellos?

En este artículo aprenderás paso a paso la metodología a seguir para calcular este valor ya sea con foco en un dataset concreto o en todo un dominio de datos.

Esta metodología te ayudará a:

  1. Entender qué sets de datos son más estratégicos y por lo tanto deben ser gobernados con una mayor exigencia y en cuáles se pueden rebajar estos requerimientos con el ahorro de costes que ello implica, por ejemplo en cuanto a requisitos de calidad, seguridad, linaje, diccionario… entre otros.
  2. Priorizar los casos de uso y desarrollos analíticos que mayor valor aportan a la compañía a fin de que el departamento de data & analytics sea un catalizador de la transformación de la compañía hacia la toma de decisiones fundamentada en el dato.
  3. De igual manera, esta priorización de casos de uso te ayudará a optimizar los costes del departamento de data & analytics dado que
    1. Gestionarás de manera óptima la demanda analítica, así como la que tengas que escalar a sistemas.
    2. Dimensionarás a tu equipo en función a la demanda.
    3. Ajustarás los tiempos de entrega lo cual, a su vez, reforzará el valor que aporta el departamento en el día a día de los usuarios de negocio.

Sin más dilación, empecemos.

CÓMO MEDIR EL VALOR DEL DATO EN 8 PASOS

No todos los departamentos de tu organización tendrán el mismo nivel de madurez en cuanto al grado de implantación de un modelo de gobierno del dato, herramientas o procesos. Es por ello por lo que un enfoque incremental te permite hacer foco inicial en un conjunto reducido de datos que consume un departamento por ejemplo e ir iterando en siguientes fases a medida que este grado de madurez permea a toda la compañía.

Esta metodología en 8 pasos persigue generar retornos en fases tempranas en forma de quick wins para profundizar en sucesivas iteraciones incrementales. Así demostrarás valor desde el principio.

Pasos:

  1.   Crear un catálogo de dominios de datos útiles para el negocio y a los que llamaremos business datasets.

En función del nivel de madurez de tu organización y de las herramientas con las que cuentes, en esta fase te podrás limitar a analizar en dominios de datos conceptuales o bajar a nivel de vistas concretas de datos con información ya integrada y preparada para su consumo. Por lo tanto:

  • Si cuentas con herramientas avanzadas que son capaces de definir e integrar datos de forma sencilla, generar modelos de datos reutilizables, publicarlos en un catálogo de datos corporativo y hacer seguimiento sobre su uso, podrás analizar las vistas concretas de datos y los campos que las componen.
  • En caso contrario, deberás quedarte a nivel de dominio de datos conceptual. Cada empresa es un mundo, puede que para la tuya un dominio de datos sea “Finanzas” y para otra empresa sea “reporte a CEO”. Tu conocimiento de la empresa será aquí clave.

Estos datos no hacen referencia a los datos fuentes (tablas o ficheros) que tenemos en nuestras bases de datos o datalakes. Esto se trabajará en sucesivas iteraciones como veremos más adelante.

  1.   Construir un catálogo de los principales procesos de la organización y mapearlo con el catálogo de business datasets construido en el primer punto

Como en el paso anterior, haremos una aproximación top down en la que comenzaremos identificando los procesos críticos o más importantes para el negocio. Para llevar a cabo con éxito esta tarea hay dos elementos clave:

  • Conocimiento de negocio: Deberás apoyarte en el Data Owner para establecer la relación entre datos y procesos dado que es él el máximo responsable de los datos de un determinado área o departamento y por lo tanto su misión es conocer y autorizar el consumo que se haga de ellos.
  • Componente tecnológica: Si te apoyas en herramientas que permitan trazar el uso que se hace de cada dataset en cada punto del proceso, podrás acelerar tu trabajo, reducir costes y evitar los errores que se pueden producir cuando haces una revisión manual.

Y ¿cómo puedes determinar la importancia de un determinado proceso? La clave es considerar los procesos operativos sin olvidar las iniciativas analíticas como son la generación de cuadros de mandos ó la construcción de modelos predictivos, entre otros. Estos son procesos también.

En lo referente a iniciativas analíticas recuerda tener en cuenta dos aspectos

  • Si hablamos de soluciones de analítica descriptiva como pueden ser los cuadros de mandos o las aplicaciones de business intelligence, puedes utilizar el dato relativo al número de usuarios como parámetro para definir su importancia. De forma intuitiva, podemos extrapolar que los cuadros de mandos que más se usan son los más importantes. No obstante, puedes encontrar ciertas soluciones críticas, pero con un uso muy residual, por ejemplo, en el caso de un cuadro de mandos con el resumen financiero de la compañía utilizado por el comité de dirección, su importancia es crítica pero su uso es moderado. Por lo tanto, ten siempre en cuenta al menos dos ejes, el número de usuarios y quién consume principalmente esta información.
  • No todas tienen retornos tangibles por lo que no siempre resulta sencillo establecer el valor en términos económicos.

Por ejemplo, ¿cuál es el retorno en euros de una iniciativa analítica que nos permite monitorizar de forma diaria los retrasos en los vuelos en una compañía aérea? Una solución de este tipo nos va a aportar multitud de información con la que podremos tomar decisiones que afectarán a la operativa diaria y que repercutirán de forma positiva en la puntualidad general de la compañía, pero esa puntualidad a su vez puede verse afectada por multitud de variables externas por lo que nunca podremos saber con certeza el impacto real de nuestras decisiones, lo que sí podemos asegurar es que disponemos de más y mejor información por lo que la puntualidad se gestiona de forma más eficiente.

El principal reto que te encontrarás a la hora de determinar la importancia de un determinado proceso es establecer una clasificación genérica dentro de la organización en la que se aplique el mismo criterio de forma transversal. Para algunos, el proceso de ventas será más crítico y para otros lo será el de operaciones. La forma de simplificar este problema es, para esta primera iteración, que sólo analices los procesos críticos que identifique cada departamento. Por ejemplo, puedes considerar un proceso crítico como aquel que si no se realiza implica una paralización de la actividad o un perjuicio económico o reputacional. Tu conocimiento de negocio y tu sentido común te guiarán en este punto.  

  1.   Clasificación de la criticidad de cada data set en cada proceso crítico dentro de la compañía

En esta fase tu objetivo es definir el nivel de criticidad o importancia para cada una de las duplas “datos x proceso” que hemos identificado en el punto anterior.  Para ello, debes considerar estos aspectos:

  • Dado que la “criticidad o importancia” es algo subjetivo, a la hora de abordar este paso debes definir un criterio de clasificación global y unificado que permita diferenciar, por ejemplo entre datos “Imprescindibles”, “Importantes”, “Deseables” o “De apoyo”, o Datos TIER 1 (regulatorios) TIER 2 (consumidos por más de un área de negocio) y TIER 3 (exploratorios).
  • Para ello debes reunirte con los equipos de negocio y los SMEs (Subject Matter Experts) con el objetivo de llegar a un acuerdo sobre el significado de esta clasificación. Esto te ahorrará muchos dolores de cabeza más adelante.

Con estos criterios claros y validados, una vez más son los equipos de negocio y los SME (subject matter experts) quienes deben asignar un nivel de importancia para cada una de las duplas datos x proceso.

Para ayudarles, puede proponerles que tengan en cuenta el impacto en el proceso en caso de:

  • No disponer de estos datos
  • Contar con datos de mala calidad
  • Pérdida de datos
  1.   Asignación final de cada data set a su categoría según su importancia (en el ejemplo anterior, Imprescindibles”, “Importantes”, “Deseables” o “De apoyo”, o Datos TIER 1 (regulatorios) TIER 2 (consumidos por más de un área de negocio) y TIER 3 (exploratorios). La importancia de la data set viene definida por la clasificación de mayor nivel de cada uno de los procesos críticos en los que participa.
  2.   Definición de exigencias de gobierno asociadas a los Business Data Sets

No todos los data sets requieren el mismo nivel de gobierno. Los datos que una entidad bancaria reporta al regulador requieren mucho más esfuerzo en cuanto a su gobierno que otros que se van a consumir a modo simplemente exploratorio. Gobernar datos implica un despliegue de medios tanto humanos como tecnológicos que debemos optimizar si queremos evidenciar el valor del dato con el mínimo coste asociado.

Por ejemplo, en función de la clasificación a la que un data set esté asignada podrás:

  • Definir políticas relativas a la alta disponibilidad del dato, SLA de servicio de acceso, horarios de monitorización y soporte extendido sobre incidencias en estos conjuntos de datos, copias de seguridad y procedimientos de recuperación, alarmas sobre la ejecución de tareas técnicas implicadas en la construcción de los datos (procesos de refresco o ETL´s).
  • Definir políticas relativas a procesos y alarmas de datos más o menos exigentes como pueden ser la realización de chequeos automáticos de calidad, de revisiones manuales periódicas, construcción de cuadros de mandos con información histórica de las métricas de calidad, entre otros.
  1.   Identificar los datos fuente de cada set de datos

Con estos primeros 5 pasos has trabajado en la capa más superficial o expuesta de los datos llamada business data sets.

Esta capa externa no es más que el fruto de transformar, limpiar e integrar los datos fuente originales que residen en las bases de datos y en los data lakes. Sin un gobierno efectivo de esta capa fuente de datos “aguas arriba”, no podrás asegurar la consistencia de la información que pones a disposición de los usuarios de negocio. Por lo tanto, en siguientes iteraciones deberás extender a los datos fuente el mismo concepto de criticidad aplicado en los 5 pasos anteriores.

Para ello, deberás identificar tanto la fuente de datos como las transformaciones sucesivas desde que los datos son ingestados en nuestros sistemas hasta que son integrados en vistas de nivel superior. A este proceso se le llama LINAJE DEL DATO.

Gracias al linaje del dato puedes identificar los campos, tablas y ficheros que contienen la información más crítica para tu empresa, es decir la que es utilizada para componer los business data sets más críticos para tu organización.

  1. Establecer las políticas de gobierno asociadas a estos datos fuente

Del mismo modo que has hecho con los business data sets, en esta última fase deberás definir y aplicar políticas de gobierno asociadas a cada nivel de criticidad respecto a  las fuentes de datos originales (bases de datos, tablas, campos y ficheros).

  1. Identificar aquellos procesos, business data sets, datos, tablas, campos o ficheros que no nos están aportando valor

De forma paralela al trabajo realizado hasta ahora, habrás identificado tanto procesos como sets de datos que no aportan valor o que no se están consumiendo en la actualidad. Una vez completadas las fases anteriores o en paralelo en función del equipo con el que cuentes, puedes trabajar en identificar y eliminar los “residuos” de las actividades de creación de valor aplicando la terminología de Lean Management.

Efectivamente con la incorporación de conceptos Lean Management a la gestión de los datos conseguirás:

  • Eliminar diferentes formas de desperdicio en las actividades realizadas a lo largo del ciclo de vida de los datos.
  • Contribuir junto con los responsables de negocio y los SMEs a la estandarización de procesos implementando flujos de trabajo y asignando funciones y responsabilidades claras
  • Definir métricas que ayuden a identificar ineficiencias que contribuyan a la mejora continua de los procesos y de la organización en general.

A modo de ejemplo, así puedes aplicar la metodología Lean y los 8 despilfarros que identifica (sobreproducción, transporte, tiempo de espera, exceso de procesos, inventario, movimientos, defectos en el producto y personal subutilizado) a las problemáticas habituales en la gestión de Datos.

Tipo de despilfarro Gestión de los datos
Sobreproducción Registros duplicados

Datos erróneos que no se corrigen sino que se vuelven a crear

Situaciones en las que los mismos datos son introducidos en diferentes sistemas

Defectos en el producto Registros creados con valores erróneos o ausentes
Exceso de procesos Inconsistencia de datos entre dos sistemas, lo que exige un trabajo adicional en fases posteriores

Datos erróneos creados durante la transacción, lo que provoca una acción posterior de corrección o adición de datos

Tiempo de espera Latencia entre la creación de los datos maestros y su consumo por parte de las aplicaciones de informes y transacciones posteriores

Conclusiones y siguientes pasos

Como ves, se trata de una metodología pragmática, que busca la generación de valor desde el primer momento involucrando tanto a consumidores de la información como a los dueños de los datos y SME´s. Tu labor principal reside en alinear unos criterios homogéneos de clasificación, ayudar a tus interlocutores a tomar decisiones para que, en definitiva, el ecosistema de datos de tu empresa sea un aliado en el proceso de transformación global de la compañía.

Sólo así serás capaz de generar aprendizajes relevantes en el momento y forma correctos, asegurar que responden de forma ágil a las necesidades de negocio colocando al dato en el corazón de la toma de decisiones y, en definitiva, que crean el músculo necesario para que tu empresa sea capaz de adaptarse e innovar con éxito.

Trabajo realizado por los miembros del grupo de trabajo Infonomics, compuesto por:

José Carlos Bermejo, Irene Vivas, Oscar Alonso, David Centeno, Miguel Ángel Aldaba, Daniel Ruz , Javier Alonso Roig, y coordinados por Stefano Arcuri