Introducción al análisis de entornos IoT, Big Data, Cloud y Blockchain

Un nuevo paradigma tecnológico con nuevas capacidades

Mientras el gobierno del dato empieza a tener una mayor adopción en las organizaciones tanto públicas como privadas, surgen nuevos entornos tecnológicos que nos obligan a plantearnos nuevas estrategias para cubrir el gobierno y la gestión de los datos.

En concreto, estamos hablando de nuevas tecnologías y paradigmas como Big Data, entornos Cloud, datos provenientes de dispositivos IoT e incluso la irrupción de Blockchain en entornos y sectores diversos.

Dentro del grupo de Gobierno del Dato y Metadatos hemos decidido ahondar en este tema para evaluar la situación actual e identificar los principales gaps y oportunidades para el gobierno de los datos relacionados con estas nuevas tecnologías.

Para ello, realizaremos un análisis de la situación a alto nivel en cuanto a la madurez en la gestión de los datos en estos entornos tecnológicos y respecto a “la rueda DAMA”. Profundizaremos respecto a cuáles son los ámbitos de Data Management que más aplican a estos nuevos entornos, tecnologías y paradigmas, para facilitar el entendimiento, gestión y análisis de los datos. En definitiva, mejorar la toma de decisiones con más y mejor información.

En este artículo de presentación, hacemos un resumen de qué son y para qué (o para qué no) se deben usar estas tecnologías y más adelante, una vez concluidos los análisis indicados anteriormente, se publicará un artículo con las conclusiones para todos los asociados de DAMA.

Big Data 

¿Qué es?

Desde DAMA se indica que “Big Data se refiere no solamente al Volumen de los datos, sino también a su Variedad (datos estructurados y no estructurados, documentos, archivos, audio, video, streaming de datos, etc) y a la Velocidad/rapidez con la cual son producidos

Seguro que has escuchado o leído en infinidad de ocasiones el termino de Big Data y no desde hace poco tiempo, por lo que quizás ya no habría que incluirlo bajo el concepto de “nuevas tecnologías” debido a que es en 2001 a través de Doug Laney (Gartner) se empezó a hablar de las famosas 3 Vs del Big Data (Volume / Velocity / Variety), a las que posteriormente se le han ido añadiendo otras como:

  • Veracidad (Confianza en la procedencia de los datos)
  • Valor (Información útil para la organización)
  • Validez (Precisión en el uso de información)
  • Vulnerabilidad (Relativa a la preocupación de seguridad en los datos).

Llevándolo al lenguaje llano es la tecnología que permite a las organizaciones tomar decisiones en base a diversas fuentes de información con grandes cantidades de datos/contenidos que en el pasado no podían (hace 15 años) y que actualmente está prácticamente al alcance de cualquier organización provocado tanto por el coste de la infraestructura como por el aumento de profesionales que tienen conocimientos para obtener rendimiento al Big Data.

Seguro que te preguntarás “vale Big Data son muchos datos, pero ¿qué se considera muchos datos (Big Data)?” pues no hay una respuesta cerrada, ya que dependerá de con quién hables, pero si se podría tomar como referencia un volumen de información a partir de 40 terabytes.

Por otra parte, es importante resaltar lo indicado en el capítulo 14 (Big Data y Ciencia de Datos) del DMBOOK2 “A medida que Big Data se ha incorporado a la Inteligencia de Negocio y al Data Wharehouse, las técnicas de Ciencia de Datos se utilizan para proporcionar una vista prospectiva de la organización. Las capacidades predictivas, de tiempo real y basadas en modelos, utilizando diferentes tipos de fuentes de datos, ofrecen a las organizaciones mejor visión de hacia dónde se dirige

 

¿Para qué se usa? ¿Para qué no?
Por poner algunos ejemplos, se usa para:

  • Predecir situaciones futuras (en base a datos históricos poder replicar situaciones futuras… si tenemos los datos del comportamiento de la gripe en Europa en los últimos 10 años … se podrá aproximar mucho el inicio de la vacuna en cada uno de los países/regiones/ciudades para optimizar la vacunación)
  • Comercializar/vender datos (si la empresa dispone de “muchos datos” seguro que hay alguna manera de poder “comercializarlos/venderlos” respetando siempre el anonimato y siendo dicha “comercialización” tanto a terceros como dentro la propia organización).

Por el contrario, no se usa o no sería necesario utilizarlo para:

  • Pocos datos (si no hay que tratar gran cantidad de información, no es necesario utilizar tecnología/herramientas Big Data, poniendo como ejemplo una empresa de muebles de 5 trabajadores que sólo necesita llevar la contabilidad quizás no le compense sumergirse en esta tecnología y con soluciones más básicas sería suficiente)
  • Organización sin perfiles tecnológicos (aunque cada vez hay muchos más perfiles con conocimiento en Big Data estos todavía siguen siendo perfiles especialistas con un coste por encima de la media de otras tecnologías)

Servicios Cloud

¿Qué es?

El Cloud Computing es el concepto tecnológico que ha permitido que el modelo de negocio de las empresas haya cambiado de forma radical. Está enfocado sobre todo al almacenamiento y acceso a la información, a la comunicación entre ordenadores y a proveer servicios y desarrollo de aplicaciones. Todo en una plataforma: la nube.

Los servicios Cloud no se ofrecen, por lo tanto, en entornos físicos, sino en Internet, que se convierte en una red de redes, es decir, un conjunto de ordenadores unidos por un extenso entramado de comunicaciones que ofrece recursos y espacios de datos.

Esto ofrece a las empresas una enorme cantidad de ventajas, ya que el usuario, sin necesidad de realizar instalación alguna en su ordenador, tendrá acceso a múltiples utilidades. Esto permite un impacto importante en la mejora de la gestión de los negocios, ya que las compañías reducirán costes, optimizarán recursos y podrán acceder a la información desde cualquier lugar y en tiempo real.

En este gráfico se explica alto nivel las diferencias sobre los tipos de servicios Cloud: IaaS, PaaS, FaaS y SaaS.

 

¿Para qué se usa? ¿Para qué no?
Realmente no hay un caso de uso (o varios) con los que es o no recomendable usar servicios Cloud. El motivo es que las Cloud tienen múltiples servicios que dan cobertura a múltiples casos de uso. Pero sí que hay algunos escenarios en los que los servicios Cloud puede no ser la mejor opción:

  • Datos críticos: Aunque la seguridad en estos servicios ha aumentado considerablemente, algunos expertos en seguridad no recomiendan el uso de cloud para datos críticos. En primer lugar, no siempre se conoce la ubicación física del almacenamiento en la nube, y las leyes locales y la jurisdicción correspondiente te impide mover datos fuera del lugar geográfico (ni en almacenamiento ni en tránsito). En segundo lugar, puede afectar a su rendimiento, especialmente si los datos se almacenan en ubicaciones alejadas de su compañía. Y por último la posibilidad de que os datos sean pirateados, aunque esto pueda pasar también en sistemas “on premise”, la seguridad perimetral está más acotada.
  • Cortes de servicio: Los principales proveedores cloud brindan un servicio estable y confiable. Pero incluso a los buenos proveedores de servicios cloud les suceden cosas inesperadas. Las interrupciones en la nube son raras, pero ocurren. Si su empresa depende de que los datos estén disponibles las 24 horas del día, los 7 días de la semana, la confianza total en un solo proveedor de nube podría resultar costosa y desastrosa.
  • Expansión de las nubes: Mover de golpe todos los servicios a cloud puede ser caótico. Es recomendable que este movimiento se haga de forma paulatina para tener control de los datos y minimizar el impacto en los usuarios finales.
  • Arquitecturas complejas: Muchas empresas miran historias de éxito basadas en la nube como Facebook e Instagram y quieren emular lo mismo en sus negocios. Quieren reinventarse a sí mismos como una empresa digital, independientemente de si su negocio se ajusta a esa descripción o no.
  • Arquitectura legacy: La mayoría de los sistemas legacy ofrecen poca o ninguna flexibilidad y escalabilidad, por lo que no tiene sentido trasladar estas aplicaciones a la nube. De hecho, si mueve dichas aplicaciones, probablemente terminará gastando más dinero y recursos administrándolas en la nube en comparación con lo que ya está gastando internamente.
  • Ubicación remota: La conexión a Internet de alta velocidad es un requisito básico para la nube. Si planea tener oficinas en una ubicación remota o donde el servicio de Internet no es tan estable, es posible que desee reconsiderar su idea de mudarse a la nube.

IoT (Internet of Things) 

¿Qué es?

IoT (Internet of Things) hace referencia a la tendencia de conectar todo tipo de objetos físicos a Internet. Puede ser cualquier tipo de elemento, desde objetos domésticos y personales (frigoríficos, bombillas, etc.) hasta recursos empresariales o industriales, pasando por elementos portátiles, dispositivos inteligentes e incluso elementos presentes en Smart Cities.

¿Para qué se usa? ¿Para qué no?

Los diferentes usos que se le puede dar a IoT se podrían clasificar en tres grandes ámbitos: industria, mercado doméstico y ciudades inteligentes (Smart Cities).

En el ámbito de la industria, existen ejemplos de ampliaciones tanto en la hostelería (por ejemplo, el terminal que te avisa cuando está listo tu pedido), en los comercios (midiendo cada cuánto tiempo entra un cliente, a qué horas, qué compra qué productos), en el ámbito logístico (controlando los paquetes o gestionando los vehículos) y en la agricultura y la ganadería (midiendo temperatura, humedad, luminosidad y demás factores).

En el ámbito del uso doméstico, podemos ver aplicaciones a nivel de domótica, jardinería y la salud.

Y, por último, en el ámbito de las ciudades inteligentes, tanto para la gestión de suministros como la gestión ambiental y la gestión del tráfico.

BlockChain

¿Qué es?

La cadena de bloques o blockchain es una tecnología que permite mantener de forma sincronizada todo el historial de operaciones que han tenido lugar en un sistema en el que pueden trabajar sobre él varios dispositivos.

Puede ser visto como una base de datos distribuida, donde cada uno de los nodos o bloques que componen la misma como una red, además de:

  • su propia información (datos)

mantiene y comparte un registro colectivo de:

  • todas las operaciones generadas por la cadena como conjunto (hash) a modo huella digital
  • el hash del anterior bloque según su posición actual en la cadena.

 

 

Esto hace que en el momento de registrar públicamente una nueva operación, contrato o tipo de acción (“qué”), ésta sea conocedora por todos los bloques, siendo verificable, infalsificable y transparente, no siendo necesarias validaciones adicionales. Así, en todo momento es posible mantener identificado de manera única al propietario y dispositivo sobre la operación nueva realizada y conocer su traza.

(“¿cómo?”)

A la hora de recibir una nueva petición de operación en red los nodos generadores (mineros) crean nuevos bloques, añadiendo el hash del último bloque de la cadena más larga conocida. A continuación, estos compiten por ser el primero en encontrar la solución al problema criptográfico de su bloque candidato actual y en el momento que uno de los bloques ha solucionado la petición, publica el nuevo hash sobre un servidor de sello de tiempo, donde dicha operación es anunciada públicamente y compartida con el resto de bloques de la cadena. Así, se garantiza su legitimidad y confiabilidad.

¿Para qué se usa?
Algunos campos o sectores adicionales al financiero, donde se identifica la necesidad de utilizar Blockchain son:

  • Registro de la propiedad
  • Sanidad
  • Logística
  • Impuestos

Y algunas aplicaciones potenciales del uso de esta tecnología quedan descritas en la siguiente fuente de IBM por la siguiente figura:

Los datos, la materia prima

Todas estas nuevas tecnologías tienen un denominador común: los datos. Tal y como hemos podido ir viendo, estas tecnologías ofrecen a las organizaciones y a sus intervinientes nuevas capacidades en distintas fases del ciclo de vida de los datos para su generación, captura, transformación, almacenamiento, procesamiento, explotación y consumo en volúmenes y formas que antes no eran posibles.

En este contexto, toda esta nueva potencia tiene que ser gobernada de forma efectiva y eficiente y por ello estas tecnologías hacen que tengamos que replantear las reglas del juego en cuanto al gobierno y la gestión de los datos como activo estratégico y materia prima para los procesos de toma de decisión de las organizaciones, ya sean tomadas por seres humanos o por algoritmos “inteligentes”.

Pongamos un ejemplo de caso de uso en una Smart City en la que un montón de dispositivos inteligentes están generando, compartiendo y enviando a internet grandes cantidades de datos en tiempo real (IoT). Estos son después integrados y almacenados en plataformas de datos en la nube (Cloud) mediante el uso de técnicas y tecnologías de Big Data y los cuales sirven a su vez para la evaluación, gracias a técnicas de analítica avanzada, del potencial incumplimiento de condiciones establecidas mediante Smart Contracts en una gran red de Blockchain creada por el Ayuntamiento para garantizar una serie de servicios públicos a los ciudadanos.

Pues bien, a nadie se le escapa que este nuevo paradigma trae consigo también nuevos retos desde el punto de vista del gobierno de los datos y eso es lo que queremos analizar para poder compartirlo en los próximos artículos.

Miembros del grupo que han participado:

Deja un comentario