Chema Arce

Global Head of Enterprise Data, Analytics and Architecture (Sector Banca-Seguros)
@ichemaarce
LinkedIn

Compartir:

Big Data: el eterno desconocido del que todo el mundo habla

Nació prometiendo ser la panacea empresarial, la bola de cristal, y algunos todavía lo creen. Aunque no es oro todo lo que reluce, el Big Data llegó para quedarse y puede aportar mucho valor, sobre todo si sabes qué andas buscando y si tienes datos buenos.

A estas alturas podemos afirmar, sin temor a equivocarnos, que los datos son el petróleo del siglo XXI. Las empresas que sepan gestionar sus datos, y tratarlos de forma adecuada, tienen la posibilidad de adelantarse a sus competidores y, por lo tanto, ganar una clara ventaja competitiva. Por todo ello el Big Data ha tomado relevancia, también impulsada por las “modas” y la necesidad de las empresas de reinventar nuevas formas de hacer rentables los negocios. Antes ‘la empresa grande se comía a la pequeña’, hoy ‘el rápido ganará al lento’.

El Big Data no es una bola de cristal, no vale para todo (no sin esfuerzo) y menos si no sabemos que queremos. El Big Data, lo pintemos como lo pintemos, desde el punto de vista informático y de forma simplista, es tratar con datos, procesarlos para unos fines concretos o casos de uso. Cambian los nombres, evolucionan las herramientas, pero hablamos de la necesidad de dotar al negocio de datos fiables, a tiempo y que permitan mejorar las decisiones.

El Big Data es un complejo ecosistema puramente tecnológico y con infinidad de posibilidades. En combinación con otras soluciones (Business Intelligence & Analytics), permite mejorar el time to market y abordar casos de uso que no eran posibles hace pocos años. Un gran entorno altamente escalable e ideal como gran laboratorio, permitiéndonos explorar, descubrir y confirmar hipótesis de forma ágil. Especial atención al gobierno de los datos, no termine nuestro “lago de datos” en un gran vertedero. Recordemos que almacenar por almacenar no aporta valor.

¿Estáis iniciando el camino? Algunas reflexiones a mi entender importantes:

  • No existe una gran madurez en Big Data y su aplicación debe obedecer a unas necesidades (casos de uso). Los casos de uso nos permiten identificar qué necesitamos y qué piezas “levantamos” o activamos para dar resultados esperados.
  • Data Science (DS): término más que discutible y puramente “marketiniano”. No existe un recurso experto en DS. El Big Data, debido a todo lo que conlleva por detrás, requiere ser abordado por un equipo compuesto de diversos especialistas en distintas disciplinas (informáticas y matemáticas).
  • Analytics vs Big Data. Son cosas diferentes. Antes de poder analizar, con herramientas analíticas (que no Big Data), debemos tratar los datos, limpiarlos, homogenizarlos y convertir los datos no estructurados en estructurados (no penséis que era magia en tratamiento de los no estructurados), es decir, procesados dentro de Big Data. Procesos 100% técnicos e informáticos. Después vendrán otras soluciones o herramientas para analizarlos, las herramientas analíticas.
  • Los fabricantes incluyen en sus soluciones accesos directos al almacenamiento, pudiendo consultar las estructuras previamente cocinadas por los informáticos. Aportando sus capacidades de representación gráfica o los algoritmos necesarios para obtener modelos y ofrecer conclusiones.
  • El Big Data puede ser, y es, una fuente brutal de conocimiento e información, especialmente si tenemos maduros nuestros sistemas de Business Intelligence (BI) y somos capaces de “enganchar” ambos mundos bajo una arquitectura común y modular. Aquí estamos ante la importancia del valor de esos datos.
  • El BI y el BD cubren necesidades diferentes, pero son soluciones complementarias. Ambos ámbitos facilitan y permiten dar los datos adecuados para cubrir las necesidades analíticas.