No es solo Big Data todo lo que reluce
La tecnología ha avanzado a un ritmo vertiginoso en las últimas décadas. Sirva como reflexión lo siguiente: el iPhone que llevamos en el bolsillo tiene mayor capacidad de cómputo que los ordenadores que permitieron llevar al hombre a la Luna. Lo que hace unos años era ciencia ficción, hoy en día es la realidad y la sociedad lo ve con normalidad.
Hay dos palabras mágicas que aparecen repetidas hasta la extenuación: Big Data. El desarrollo de la tecnología ha llevado a que todo aquello que pueda ser medido de alguna forma, sea almacenado para intentar extraer información relevante que pueda aprovecharse para un mejor funcionamiento de la vida, en general, y de las empresas en particular. La tecnología se ha adaptado para poder almacenar esta información y poder tratarla de forma eficiente. Pero el Big Data es solo eso, Grandes Datos. Los grandes volúmenes de datos no tienen valor alguno en sí mismos si no sabemos cómo extraer información valiosa de ellos. Un posicionamiento actual frente al Big Data es el de guardar esa cantidad ingente de información por si acaso. Pero mucho más importante que saber cómo y dónde almacenar la información es la forma de extraer y generar conocimiento a partir de los datos. El perfil del Data Science (del que se ha llegado a decir que es el trabajo más sexy del Siglo XXI) ha experimentado una demanda creciente en los últimos años por el avance de la tecnología y, en concreto, por la necesidad de profesionales que sepan extraer esa información valiosa de la heterogeneidad y el caos que puede suponer el Big Data.
Es cierto que al Big Data, en el sentido más estricto del término, solo tienen acceso aquellas empresas con unas infraestructuras tecnológicas grandes (bancos, Twitter, Facebook, LinkedIn…) y, aunque el Big Data comienza a abaratarse y a democratizarse, las empresas con un volumen de datos modesto, deberían ser conscientes de los beneficios y las ventajas competitivas que podrían tener si pusiesen sus datos en manos de un equipo de Data Scientists. Cualquier PYME podría beneficiarse de alguien que supiese extraer información valiosa de sus datos y el retorno de la inversión será, seguramente, alto. Una de las habilidades que debe tener un data scientist es la de saber cómo transmitir sus análisis de una forma clara, didáctica y que alguien sin conocimientos teóricos sea capaz de entender y sacar sus propias conclusiones que aporten valor a la empresa. Los data scientists hemos aprendido que debemos ser exhaustivos y meticulosos en la aplicación de los métodos que más convengan en virtud de los datos analizados pero explicar nuestros análisis de una forma llana es tanto o más importante. No sirve de nada tener unos conocimientos teóricos profundos sin la capacidad de hacerlos entendibles a los no expertos y debemos ser conscientes de que nuestro cliente no tiene porqué saber qué es un algoritmo o ser capaz escribir una línea de código. Ése es precisamente el mayor reto al que nos enfrentamos, ser capaces de comunicar de forma eficiente nuestras conclusiones.
Además, la aparición de nuevos softwares libres (R, Python, …) ha posibilitado el abaratamiento de la tecnología necesaria para el trabajo del Data Scientist haciéndolo accesible a cualquier empresa y han plantado cara a softwares que tradicionalmente se han repartido el mercado del análisis de datos y que hacían difícil su utilización por parte de la pequeña y mediana empresa. Se está produciendo una pequeña revolución en la forma en la que nos enfrentamos a la toma de las decisiones ya que se está dejando de lado las razones puramente emocionales y, aunque la experiencia de negocio seguirá siendo algo determinante, las decisiones apoyadas por análisis basados en datos objetivos hará mejorar el funcionamiento de cualquier empresa que esté decidida a seguir esta revolución.
Hay que desterrar la idea de que el Big Data es casi ciencia ficción, cada vez profundizando más en las Advanced Analytics y MLOps y DevOps, y que se puede saber casi cualquier cosa a través de él. Si para algo ha servido el Big Data es para enfrentarnos a retos aún mayores y tener que adaptar nuestras técnicas a esa cantidad ingente de datos que necesita ser convertida en información. Sirva este artículo para desmitificar la idea del Big Data en sí mismo si no va acompañado de la tecnología y el conocimiento necesario para hacerlo útil. De nada sirve saber dónde hay un diamante sin las herramientas necesarias para extraerlo de la roca.