“Nosotros estamos peor” y otras leyendas urbanas en torno a Big Data
Aunque el sentir general de las empresas sería que se encuentran más rezagadas que la mayoría de su competidores, Gartner dice que no es cierto. Y no es el único mito que hay vigente.
El Big Data no es un extraño ya para las organizaciones mundiales.
Se ha estado hablando tanto de esa acumulación de grandes cantidades de datos, en formato digital o en papel, que conviene analizar de forma inteligente para tomar decisiones de negocio más certeras, que el fenómeno se ha convertido en lugar común.
Pero al mismo tiempo tanta cobertura tiene ciertos efectos nocivos. Al menos en opinión de Gartner.
Esta consultora cree que se la ha dado tal “bombo” que “es difícil para los líderes de TI saber cómo explotar su potencial”. De hecho habla de cinco mitos que es necesario desterrar para avanzar hacia cuotas más altas de adopción y calidad. Esos mitos serían:
1. “Todo el mundo está por delante de nosotros en la adopción de Big Data”. Según Gartner el sentir general de las empresas es que se encuentran más rezagadas que la mayoría de su competidores. Nada más lejos de la realidad. Lo cierto es que, entre la intención de invertir y la materialización de los proyectos, muchas se quedan por el camino. Sólo el 13% de las compañías habría desplegado soluciones de Big Data a estas alturas.
2. “Tenemos tantos datos, que no necesitamos preocuparnos de cada pequeño fallo”. O se hacen bien las cosas, o no se hacen. No vale la regla de “cada error es sólo una pequeña parte de la masa de datos” con los que cuenta la organización para trabajar. Si hay errores individuales de por medio, por ínfimos que puedan parecer, desacreditarán a los grandes números. Además Gartner recuerda que “hay más defectos que antes porque hay más datos”.
3. “La tecnología Big Data eliminará la necesidad de la integración de datos”. Pensar esto es otro error garrafal. Frente al “esquema de lectura” que se supone que va unido a las nuevas soluciones para procesamiento de información de diversa naturaleza, por ejemplo, los expertos hablan más bien de “esquemas de escritura” con “datos que son descritos [y] contenido prescrito”.
4. “No tiene sentido utilizar almacenes de datos para análisis avanzado”. Gartner insiste en lo contrario: “muchos proyectos de análisis avanzados utilizan un almacén de datos”. Puede llevar su tiempo, por supuesto, y los que entienden de ello no lo niegan. Pero de ahí a decir que ya no tiene sentido recurrir a sistemas “warehouse” hay un trecho. A la hora de la verdad, al proceder a la gestión de Big Data para su estudio inmediato, habrá que hacer diferencias y ver cuál es la fórmula más adecuada en cada caso.
5. “Los Data Lakes reemplazarán al Data Warehouse”. Es un poco más de lo mismo. Puede que vayan surgiendo nuevas alternativas o que se nombre a los bautizados como “lagos de datos” como fórmula viable de almacenamiento a modo de repositorio único. Pero la aparición de nuevos modelos no implica desterrar los anteriores, sobre todo cuando los más recientes aún “no tienen la madurez y amplitud de características” del resto.