Categories: CloudEmpresas

La ballena voladora

A finales de Enero, tras varios meses, volvió a aparecer en Twitter la “Fail Whale”, dibujo de una ballena voladora que aparece cuando el servicio no funciona y un buen símil de la cantidad de datos que mueve el servicio.

Fue en Febrero de 2010 cuando un ingeniero de Twitter, a raíz de las frecuentes caídas del servicio, anunciaba sus planes de abandonar su Base de Datos SQL tradicional. Se optó por una procedente de Facebook, un sistema NoSQL. Fue un fracaso, pero se aprovechó para montar su infraestructura de análisis. Infraestructura con la que han logrado dar valor a su servicio (Trending Topics), añadir funcionalidades e incluso recibir ingresos (acuerdos con Google y Bing). Como culminación ofrecerán una asignatura de BigData en la universidad de Berkley.

¿Cómo Enfrentarse a una Ballena?

Surge la “Internet de las cosas”, donde casi cualquier equipo eléctrico es capaz de almacenar datos. Ésto, junto a las redes sociales, han logrado poner a disposición de cualquier negocio más información de la que habrían soñado nunca, donde se mezclaran orígenes de datos muy diferentes y en la mayoría de ocasiones sin una estructura clara.

Nos estamos enfrentando a la evolución del Business Inteligence, análisis de datos adaptado al nuevo mercado que nosotros mismos, como usuarios, hemos creado. Un nuevo modelo de Just in Time del procesamiento de datos, donde será necesario ser flexible en las preguntas y veloz en las respuestas.

Apenas podremos hacer previsiones sobre nuestros datos y mucho menos estructurarlos con antelación. Esta será una de las principales características del BigData: la falta de estructura. Lo que provocará que almacenaremos toda información, para que en cuanto aparezca una necesidad, una pregunta, ese gran ser acuático responda y lo haga ¡YA!

Pero antes de empezar a analizar nuestros datos o a pedir una gran piscina para nuestra ballena, será necesario sentarse, respirar profundamente y hacerse una pregunta: ¿Qué le podemos preguntar a una ballena?

No todo el mundo se sentirá cómodo al tener que reaccionar por lo que diga un cetáceo, lo que pondrá a prueba nuestra flexibilidad y gestión del cambio. Llegando incluso a la conclusión de que no todos debemos tener una ballena en el salón. Una vez contestada podemos analizar las soluciones tecnológicas disponibles.

Acostumbran a existir dos entornos de almacenamiento, el productivo (OLTP) y el analítico (OLAP), lo que nos puede llevar a pensar que la mejor opción es unir ambos. De esta forma, analizando los datos en origen, podríamos evitar procesos nocturnos que actualicen y estructuren el entorno analítico, que es en realidad al que preguntamos. En Oracle fueron de los primeros en darse cuenta presentando Exadata, un “exa”-esqueleto para que hasta un cachalote pueda moverse como una bailarina. Pero dada su complejidad y precio, se ha dado pie al resurgir de los sistemas NoSQL.

Características de los sistemas NoSQL:

• ¡Empezamos YA! sistemas sencillos de implantar y sin necesidad de diseño previo.
• El FIN del DBA. Al ser sistemas más cercanos al desarrollador, podemos optar por prescindir de esta figura.
• Escalabilidad, suele ser sencillo añadir nodos a un cluster NoSQL.
• Precio, no solo por casi todo proyectos de código abierto, sino por el crecimiento a base de “Commodity Servers” (equipos básicos).
• Velocidad, además de por escalabilidad, por su diseño, distinto al tradicional SQL.
• No cumplen el estándar ACID para tratamiento de transacciones, lo que podrá suponer un problema de robustez.
• Hay escasez de herramientas. Destaca un producto, Hadoop, que además de no ser una base de datos, sino un sistema de ficheros, ofrece otras ventajas como la alta disponibilidad. Es la solución que multitud de fabricantes han embebido en sus soluciones de BigData, entre ellos Oracle.

Varados en la Costa

Se pueden leer muchas críticas, tanto desde el punto de vista técnico, como desde el operativo; quizás sea por eso que veo una gran futuro a la ballena.

Durante el 2013 quedará claro que en el Big Data lo relevante son los datos y no el tamaño.

Veremos como realizar preguntas de forma más sencilla, usando el “Lenguaje Natural”. Donde el protagonismo lo tiene la pregunta, evitando intermediarios que la manipulen para poder formularla. Veremos como la tecnología responde con alternativas. Cada vez será más habitual aprovechar discos de estado sólido (más veloces y caros que los normales).

Aparecerán más formas de consultar con una interfaz SQL a sistemas NoSQL, aunque no sea la forma más optima, puede ser clave en el proceso de adaptación. Se volverá a hablar de las “in-memory databases” donde todo el procesamiento se realiza en memoria RAM sin consultar los discos duros (SAP-HANA), otra gran solución a gran coste.

Aunque se pueden obtener muchos beneficios al Big Data, es quizás en las herramientas donde veo una oportunidad clara. Aunque hay alguna (MapR, Greenplum), existe una clara escasez de interfaces sencillas, sobre todo para que las empresas puedan apreciar a nuestro cachalote o incluso para que desarrolladores puedan pasar horas y horas jugando con él.

Para seguir los viajes de nuestro particular cetáceo, uno de los mejor lugares durante el 2013 será Barcelona, concretamente en el “Gartner Bussines Intelligence & Analitycs Summit” que se celebra en Febrero y en el “Symposium ITexpo 2013” de Noviembre, también de Gartner. En ambos encontraremos Big Data como tema destacado.

Es otra revolución, como lo fue la nube, pero no tan ligera…

Firma invitada

Nombres destacados del sector TIC opinan sobre las principales tendencias de la industria.

Recent Posts

SIA crea una Cátedra de Ciberinteligencia junto con la Universidad de Málaga

Girará en torno a tres temáticas: desinformación, contrainteligencia y credenciales expuestas.

13 horas ago

La optimización de productos digitales gana a la creación entre las prioridades empresariales

El 57 % de las compañías españolas está manteniendo este año su nivel de inversión…

15 horas ago

En España, el 22 % de las empresas industriales sufre problemas de red 2 o 3 veces al mes

Entre los problemas a los que se enfrentan las compañías con infraestructura distribuida geográficamente se…

17 horas ago

Así evolucionará la mensajería empresarial RCS durante los próximos años

Juniper Research prevé un incremento del 50 % en el tráfico de mensajes para 2025.

17 horas ago

Los envíos trimestrales de tabletas rozan los 40 millones de unidades

Aumentaron un 20,4 % durante los meses de julio, agosto y septiembre para llegar a…

20 horas ago

La conferencia Fal.Con llega por primera vez a Europa

CrowdStrike celebra este evento en Ámsterdam entre el 5 y el 7 de noviembre.

20 horas ago