Todo el mundo ha hablado durante el año que acabamos de dejar sobre ‘Big Data’, una de las tendencias que más han crecido en los últimos meses. La consumerización de la tecnología, las redes sociales y la movilidad han sido los precursores de este concepto en el que se pretende incluir todos aquellos conjuntos de datos que, por su complejidad y volumen, van más allá de las bases de datos relacionales que han reinado durante años.

Grandes y pequeños fabricantes de software se han percatado de ello y la gran mayoría ya cuenta con alguna solución que de cobertura a esta gestión. Tanto a la hora de capturar los datos como de almacenarlos, organizarlos y, sobre todo, analizarlos.

Este último apartado, el del análisis, tal vez sea el más complejo de llevar a cabo ya que es necesario generar algoritmos que sean capaces de relacionar datos no estructurados de lo más variopinto. Facebook, por ejemplo, genera cada mes treinta mil millones de elementos de contenido, desde fotos y vídeos a comentarios o enlaces. Toda esa información ya puede ser procesada mediante este tipo de técnicas.

Pero para hacerlo correctamente es necesario atender a una definición más extensa de ‘Big Data’, algo que ha hecho Umesh Jain, de Software Magazine. Propone tres características principales, las tres ‘V’:

  • Volumen: Grandes volúmenes de datos, a partir de TeraBytes o incluso PetaBytes. Hay que tener en cuenta que lo que ahora nos parece mucha cantidad de información dentro de un par de años o tres será algo normal. Pronto accederemos a la era del ‘ZettaByte’.
  • Variedad: El concepto de Big Data también suele venir acompañado de diversos tipos de fuentes de datos, ya sean estructurados o no estructurados.
  • Velocidad: La frecuencia de las actualizaciones de estas grandes bases de datos también es un punto muy a tener en cuenta. Es por ello por lo que su procesamiento y posterior análisis también ha de realizarse prácticamente en tiempo real para poder mejorar la toma de decisiones en base a la información generada.

Para 2012 se espera que las soluciones capaces de mantener el control sobre estas tres características sean cada vez más. Un caso de éxito interesante es el del proyecto Hadoop, basado en código abierto y que ha sido adoptado por muchos fabricantes, incluidos IBM, Microsoft, Jaspersoft…, dentro de sus desarrollos y soluciones. De entre sus bondades destaca la eficacia con la que se almacena la información para su posterior procesamiento y reproducción de informes personalizados.

SAP y su tecnología HANA, capaz de transferir íntegramente los datos almacenados en disco directamente a la memoria de los servidores, también ha dado un importante paso hacia delante, sobre todo a la hora de obtener los resultados solicitados prácticamente en tiempo real. Lo que ahora se consigue en un par de segundos mediante esta arquitectura, antes requería de horas e incluso días. Con ello se mejora exponencialmente la toma de decisiones en las empresas y, por ende, la continuidad de los negocios.

Pablo Fernández

Informático reconvertido a periodista, Pablo Fernández Torres comenzó su andadura profesional como redactor técnico y coordinador web en la revista PC Actual. Tras 7 años en esta publicación decidió dar el salto al segmento IT profesional para liderar el lanzamiento a finales de 2008 de la cabecera Silicon en España y posteriormente en la región LATAM. En la actualidad ejerce como director editorial de NetMedia International para España, Reino Unido, Alemania, Portugal y Latinoamérica.

Recent Posts

Atlassian Team ’25: IA incluida, cloud seguro y el futuro del trabajo en equipo

Atlassian inaugura Team ’25 con IA para todos, seguridad cloud reforzada y alianzas estratégicas como…

13 horas ago

Synology apunta al mercado de gama alta

Los excelentes resultados cosechados en los últimos años, con un crecimiento medio en España del…

15 horas ago

DE-CIX marca un nuevo récord de tráfico de datos: 25 terabits por segundo

La cifra es fruto de la acumulación protagonizada por diversa ubicaciones, incluyendo Madrid.

18 horas ago

Snowflake anuncia soporte completo para las tablas Apache Iceberg

“Los clientes no deberían tener que elegir entre formatos abiertos y un rendimiento superior, o…

18 horas ago

El mercado de PC enfrenta un 2025 desafiante

IDC advierte sobre el incremento de los aranceles por parte de Estados Unidos y sus…

19 horas ago

Kaspersky se incorpora al Centro de Ciberseguridad de Dispositivos Conectados de León

Este hub incluye un módulo de innovación en ciberseguridad, que presentará las soluciones de Kaspersky…

19 horas ago