Cloudera fortalece su plataforma de datos híbrida con open data lakehouse

La gestión del dato, a día de hoy, se lleva a cabo mediante un método híbrido. Según un estudio de Statista, la cantidad de datos que se generan, se copian y se consumen a nivel mundial ha pasado de ser menos de 1ZB en 2011 a, aproximadamente, 14 ZB en 2020. A los que hay que añadir otros 50 ZB de datos no estructurados en la nube.

Capitalizar todo esto requiere de recursos como los ‘data lakes’, repositorios centralizados y escalables y escalables diseñados para almacenar, procesar, analizar y proteger grandes cantidades de datos de cualquier tipo. Este tipo de herramientas promueven el uso de análisis de datos de misión critica a gran escala, business intelligence y machine learning, al igual que el uso de data warehouse empresariales.

Durante los últimos años se ha especificado el termino ‘data lakehouse’, que combina los beneficios de un data warehouse y de un data lake, pero con un pequeño hándicap: mientras que los “lagos” son abiertos, los lakehouses no.

“Los clientes exigen cada vez más desde el principio. Más formatos, más motores, más interoperabilidad. Y eso solo se consigue con lakehouse abiertos”, comenta Juan Carlos Sánchez de La Fuente, Regional Director España y Portugal de Cloudera. “Un data lakehouse abierto aborda los problemas de interoperabilidad y de arquitectura en su core. Innovar consiste en resolver los problemas con las mejores herramientas, sin importar el proveedor, de ahí la necesidad de este salto en la concepción de este tipo de infraestructuras”, añade.

Teniendo esto en cuenta, Cloudera, la empresa de datos en la nube híbrida, ha anunciado que Apache Iceberg está disponible en su plataforma Cloudera Data Platform (CDP) como parte de su estrategia en pro del open source.

Surgido como un proyecto de Netflix que después se donó a la Fundación Apache Software en 2018, Apache Iceberg es un formato abierto de alto rendimiento que nace en la nube y es capaz de escalar los petabytes independientemente de la capa de almacenamiento que exista por debajo y de la capa del motor de acceso.

Ana Suárez

Recent Posts

Los mensajes RCS, otra vía de acceso para ciberataques

Los mensajes RCS ofrecen muchas más posibilidades que los SMS, pero también abren la puerta…

1 día ago

Telefónica Empresas ayudará a Microsoft a expandir los Copilot+ PC por España

Acompañará a las empresas en sus procesos de equipamiento, desde la elección del hardware hasta…

2 días ago

IBM y Esade promueven el uso de la IA en los Consejos de Administración

Juntos, trabajarán en la formación y la actualización de habilidades para que los consejeros impulsen…

2 días ago

ASUS lanza un Mini PC con inteligencia artificial

Este dispositivo incluye entre sus especificaciones procesador Intel Core Ultra (Serie 2) y botón Copilot.

2 días ago

EasyVisa adquiere una participación mayoritaria en OTRS Group

Ya cuenta en su poder con más del 90 % de las acciones del proveedor…

2 días ago

SoftwareOne y Crayon acuerdan fusionarse

Los actuales consejeros delegados, Raphael Erb y Melissa Mulholland, se convertirán en co-CEOs de la…

2 días ago