Cloudera: “El gran reto no está en coger los datos y almacenarlos, sino en entenderlos y gestionarlos”
Entrevistamos a Juan Carlos Sánchez de la Fuente, vicepresidente regional de Cloudera para España y Portugal, que repasa la actualidad en materia de gestión de datos, su apuesta por el código abierto y la revolución que está viviendo la industria con la IA generativa.
Cloudera, compañía de software fundada en 2008, se ha convertido en un referente en el campo de la gestión de datos corporativos. La empresa fue creada por ex-empleados de Google, Yahoo, Facebook y Oracle con la misión de desarrollar una distribución empresarial del framework Apache Hadoop, que es un sistema de software de código abierto para el almacenamiento y procesamiento de grandes conjuntos de datos.
Es decir, sus inicios siempre han estado marcados por el desarrollo de soluciones basadas en código abierto. Desde entonces ha ido diversificando su oferta y añadiendo nuevas capacidades de forma orgánica y a través de adquisiciones y fusiones para modelar lo que en la actualidad es su buque insignia, Cloudera Data Plaform, una plataforma que combina capacidades on-premise y en la nube, facilitando la gestión de datos híbridos y multicloud en las organizaciones.
De todo esto y más nos ha hablado Juan Carlos Sánchez de la Fuente, vicepresidente regional de Cloudera para España y Portugal. El directivo cuenta con una amplia trayectoria en el sector tecnológico trabajando en empresas como Oracle, Tata Consultancy Services, ServiceNow y, desde hace casi 5 años, siendo máximo responsable de la filial de Cloudera en la región ibérica.
A continuación, la entrevista con Sánchez de la Fuente:
— Para entrar en materia, ¿cómo está yendo el negocio de Cloudera en España durante este año?
Cloudera cierra su año fiscal el 31 de enero, por lo que el primer semestre del año se cerrará el 31 de julio. Como ya sabes, no ofrecemos cifras concretas de negocio, pero sí te puedo decir que este ejercicio está siendo positivo. El H1 está siendo un buen semestre y estamos en línea con los objetivos marcados. Además, hemos conseguido nuevos clientes y estamos incorporando más personas a nuestra plantilla.
A esto hay que añadir que el último trimestre del año suele ser muy importante porque se concretan proyectos que vienen de meses anteriores.
Todo ello siempre con cautela porque estamos viendo iniciativas en el mercado, pero también que muchas compañías han vuelto a una dinámica de control de gestión de los gastos operativos (OPEX), aunque hay dinero para invertir en CAPEX.
Las empresas privadas, dentro de esa cautela, tienen dinero para invertir en nuevas iniciativas, sobre todo aquellas relacionadas con la inteligencia artificial. Aún hay pocos proyectos en producción y se espera que poco a poco esta área se desarrolle cada vez más.
En la administración pública, un sector muy importante para nosotros, vemos movimiento, aunque lento porque hay cambios en los equipos de gobierno que ralentizan proyectos de hace 6 o 7 meses y cuyas licitaciones en curso están pendientes de adjudicación.
Esos presupuestos están asegurados, por lo que, para nosotros, el año es ilusionante.
— ¿Qué impacto están teniendo los fondos NextGen de la Unión Europea? Hay mucho dinero sobre el papel, pero se está ralentizando mucho su ejecución. ¿Cuál es tu visión en este aspecto?
Es cierto que estos fondos crearon presupuestos adicionales, pero en estos momentos de cambios políticos en la Unión Europea se pueden producir ciertos ajustes y decisiones que están por ver. En cualquier caso, las empresas y organizaciones públicas avanzarán en proyectos e ideas que han estado desarrollando desde hace tiempo gracias a estos fondos.
Bajo mi punto de vista, lo importante es que estas organizaciones puedan sacar el verdadero valor de sus datos, pero sin prisas para ejecutar estos fondos, de tal forma que no se hagan cosas para luego dejarlas en un cajón.
— …Es algo que tiene aún más repercusión si hablamos de los datos que manejan las organizaciones públicas, donde los diseños y las arquitecturas iniciales son fundamentales para que después se pueda tratar correctamente toda esa información y ayudar más eficientemente a los ciudadanos…
Totalmente de acuerdo. Hay personas muy capacitadas para tomar las decisiones correctas, pero hay que darles espacio, tiempo, autonomía y capacidad para poder decidir. Hay fondos, pero las administraciones públicas tienen que ponerlos en los sitios correctos.
Desde Cloudera, es nuestra responsabilidad acompañarles y aconsejarles en todo ese ciclo y aportarles un valor diferencial para que esos proyectos sean un éxito. Para ello hay que ofrecerles flexibilidad.
— El sector privado también es muy importante para vosotros, ¿en qué áreas os estáis enfocando más?
Históricamente las áreas en las que Cloudera tiene más presencia son Banca y Seguros. Aquí trabajamos con las principales organizaciones en esa transformación que se ha estado realizando a lo largo de los últimos años.
Pero hay otras áreas donde estamos abordando proyectos muy importantes, como es el caso de la Industria 4.0 y todo lo que tiene que ver con las cadenas de suministro y la automoción; las empresas de Consumo y todo el ciclo de vida de los procesos de manufactura y el sector Retail, que siempre ha sido un sector muy avanzado en materia de analítica de datos desde el punto de vista del consumidor final.
En este sector, se están implementando cada vez más todo tipo de proyectos de inteligencia artificial y analítica avanzada para aumentar las ventas, tanto a nivel de supermercado como de procesamiento y la gestión de plantas.
Por último, me gustaría señalar sectores como el Energético o el de Utilities, donde España tiene compañías líderes a nivel europeo y con una posición mundial muy consolidada. Son empresas innovadoras y cada vez más “data driven” que toman decisiones en base a sus datos pero que aún tienen mucho camino por recorrer en este campo.
— ¿Cuáles son los principales retos a los que se enfrentan actualmente todas estas organizaciones?
Son los retos que nos hemos ido encontrando históricamente, principalmente la capacidad de gestionar toda la información que manejan. Es un problema cada vez más complejo por la explosión de los datos que estamos viviendo durante esta década.
En el pasado se despreciaban muchos datos que hoy, gracias a la inteligencia artificial, es posible procesarlos para extraer un gran valor. Los dispositivos IoT, las redes 5G y un largo etcétera de fuentes están generando información realmente valiosa, pero hay que aprender a procesarla y estructurarla. Y este es el principal problema que tienen las organizaciones.
En un estudio que realizamos hace tiempo, encontramos que las organizaciones solamente están usando un tercio de sus datos porque no son capaces de gestionar toda esa información.
El gran reto no está en coger los datos y almacenarlos, sino en cogerlos, entenderlos y gestionarlos. Hablamos de datos estructurados y no estructurados, como los vídeos. En los vídeos existe mucha información valiosa que ya es posible analizar y extraer, algo que, en el pasado, con la tecnología de ese momento, era imposible conseguir.
— Aquí es donde entra en juego la tecnología de Cloudera. ¿Cómo respondéis a estos retos?
En primer lugar, te puedo hablar de una de nuestras piedras angulares, el desarrollo de una plataforma abierta y realmente híbrida. ¿Qué significa esto de que una plataforma sea realmente híbrida? Que los clientes no se tengan que preocupar de dónde alojar los datos, cómo alojarlos, qué infraestructura utilizar… sino que se puedan centrar en procesar esos datos y conseguir la máxima calidad. Cloudera les ayuda a crear ese ecosistema de datos de forma independiente a la forma en la que el cliente decida tenerlos, ya sea en un entorno privado, en la nube o en multicloud.
Nosotros proporcionamos las herramientas para interconectar todos los orígenes y construir una interoperabilidad de los datos. Muchas organizaciones tienen sistemas en silos que se han ido creando que no son capaces de hablar entre ellos, algo que nuestra plataforma consigue.
Más aún, nuestros clientes no tienen que trabajar únicamente con Cloudera, ni muchísimo menos. Al ser una plataforma abierta, nosotros también conectamos con otras plataformas de datos para conseguir un repositorio unificado, de tal forma que los clientes puedan tener control total y visibilidad de toda la información desde un único cuadro de mandos.
Un segundo punto que me gustaría recalcar es que Cloudera es una plataforma híbrida real, lo que significa que no realizamos ninguna transformación, réplica, copia o vinculación del dato si no es estrictamente necesario. Nuestra plataforma trabaja con el dato en su origen de forma independiente al lugar donde esté almacenado.
En este sentido me gusta hablar del Open Data Lakehouse, que es algo así como una fusión de todo lo mejor de las arquitecturas que han ido apareciendo a lo largo de estos años para gestionar la información, como es el caso de Data Warehouse y Data Lake. Se trata de una arquitectura de análisis de datos que combina el almacenamiento eficiente de los Data Lakes con la potente analítica que ofrecen los Data Warehouses.
A través de Apache Iceberg, basado en código abierto, nuestra plataforma es capaz de extraer los beneficios de esas arquitecturas sin necesidad de volcar datos para poder aplicar analítica avanzada sobre todos los repositorios de datos.
Con el paso del tiempo, se ha demostrado que Apache Iceberg, una tecnología para conjuntos de datos analíticos muy grandes, es la correcta y es la que está adoptando la industria, siendo Cloudera uno de los principales contribuyentes de este proyecto Open Source.
— ¿Cuál es la visión de Cloudera con respecto a la inteligencia artificial? Lleváis años implementándola en vuestra plataforma, pero ahora nos encontramos frente al boom de la IA generativa. ¿Qué nos puedes contar sobre esta gran revolución?
Sí, hace tiempo que trabajamos en iniciativas basadas en IA, pero hace año y medio se produjo una explosión alrededor del concepto de IA generativa que ha supuesto un cambio de paradigma a la hora de afrontar ciertos proyectos.
Los avances que se han producido son abismales y nosotros hemos adoptado, de nuevo, el Open Source para proporcionar a nuestros clientes capacidades de IA generativa ya existentes, pero con la importante premisa de trabajar en entornos donde no se comparte información corporativa, como sí ocurre con el popular ChatGPT.
Los datos son el bien más preciado de las organizaciones, por lo que estamos trayendo la IA generativa a los datos y no al revés. Proporcionamos las herramientas para que los datos corporativos no se tengan que mover ni compartir con nadie. Las organizaciones que deseen hacer uso de estas tecnologías pueden incorporar los modelos de lenguaje grande (LLM) ya creados y esas herramientas basadas en código abierto dentro de nuestra plataforma para que se combinen con la información sin que salga un solo bit del entorno corporativo.
— Otro de los retos a los que se enfrentan las organizaciones es la captación y gestión del talento. Un problema generalizado en el sector tecnológico. ¿Cómo lo afronta Cloudera?
Efectivamente, es un reto muy importante. Cloudera aboga por el software libre, algo que abre un abanico de posibilidades si atendenmos a la cantidad de profesionales capacitados que no se encuentra cuando se desarrollan tecnologías propietarias que requieren de un aprendizaje específico.
Para nosotros, la apuesta por el Open Source desde los inicios es la única manera de encontrar profesionales y recursos. Aquellos que se forman en software libre saben que van a poder aplicarlo a cualquier ámbito y prácticamente en cualquier compañía.
Aun así, la gestión del talento es algo complicado. Hay que apostar mucho por la formación continua y así lo trasladamos a los clientes, ayudándoles a conseguir esa continuidad. Tenemos un plan de formación y estamos trabajando también con organizaciones a nivel gubernamental como el SEPE o la Comunidad de Madrid para ayudar en la formación de talento. En el ámbito privado, tenemos partners específicos en España con una alta capacidad de formación con los que trabajamos para desarrollar estos planes formativos.