EMC: “No tenemos que amoldar el dato a la técnica de análisis, sino la técnica de análisis al dato”

Uno de los fenómenos que más está transformando la forma de hacer negocios hoy en día, porque entre otras cosas permite a las empresa fundamentar mejor sus decisiones y buscar la rentabilidad, es el Big Data. Es decir, esa gran cantidad de datos que uno mismo va generando y también recibiendo por parte de diversas fuentes, y que hay que aprender a almacenar, analizar y poner en valor. Y que a su vez está dando lugar a términos nuevos, como el Business Data Lake que impulsan desde EMC. Sobre este concepto y otras cuestiones ha hablado nuestro director editorial, Pablo Fernández, con el responsable de Tecnologías Emergentes de EMC España, César Tapias, en una entrevista que reproducimos a continuación. Y en la que también ahondamos a lo largo de estas líneas.

Entrevista a César Tapias, responsable de Tecnologías Emergentes de EMC España

“Podríamos decir que un Data Lake es un repositorio de información en formato nativo”, define César Tapias, “que está preparado para interactuar con usuarios y aplicaciones para poder extraer lo más fácilmente [posible] valor de esa información”. Este directivo comenta que “el término lake nace para expresar la magnitud del problema al que nos enfrentamos” ahora mismo, ya “que realmente Big Data lo que propone es que todo contenido es importante hasta que se demuestre lo contrario. Y esto significa que cualquier información nos puede dar una perspectiva nueva sobre un problema para tratar de llegar a una conclusión”, desde la que procede de “datos internos” a la vinculada a “fuentes externas”. Porque al final habrá, dice Tapias, “un montón de fuentes diferentes y diferentes formatos”. Mientras, “business viene a proponer el fin”, que no es otro que “extraer valor de esa información. Ser capaz de analizarla y ser capaz de optimizar la forma en que hacemos las cosas” para “obtener una ventaja competitiva”.

A la hora de enfrentarse a los datos masivos, Tapias dice que hoy por hoy “el primer paso es asumir que no podemos hacer las cosas de igual manera. Tradicionalmente lo que solíamos hacer en un entorno de analíticas es preclasificar la información. En función de estereotipos, de prejuicios, o de experiencia, ya decidimos qué es importante y qué no es importante. Y luego” lo habitual sería pasar a “formatearlo para poder consumirlo”. Siendo conscientes de la cantidad de datos que los negocios manejan en la actualidad, “esto no es viable”, compara el responsable de Tecnologías Emergentes de EMC España, “y además no tiene sentido amoldar el dato o cambiar el dato, en función de la técnica de analítica”. Es más, “no tenemos que amoldar el dato a la técnica de análisis, sino la técnica de análisis al dato. Tenemos que tener en cuenta que a día de hoy el volumen de datos es exponencial, y el 80% de ese volumen es contenido no estructurado”, razona nuestro entrevistado.

Ahora se encauzarían los análisis hacia predicciones y “un plan de acción para mitigar el impacto de las cosas que van a pasar. Con lo cual, otra cosa que hay que tener en cuenta es la agilidad que necesitamos en estos entornos”, continúa César Tapias, que advierte de que muchas veces “el tiempo entre obtener un dato y extraer la información es crítico” por lo que “el entorno de analíticas tiene que ser parte de una infraestructura de IT, transaccional” y demás. Otras condiciones consisten en que sea “escalable” y que “dé acceso universal”, de tal modo que haya “comunicación de ese repositorio con cualquiera que quiera consumir el dato”. Teniendo en cuenta todas estas cosas y exponiendo que “hemos querido un poco poner nuestro grano de arena”, Tapias habla del Federation Business Data Lake de EMC como “la primera arquitectura open source para crear un data lake totalmente integrado”.

Según este directivo, “hemos seleccionado casos de uso por sector para saber qué tecnologías se aplican en función de cada caso de uso, y una vez tengamos las tecnologías claras, obviamente lo que hemos hecho es tratar de acelerar la implementación”. Además, destaca que se han constituido “workshops a medida” para quienes no tengan las ideas claras y no sepan “lo que es un Big Data o un Data Lake, para tratar de exponerle muchos casos de uso en función de su sector”. Por otra parte, Tapias apunta a la “ayuda al despliegue” con un portal “creado bajo las tecnologías de EMC, que lo que me permite es precisamente identificar las tecnologías con los casos de uso”. Es decir, “aporta esa flexibilidad para desplegar en días lo que antes se tardaba meses” y se dirige “directamente a la gente de negocio” de forma que “el departamento de IT es capaz de crear una infraestructura y es capaz de dársela a cada uno de los departamentos para que aplique al caso que les atañe a cada uno”.

Mónica Tilves

Licenciada en Xornalismo por la Universidad de Santiago de Compostela en la especialidad de Periodismo Electrónico y Multimedia. Apasionada de los gadgets, la fotografía digital, el diseño web y el arte. Tras un primer contacto con el mundo de la prensa escrita y con la suficiencia investigadora debajo del brazo, me decanto por los medios online. Cubro la actualidad informativa en Silicon Week desde 2011, además de colaborar en otras publicaciones del grupo NetMediaEurope en España como Silicon News. Ahora en Silicon.es.

Recent Posts

Los CIO, desarrolladores de front-end y científico de datos, entre los perfiles mejor pagados del sector tecnológico

Los profesionales de tecnología de la información, telecomunicaciones y comercio electrónico reciben un salario de…

14 mins ago

Konica Minolta muestra las capacidades de su solución de gestión documental Waidok

Ha reunido a directivos de diferentes sectores en Madrid para presentar esta herramienta basada en…

1 hora ago

Making Science lanza la división tecnológica Raising

Pensada para potenciar las estrategias de marketing con inteligencia artificial, incluye herramientas como ad-machina, Gauss…

2 horas ago

NVIDIA lanza un superordenador compacto y asequible para IA generativa

Jetson Orin Nano Super Developer Kit proporciona una plataforma potente para entrenar y perfeccionar herramientas…

2 horas ago

4 de cada 10 profesional ya redactan sus currículos con ayuda de la IA

Esta popularización de la inteligencia artificial pone en valor la parte humana de fases posteriores,…

3 horas ago

La mitad de los ingresos de Micron Technology ya procede de los centros de datos

Durante el primer trimestre de su año fiscal 2025, sus ingresos totales rebasaron los 8.700…

3 horas ago