Facebook publica el código de Presto, su motor de consultas SQL para Big Data
La red social defiende que Presto termina con el dilema de elegir entre soluciones analíticas rápidas y caras o herramientas gratuitas y lentas.
Cumpliendo con lo que había prometido, Facebook ha decidido publicar Presto como código abierto bajo licencia Apache v2.
¿Y qué es Presto? Tal y como lo definen sus resposables, se trata de “un motor distribuido y open source para consultas SQL” con capacidad para “ejecutar consultas analíticas interactivas con fuentes de datos de todos los tamaños, desde gigabytes hasta petabytes”.
Es más, la velocidad sería uno de sus fuertes, hasta tal punto que rompería con la creencia de tener que elegir “entre analíticas rápidas empleando una solución comercial cara o utilizar una solución gratuita [pero] lenta que requiere de hardware excesivo”.
Se calcula que Presto es capaz de devolver su respuesta en cuestión de segundos.
Un millar de empleados de Facebook lleva ya unos cuantos meses utilizando esta solución para ejecutar más de 30.000 consultas individuales, que en total suponen más de un petabyte por día.
Los interesados pueden descargar el código de Presto desde GitHub.