Google relanza Data Cleanser, ahora conocido como Google Refine

Google ha actualizado y relanzado Google Cleaner, su software de código abierto para la limpieza, análisis y transformación de conjuntos de datos. El software, ahora bautizado como Google Refine 2, se llamaba originalmente Freebase Gridworks y procede de Metaweb, una compañía que Google compró el pasado mes de julio.

Google Refine es una colección de herramientas que podrían ser muy útiles cuando se trata de conseguir información útil de un conjunto de datos, particularmente cuando en ellos existen inconsistencias. Google Refine podría, por ejemplo, encontrar las variantes ortográficas de una palabra y reemplazarlas con el término apropiado. Este procedo, llamado normalización no es nuevo, pero normalmente requiere que se escriba un código para cada conjunto de datos.

Además, el software tiene una serie de otras herramientas, como un lenguaje de expresión que se puede utilizar para analizar un conjunto de datos; también se pueden utilizar filtros para aislar subconjuntos de datos, que después se pueden analizar o cambiar a través de un serie de comandos.

Google Refine también trabaja con archivos de texto sin formato, datos que se pueden dividir en diferentes columnas mediante el uso de comas.

No obstante, Google ha anunciado que ha añadido varias nuevas características al software, oficialmente llamado Google Refine 2.0, como la capacidad para unir los datos de otras bases de datos y una nueva serie de comandos de transformación y expresiones.

Silicon Redacción

La redacción de Silicon está compuesta por periodistas y redactores especializados en Tecnologías de la Información y Comunicaciones.

Recent Posts

Bitdefender lanza un programa de garantía contra violaciones de seguridad

Ofrece hasta 1 millón de dólares de compensación económica en caso de incidente, con la…

11 horas ago

Cloud Expo evoluciona a Cloud & AI Infrastructure

Este cambio refleja los avances que se producen a nivel de infraestructura TI y el…

12 horas ago

DES2025 se centrará en la IA y ofrecerá una zona de experiencia tecnológica

El evento espera reunir a 17.000 directivos, que podrán escuchar a medio centenar expertos en…

13 horas ago

Snowflake llega a un acuerdo con Datavolo para su adquisición

Como resultado de esta operación, ampliará sus servicios en el "bronze layer" del ciclo de…

13 horas ago

NetApp aumenta un 6 % sus ingresos trimestrales

Durante el segundo trimestre de su año fiscal 2025 acumuló 1.660 millones de dólares, la…

14 horas ago

Denodo Platorm 9.1 estrena asistente de inteligencia artificial

También incluye un SDK open source para potencia el desarrollo de aplicaciones y agentes, especialmente…

15 horas ago