Google relanza Data Cleanser, ahora conocido como Google Refine

Google ha actualizado y relanzado Google Cleaner, su software de código abierto para la limpieza, análisis y transformación de conjuntos de datos. El software, ahora bautizado como Google Refine 2, se llamaba originalmente Freebase Gridworks y procede de Metaweb, una compañía que Google compró el pasado mes de julio.

Google Refine es una colección de herramientas que podrían ser muy útiles cuando se trata de conseguir información útil de un conjunto de datos, particularmente cuando en ellos existen inconsistencias. Google Refine podría, por ejemplo, encontrar las variantes ortográficas de una palabra y reemplazarlas con el término apropiado. Este procedo, llamado normalización no es nuevo, pero normalmente requiere que se escriba un código para cada conjunto de datos.

Además, el software tiene una serie de otras herramientas, como un lenguaje de expresión que se puede utilizar para analizar un conjunto de datos; también se pueden utilizar filtros para aislar subconjuntos de datos, que después se pueden analizar o cambiar a través de un serie de comandos.

Google Refine también trabaja con archivos de texto sin formato, datos que se pueden dividir en diferentes columnas mediante el uso de comas.

No obstante, Google ha anunciado que ha añadido varias nuevas características al software, oficialmente llamado Google Refine 2.0, como la capacidad para unir los datos de otras bases de datos y una nueva serie de comandos de transformación y expresiones.

Silicon Redacción

La redacción de Silicon está compuesta por periodistas y redactores especializados en Tecnologías de la Información y Comunicaciones.

Recent Posts

“La IA allanará el camino hacia una jornada laboral más corta”

LinkedIn comparte una lista con las cinco tendencia que definirán la senda del mercado laboral…

29 mins ago

9 tendencias para 2025 en el campo de la ciberseguridad

Proopoint cree que el año que viene los delincuentes manipularán datos privados asociados a la…

2 horas ago

El sector TIC español invertirá más en innovación a lo largo del próximo año

Las implantación de nuevas herramientas, la optimización de productos ya existentes y la adopción de…

3 horas ago

8 de cada 10 responsables de seguridad optan por la IA generativa basada en plataformas

La mayoría renovaría por completo su infraestructura de seguridad para adoptar soluciones totalmente integradas.

4 horas ago

PUE DATA: “Sin duda, el 2025 la explosión de los espacios de datos”

Entrevistamosa Sergio Rodríguez, CTO de PUE DATA, para hablar del "boom" de los espacios de…

4 horas ago

Los mensajes RCS, otra vía de acceso para ciberataques

Los mensajes RCS ofrecen muchas más posibilidades que los SMS, pero también abren la puerta…

2 días ago