Ordenadores con ‘sentido común’. Sí, han oído bien. En esa dirección trabaja Google Labs y su widget Google Sets, que ha posibilitado a investigadores de las universidades de UC San Diego y UCLA añadir la habilidad de usar el contexto para ayudar a identificar objetos en fotografías en un sistema de etiquetado de imágenes automático.
Así, si un tradicional identificador de objetos escanea una imagen de una persona jugando a fútbol, identificará ‘persona’, ‘árbitro’, ‘estadio’ de fútbol’ y ‘melón’; ante lo que este nuevo sistema completará de manera correcta la secuencia y en vez de ‘melón’ pondrá ‘pelota’.
“Creemos que se trata de la primera ocasión en la que ha llegado a la contextualización al problema del reconocimiento de los objetos”, ha afirmado el profesor Serge Belongie, de la UC San Diego. Google Sets genera listas de ítems relacionados en base a algunos ejemplos. Si un usuario pone ‘John’, ‘Paul’ y ‘George’, se le aparecerán las palabras ‘Ringo’, ‘Beatles’ y ‘John Lennon’. Al igual que si escribes ‘do’, ‘re’, ‘mi’, te responderá ‘fa’, ‘sol’, ‘la’, ‘si’. “De algún modo, Google Sets supone un acercamiento al sentido común. Hemos probado que puedes utilizar ese sentido común para otorgar información contextualizada que mejora la precisión de los sistemas automáticos de etiquetados de imágenes”, ha señalado el investigador.
El sistema de etiquetado de imagen es un proceso con tres pasos a seguir. Al principio, un sistema automático divide la imagen en varias partes. Entonces, automáticamente se dispone de una lista clasificada con posibles etiquetas para cada una de esas partes. Por último, el sistema añade una dosis de contexto procesando todas las posibles combinaciones de la imagen, maximizando el acuerdo contextual entre las etiquetas de cada imagen.
Ofrece hasta 1 millón de dólares de compensación económica en caso de incidente, con la…
Este cambio refleja los avances que se producen a nivel de infraestructura TI y el…
El evento espera reunir a 17.000 directivos, que podrán escuchar a medio centenar expertos en…
Como resultado de esta operación, ampliará sus servicios en el "bronze layer" del ciclo de…
Durante el segundo trimestre de su año fiscal 2025 acumuló 1.660 millones de dólares, la…
También incluye un SDK open source para potencia el desarrollo de aplicaciones y agentes, especialmente…