Categories: Cloud

El CAPTCHA también sirve para digitalizar libros antiguos

Para muchos el CAPTCHA no es sino un engorroso sistema que utilizan los sitios web para filtrar spam (en nuestro blog tuvimos que quitarlo). Al parecer, se usan unos 200 millones de veces al día, con lo que, según los informáticos que trabajan en este proyecto, “la humanidad gasta unas 500.000 horas al día en escribir estas letras vailables”.

Luis von Ahn, de la Universidad Carnegie Mellon de Pittsburg, y su equipo de científicos, dicen que es un tiempo demasiado valioso como para perderlo de esa manera. Por eso han desarrollado un nuevo programa, el reCAPTCHA, que recoge las palabras que resultan ilegibles para los escáneres ópticos cuando están digitalizando los textos antiguos. Estas palabras, se envían después a los sitios Web que quieran cooperar con el proyecto para que las coloquen como CAPTCHAs aleatorios. Para las palabras más difíciles, se utilizan múltiples usuarios y se elige la que haya tenido mayor consenso. De esta forma se obtiene una precisión del 99 por ciento, según aseguran los responsables.

Este sistema reCAPTCHA recoge ya automáticamente unos 4 millones de respuestas cada día de 40.000 páginas web adheridas al proyecto, lo que equivale a 1.500 personas trabajando a tiempo completo para transcribir 60 palabras por minuto, explicó von Ahn.

El servicio está disponible en www.recaptcha.net, es gratuito para cualquier web que lo solicite. Después de un año de funcionamiento, ha ayudado a resolver unos 440 millones de palabras. Por ejemplo, el equipo de von Ahn ha digitalizado el archivo completo de periódicos de 1908 del New York Times ayudándose de este sistema.

vINQulos
Science

ddelgado TI

Recent Posts

Innovación, IA y crecimiento en el centro de la estrategia de Lenovo

Durante el Lenovo Tech World Iberia 2024, la compañía desgranó los buenos resultados de todas…

2 horas ago

Los españoles gastarán 375 euros de media en compras online durante el Black Friday y el Cyber Monday

Los productos electrónicos son los favoritos de quienes hacen sus compras por internet, seguidos de…

2 horas ago

Hacia los 107.000 millones de dólares de gasto en infraestructura de IA

IDC prevé esa cifra para 2028, a medida que el mundo incrementa la adopción de…

3 horas ago

Los envíos de ‘smartphones’ crecerán este año más de un 6%

IDC pronostica un incremento del 6,2 % hasta los 1.240 millones de unidades.

4 horas ago

Fugaku lidera las clasificaciones HPCG y Graph500

Este sistema de supercomputación marca un récord en la clasificación sobre gráficos con más de…

5 horas ago

En España, 2 de cada 3 empresas ni forman ni informan en ciberseguridad

Las medidas más populares son el 'backup', la protección frente al 'malware' y el almacenamiento…

7 horas ago