150.000 horas perdidas diariamente por CAPTCHA

El bueno del sistema CAPTCHA que durante bastante tiempo protegió a esta web de los incordiosos spammers -Ahora de esa tarea se encarga Akismet-, es efectivo pero nada eficiente.

Eso lo sabe Luis von Ahn, uno de los pioneros en su uso y creador del proyecto reCAPTCHA.

El CAPTCHA original se basa en cadenas de caracteres generados aleatoriamente, sin embargo este nuevo sistema utililza palabras escaneadas directamentes de libros antiguos.

El sistema va más allá y conlleva una doble finalidad. El 8% de las palabras escaneadas de libros antiguos no se pueden digitalizar automáticamente, por lo que se requiere que una persona las escriba manualmente con el consumo de tiempo que esto conlleva.

Bajo el lema “stop spam, read books”, reCAPTCHA utiliza estas palabras que no pueden ser digitalizadas para permitir o no la publicación de comentarios, ahora viene la pregunta clave, ¿si no se conoce la versión digitalizada de esa palabra, como sabe el sistema que la palabra se ha respondido correctamente? En cada formulario reCAPTCHA se pide que se escriban dos palabras, una de ellas conocida para el sistema y la otra no.

recaptcha.jpg

El sistema presupone que si acertamos con la palabra conocida lo haremos también con la otra, y así esta pasaría a estar digitalizada, dos pajaros de un tiro, impedir el spam y colaborar en la vital tarea de digitalizar el mayor número posible de libros.

Seguiremos empleando esas 150 mil horas, pero al menos con este sistema servirán a una buena causa.

vINQulos
reCAPTCHA.net
EcoGeek