Captcha vs ReCaptcha

Prácticamente todos los días nos topamos con un CAPTCHA. Tal vez no sepamos el nombre, CAPTCHA son las siglas en inglés de “Prueba automática de Turing para diferenciar computadoras de humanos”, y nació como un esfuerzo de la comunidad para evitar el SPAM, esos molestos mensajes que en forma automática entran en foros, comentarios de sitios web, etc.

Se trata de una prueba-desafío que se le presenta a una persona antes de permitir que ingrese un comentario. La idea es que para una persona estas letras un poco dobladas y con fondos confusos no debería presentar un problema mayor para determinar el contenido, pero para un sistema automatizado es una tarea extremadamente difícil. De esa forma, los bots o robotitos que andan tratando de poner publicidad en todos lados (es un negocio millonario) no pueden publicar, y nosotros sí.

El creador del Captcha cuenta que estaba contento con su invento, hasta que se dio cuenta que se ingresan millones de captchas por hora, y que llevan un promedio de 7 segundos resolver cada uno. Por lo que hay muchísimo tiempo desperdiciado, y según sus propias palabras, “se sintió mal”.

[quote type=”center”]Cada vez que ingresamos un ReCaptcha estamos ayudando a digitalizar libros[/quote]Por eso inventó el ReCaptcha, una variación que contiene dos palabras en lugar de una. ¿Cómo eso puede ser una mejora?. Bueno, es que escribir una o dos palabras lleva casi el mismo tiempo, y una de las palabras se utiliza como antes para validar nuestro ingreso, pero la otra proviene de la digitalización de libros automática.

captcha2Desde el desarrollo de este sistema, millones de páginas han sido digitalizadas, en forma absolutamente gratuita. Para asegurar que la palabra que pusimos sea correcta, se repite la misma palabra en decenas de personas, y se toma la respuesta común en todas ellas. Así que no hay dificultad con que tipemos mal una vez parte del recaptcha. Ingenioso, verdad?. Además, solo se utilizan palabras que la computadora no fue capaz de reconocer en forma automática, asi se ahorra tiempo extra.

Si los Captcha no existieran, los sitios como Ticketmaster (venta de entradas para eventos online) no podrían existir, porque los sistemas automatizados comprarían en un segundo todas las entradas para reventa. O se abririan miles de cuentas de hotmail para enviar spam. Realmente es importante lo que han hecho.

De acuerdo a uno de los desarrolladores (Luis von Ahn), nos da algunos números. Algo de 200 millones de Captchas son tipeados cada día en el mundo, que en tiempo significan algo como 500.000 horas por día!!!!. Con la ayuda de la comunidad, esto significa algo de 100 millones de palabras digitalizadas por día. Increíble, cierto? 100 millones de palabras por día!.

Abajo dejo el video donde el creador lo explica, y termina con un nuevo proyecto, llamado DUOLINGO, que es una extensión, donde ayudamos a traducir los sites de internet, mientras a cambio nos enseñan un nuevo idioma. Posiblemente lo explique en detalle en otra entrada.

Un comentario en “Captcha vs ReCaptcha

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *