Para los que no los conocen, los captchas son las imagenes que contienen letras deformadas, usadas para evitar que las paginas web sean accedidas por robots. El principio detrás del captcha es que aún quedan tareas que son muy sencillas para un humano, pero muy complejas para la computadora. Sin embargo, algunos de los captcha fueron hackeados.
El sitio recaptcha.net (de la universidad de Carnegie Mellon) te ofrece un widget que incorporas a tu pagina web. Es un captcha compuesto de dos palabras, lo que lo hace mas sencillo que otros que muestran letras y numeros que pueden resultar confusas.
La genialidad de recaptcha, es que usan a los millones de seres humanos para ayudar a escanear libros. Si ya voy a forzar a mis usuarios a realizar una tarea que para la computadora es dificil, entonces que sea algo provechoso. Segun el sitio, se resuelven 200 millones de captchas por día (a mi me resulta exagerado, pero seguro que son millones).
Recaptcha funciona así: las palabras utilizadas son las que el motor de reconocimiento de caracteres no pudo descifrar. A cada usuario le muestro dos palabras, una que conozco y una que no. Chequeo solo la que conozco. Si esa está bien, parto de la base de que la segunda también. Por las dudas se la muestro a varias personas, a ver si todas dan lo mismo. Una vez que estoy seguro de que la palabra está bien, la doy por conocida y la uso en la otra lista.
Hay un solo catch con estos captchas: hay spammers que están dando vuelta el tema para el otro lado: usan millones de personas que les descifren los captchas gratis. Como lo hacen? Fácil, te dan acceso a contenidos porno a cambio de que descifres un par. Los hombres serán más inteligentes para algunas tareas, pero con una buena motivación trabajan gratis.
Hecha la ley, hecha la trampa.
Trabaje aqui en brasil en una empresa que tenia robots de captcha y teniamos algoritmos programados usando IA para romper todo tipo de captchas.
pero unos que no pudimos romper eran
imagenes de 5 mujeres, 4 jovenes y una vieja… seleccionar la vieja
o una imagen girada N grados y volver en grados la imagen para que se vean derechas.
todo es posible, todos los captchas se pueden romper , con un costo
nosotros teniamos para los clasicos de 4 letras 10 enlaces de 4 megas y 50 pcs.
tomabamos unos 2 millones de consultas por semana
y siempre estabamos actualizando la base de conocimiento del reconcimiento OCR…..