Como seres humanos que vivimos en el mundo moderno, tenemos que afirmar que no somos robots con bastante frecuencia, y que ni siquiera vivimos en una distopía futurista de ciencia ficción. De todos modos, ya sea que esté marcando la casilla «No soy un robot», enseñando una IA lo que constituye un «signo» (Pista: la respuesta «correcta» es lo que la mayoría de los otros usuarios hayan elegido; trate de pensar como la multitud), o resolver problemas matemáticos, el objetivo es siempre el mismo: evitar que los bots arruinen los sitios web , y tal vez usar a los humanos para resolver los captchas para digitalizar algunos libros, entrenar algún software de reconocimiento de imágenes o generar algunos ingresos publicitarios. Pero hay más captchas de lo que parece, y están lejos de ser infalibles.
¿Por qué necesitamos captchas?
CAPTCHA significa «Prueba de Turing pública completamente automatizada para diferenciar a las computadoras de los humanos», que, además de ser un acrónimo verdaderamente elegante, le dice la mayor parte de lo que necesita saber. La idea es, como dice el lema reCAPTCHA de Google, crear una tarea que sea «Fácil para las personas, difícil para los bots».
«Bot» generalmente se refiere a cualquier programa que está configurado para completar automáticamente algún proceso, ya sea publicar noticias en Twitter o dejar spam en las secciones de comentarios del sitio web. Si se usan correctamente, estos programas son bastante útiles, pero también se pueden usar para generar contenido inútil, lleno de anuncios o malicioso, abrumar un sitio con suscripciones, manipular resultados de encuestas en línea, raspar direcciones de correo electrónico o hacer cualquier otra cosa desagradable. Es mejor no dejarlos entrar.
¿Qué es exactamente un captcha?
Si ha navegado por Internet durante un tiempo, recordará que durante la mayor parte de la década de 2000, el tipo de captcha más común era una tira de texto distorsionado con una cadena de caracteres alfanuméricos. Esta ya no es una forma muy segura de captcha, pero cuando Google adquirió reCAPTCHA en 2009, todavía era lo suficientemente bueno para obtener la mayoría de los bots. Desde entonces, Google ha cambiado a las casillas más seguras «No soy un robot» (que en realidad monitorean el comportamiento como el movimiento del mouse y la información del navegador para verificar si eres un bot) y desafíos de reconocimiento de imágenes. Sin embargo, todavía existen captchas basados en audio y son sorprendentemente fáciles de romper con el software de reconocimiento de voz.
Los captchas de reconocimiento de imágenes han tenido su propio conjunto de problemas, ya que pueden ser un poco ambiguos para los encuestados humanos. Sin embargo, como se mencionó anteriormente, no hay una respuesta correcta, dado que la computadora no sabe qué imágenes son escaparates y cuáles son schnauzers, simplemente acepta la opinión humana mayoritaria como correcta. Si 75/100 humanos deciden etiquetar una imagen borrosa de un trapeador como schnauzer, la computadora asumirá que el trapeador es un schnauzer y lo marcará mal si no lo etiqueta como tal.
Pero también hay muchas otras opciones de captcha, y pueden ser bastante creativas. Estas son solo algunas de las ideas que han aparecido en varios sitios web.
los captcha de bloqueo deslizante:
El problema de matemáticas captcha:
El captcha de arrastrar y soltar:
los orientación de la imagen captcha:
También hay algunos captchas que nunca ves, como el captcha honeypot, que consiste en agregar un campo invisible a una página web, esperar a que un bot lo complete (los humanos no lo harán, ya que no pueden verlo) y, posteriormente, pateando el bot. Luego está el de Google “captcha invisible”, a menudo emparejado con su cuadro, que observa cómo navega por una página web (movimientos del mouse, desplazamiento, clic, comportamiento general) para ver si debería darle un captcha de reconocimiento de imagen como una doble verificación.
Captchas: haciendo del mundo un lugar mejor
Puede que no lo sepa, pero las horas acumuladas que ha pasado demostrando que no es un robot pueden haber marcado la diferencia. reCAPTCHA, ahora el servicio captcha de Google, fue diseñado originalmente por Luis von Ahn (ahora más conocido como el fundador de Duolingo), como una forma de utilizar la capacidad intelectual desperdiciada para digitalizar libros. Al presentar a los usuarios una palabra escaneada de un libro o periódico, este sistema podría confirmar la identidad de un usuario y realizar una especie de encuesta de opinión sobre cuál era la palabra. Si suficientes personas estuvieran de acuerdo con la palabra, el sistema de digitalización aceptaría la respuesta en la versión del libro electrónico.
Después de implementar este sistema, solo se necesitaron dos años para digitalizar toda la biblioteca de Google Books y todo el archivo del New York Times. En 2012, pasaron a usar humanos para ingresar los números de las casas extraídos de Google Street View.
En 2014, las cosas dieron un giro irónico hacia la robótica: captchas de reconocimiento de imágenes. Estos funcionan según el principio de que las máquinas no son muy buenas para descubrir qué hay en una imagen, pero, como se describió anteriormente, han sido bastante efectivos para entrenar a las IA para hacer precisamente eso. Dado que este captcha eventualmente dejará de ser un trabajo, se está eliminando gradualmente a favor de los menos visibles orientados al comportamiento/seguimiento.
En conclusión: ¿soy un robot?
A medida que la inteligencia artificial, el aprendizaje profundo y una serie de otros avances surjan en las próximas décadas, los captchas también tendrán que evolucionar. La mayoría de los captchas existentes ya han sido descifrados, y cada vez es más fácil. Entrenar una máquina para leer captchas de texto distorsionado ahora tarda unos quince minutos. Tal vez lo único que quede en el futuro será captchas biométricos (¡espero que te gusten los escaneos de reconocimiento facial!), o tal vez nos despertemos y descubramos que la singularidad ya se ha alcanzado, y nosotros fuimos los bots todo el tiempo.
Crédito de la imagen: Chippee vía malos números de casa de google recaptcha