Todos somos Data-entry

15 111
Escrito por Guillermo

¿Se acuerdan cuando vimos para qué servía Captcha? Para aquellos con mala memoria o que no hayan leído el artículo voy a ser breve. reCaptcha es un servicio que  permitir discernir si uno es humano o es un programa informático a cualquier sistema que lo implementa mediante un “desafío” que consta de caracteres supuestamente imposible de detectar por una computadora.

Pero este sistema no es “bueno” así porque así. Ya que el segundo uso que se le da es el de poder digitalizar casi “automáticamente” libros escaneados, ¿increíble no? La verdad es que si probás contarlo a tus amigos es muy probable que la mayoría van a creer que les estás tomando el pelo. Pero es cierto. Cierto, y por sobre todo, genial.

Y como estos de Google “no dan puntada sin hilo”, parece que desde hace unos días han empezado a utilizar el sistema de Captcha para que, los millones de humanos que tratan de hacerles saber a los sistemas que no son una máquina, estén haciendo el trabajo de “Data Entry” y cuyo trabajo les permita “digitalizar” las calles y las direcciones de su servicio Google Street Maps.

recaptcha-collection

(Al poner el número, le decís a Google la dirección de esa calle)

Ahora, además de lo obvio que es que rápidamente la comunidad que usa el sistema sea la misma que “trabaje”, aunque sea solo unos segundos, para que el servicio de Calles de Google sea mucho mas acertado, pienso un momento lo groso que es todo el sistema de “fondo” que tienen. Y es que no debe ser ninguna boludez armar un sistema que sepa que una imagen con un número pegada en una pared es parte del sistema de numeración de calles y luego recortarlo, “meterlo en el sistema de captcha” para por último asociarlo automáticamente a una calle, en una dirección de una ciudad en el mundo.

Realmente magistral. Por suerte en Japón no tienen ese problema :)

15 COMENTARIOS

  1. Para que la captcha funcione tiene que saber cuál es el valor verdadero, y si ya sabe cuál es ese valor para que se lo va a preguntar a los usuarios?

    Si pones cualquier número te va a dar siempre el OK.

    Si el criterio lo sacan por lo que ponga la mayoría les van a quedar todas las direcciones con 111111, 22222 , asd.

    • Leo, estás equivocado.

      El sistema usa 2 valores, uno lo “sabe” y es el que utiliza para corroborar (conocido como desafío) y el otro no, por eso siempre vas a ver 2 palabras, o ahora, una palabra y una dirección.

      Y si, no sabés cual es una y cual es otra, pero es probable que de esta nueva manera si ponés bien la palabra y cualquier cosa en el número, quizás el captcha “pase”.

      PD: podrías haber leído el artículo que enlacé :P

      • Incluso lo puede hacer con un solo valor, sin el “ayudante”.

        Ej, el sist. Pone un valor nuevo y desconocido, el usuario ingresa la respuesta (no importa aun la realidad de la respuesta) esa respuesta suma un match Z, ese valor desconocido se usa una cantidad nX de veces, si la respuesta a ese valor se repite N veces con N1 de usuarios únicos se da por aceptada y el valor como real.

        Puede ser rustico el asunto pero funciona.

  2. Además creo que cada imágen la pasan más de una vez, y luego comparan los resultados, por ej, si el nro de una puerta (123 digamos) lo muestran a 10 usuarios y uno solo pone “asdf”, otro pone “nomerompanloshuevos” y el resto pone “123″ el sistema sabe q esa es la rta correcta

  3. En 4chan hace tiempo estan con la operacion ReNigger, la cual consiste en poner “nigger” en todos los captcha en lugar de la palabra escaneada, que es facil de distinguir de la palabra de prueba verdadera. Supuestamente el objetivo es que esa palabra empiece a aparecer en los textos digitalizados. No creo que eso se logre pero igual lo hago siempre asi no trabajo gratis para Google.

    • Que boludo que sos realmente eh! Si igualmene los captcha van a existir y ser oobligatorios en mil lugares, que carajo te jode que se aproveche tu tipeo para algo util en lugar de que tu tiempo y palabras se pierdaan en la nada??? Ademas el captcha se usa para DIGITALIZAR LIBROS, es cultura viejo!! O acaso vos nunca agradeciste q poder encontrar un libro o fragmento de uno que necesitaras en google docs? Yo si… Ojala nunca te pase que estes buscando info o investigando o simplemente leyendo por placer y te encuentres un “nigger” porque te vas a sentir como el mayor boludo…

      • Google no es una ONG, es una de las empresas mas grandes del mundo y no creo que necesiten voluntarios. Podrian mejorar el software OCR en vez de hacerme trabajar a mi, aunque desde el punto de vista de ellos es genial poder usar a millones de personas trabajando gratis y la mayoria sin darse cuenta. Eso si, el dia que el OCR se acerque lo suficiente a la capacidad humana y pueda ser usado por los bots van a tener que inventar otra cosa porque los captcha de ahora no van a servir para nada.

        Y si algun dia me encuentro un “nigger” en alguno de esos textos voy a estar contento de que todo el esfuerzo colectivo del cual fui participante finalmente dio sus tan ansiados frutos.

        • Estaba por responderte pero la verdad es gastar polvora en chimango… igual gracias por confirmarme que de hecho si sos un boludo.

          Que te garúe finito, pancho. Ojalá google ya tenga desarrollado un filtro anti-boludos para que los que sí contribuímos en el ocr y luego nos beneficiamos de los resultados no suframos a los pajeros como vos.

  4. Hace falta encontrar motivos de vida para la gente, ché. Cristina hacé algo que los reaccionarios de cartón copan la internés. Hace falta realmente? 15 segundos, dos palabras… o un numerito… es necesario llorar taaanto y sentirse violado todo el tiempo? Aflojen un poco.

    Volviendo… sí me causan gracia los “simbolitos chinos” (que tienen un nombre) y la notación matemática que de tanto en tanto aparece.

    Supongo, por último, que más que nada porque este tipo de reCaptcha o similares tienen un fín útil y son eficientes que nunca despegaron los Captchas de fotitos de animales y similares.

Deja un respuesta