Reconocer el texto de PDF e imágenes con Google Docs

Justamente ayer estaba hablando con un amigo sobre cómo Google se va convirtiendo poquito a poco (como dice la canción de Estopa) en un Sistema Operativo. La interface por ejemplo, tenemos menúes arriba a la izquierda con acceso cada vez a cosas mas potentes, picasa web que cada vez mas permite mas opciones, el reciente aviso de poder poner un fondo a la página de google y ahora me voy a acostar con la noticia de varios agregados en Google Docs entre los cuales se destaca la posibilidad de subir una imagen o PDF y transformarla a texto.

Si, ya sabemos que existen webs para eso como casi para todo, pero tenerlo en Google Docs para los que lo usamos bastante es un golazo, pero no un golazo común y corriente, es un golazo bajandola 2 veces con la mano en la misma jugada.

Y como todo producto de Google el resultado es excelente, lo probé con varios textos y la tasa de reconocimiento es muy pero muy buena. Poniendo el ejemplo de una carta tomada de Google images (buscando “carta”) que la elegí porque además de tener un buen tamaño tiene un fondo texturado que hace mas difícil el reconocimiento.

Para subir y transformar en la interface de Gdocs tildamos las 2 opciones disponibles.

Transformar imagen en texto con Google

Ahora veamos el resultado…

OCR en Google docs

Siempre tuve debilidad por el software OCR, desde aquellos softwares que parecían mágicos y venían con los primeros scanners y que me pasaba mas tiempo arreglando el texto que digitalizaba hasta esta genialidad pasó mucho tiempo. Google Docs cada día está cada vez mejor, por ello personalmente me encuentro en una especie de “experimento” tratando de pasar a personas que trabajan en pequeñas oficinas a usar Google Docs, una experiencia que va de a poco pero cuyos resultados me sorprenden para bien (es sorprende para alguien que usa Word + Hotmail y se la pasa mandando adjuntos poder modificar archivos conjuntamente con otra persona).

Como dice la canción que se canta en las canchas… despacito, despacito, despacito…

2 Comentarios

  1. Que buen dato! Esta vez Guille llegaste tarde con la justa. Uso muchos papers bajados de la red, generalmente en ingles. Sucede que para algunas palabras soy medio olvidadizo, y no siempre quiero traducir adelante de la PC. Entonces uso el traductor de Google, que sigue siendo tan cuadrado como un monitor, para traducir todo a lo indio incluso las palabras que potencialmente me interesan…

    Que pasa, con el formato DJVU o con los abstract amarretes de sitios como SpringerLink, BioOne o JStor no puedo, y usaba OCR gratis. Ni que contarte cuando mis compañeros se enteraron. El no bajar un OCR codigo abierto termino en la limitacion de 10 documentos por dia jaja.

    Ya probaré el mostri a ver como anda. Y ya te mandaré un vino por tirar siempre la justa

    • Para traducciones online uso algo que funciona bastante bien, al menos a mi gusto. Es una extensión para Firefox llamada ImTranslator. Seleccionás el texto a traducir, clic derecho y elegís la opción. Vale la pena probarlo, incluso a la hora de escribir algo en inglés en algún sitio lo traduzco desde esa misma extensión y casi nunca tuve que corregir nada. Saludos!

Dejar respuesta

Please enter your comment!
Please enter your name here