¿Qué es el reconocimiento óptico de caracteres?

Si bien es fácil tomar un documento de su computadora y obtener una copia física con una impresora, generalmente es más difícil hacerlo al revés. Aunque existen escáneres y pueden guardar documentos escaneados como una imagen, esto no es particularmente útil si desea editar el documento. Para poder editar un documento, desea utilizar una tecnología llamada reconocimiento óptico de caracteres u OCR.

¿Cómo funciona el reconocimiento óptico de caracteres?

OCR utiliza una variedad de técnicas para leer documentos con precisión. El software OCR ajusta el documento y tal vez incluso las palabras individuales para que estén alineadas correctamente. La imagen se convierte a un formato en blanco y negro puro porque es más fácil que diferenciar los tonos de gris. También se realiza un análisis para identificar y eliminar cualquier elemento no textual.

Se utilizan dos tipos principales de algoritmos de OCR, la comparación de matrices y la extracción de características. La coincidencia de matrices toma una imagen de un solo carácter y luego la compara con los algoritmos de fuente configurados píxel a píxel. Esta técnica requiere que el carácter esté correctamente aislado del resto del contenido y que la fuente esté incluida en el software OCR. Este tipo de OCR tampoco funciona para reconocer la escritura a mano.

Los algoritmos de extracción de características dividen cada carácter en características, como líneas, curvas e intersecciones de líneas. Esta técnica reduce considerablemente la necesidad del algoritmo formado con fuentes conocidas. La extracción de características es capaz de reconocer nuevas fuentes y transcribirlas, así como algo de escritura a mano, aunque la precisión no es tan buena como con las fuentes conocidas.

Algunos programas de software más avanzados utilizan el contexto de las letras circundantes para ayudar a identificar las letras que no son tan claras. Por ejemplo, si la palabra «perro» está impresa y el algoritmo de OCR no puede decir con certeza si la «o» es una «a» o una «o», puede usar un diccionario para ver si una combinación de caracteres potenciales hace un palabra conocida. En este caso, el algoritmo OCR descartaría la posibilidad de la «a», porque «dag» no es una palabra, mientras que «perro» sí lo es.

¿Dónde se utiliza OCR?

Uno de los principales usos del OCR es el sistema postal. El OCR se utiliza para identificar automáticamente la dirección de cartas y paquetes, una tarea que puede realizar mucho más rápido que las personas. En los casos en que el sistema OCR no pueda leer la dirección de la etiqueta, se separará para que un humano pueda procesarla manualmente.

OCR es útil como herramienta de accesibilidad para personas con discapacidad visual cuando se combina con una herramienta de conversión de texto a voz. Google translate también implementa OCR como parte del proceso de traducción de texto a imágenes.

Publicaciones Similares

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *