
Desarrollo de bot OCR para lectura de documentos descargados y escaneados
Se creó un bot con UiPath, con el objetivo de leer los documentos que generan los clientes, a los que llaman liquidaciones.
Reto
El cliente es una compañía intermedia, son una empresa de carga y transporte. En su día a día como operaciones manejan la carga de varios clientes de salida a destino. Los clientes siempre le mandan un documento en un formato estándar que es lo que ellos presentan a los puertos o aduanas donde está toda la información de las cargas que llevan consigo.
Ese documento puede contener información de artículos. Los documentos por cada carga pueden tener un producto o cien.
El cliente tiene su propia plataforma interna, ellos insertan manualmente esos documentos, lo que se convirtió en un trabajo bastante tedioso, por lo que decidieron automatizar ese proceso y ahorrarse varias horas digitando manualmente los documentos a diario.
Nuestra solución
Los expertos de Rootstack de inmediato se pusieron manos a la obra. Se creó un bot con UiPath, con el objetivo de leer los documentos que generan los clientes, a los que llaman liquidaciones. Los documentos para la lectura pueden venir ya en formatos digitales para su descarga, o escaneados desde su formato físico.

El cliente dejó de procesar los documentos manuales en su plataforma gracias a la creación del Bot OCR por parte del equipo de Rootstack. Para crearlo, usaron un OCR de Amazon llamado Amazon Textract, el cual es un plugin que está disponible para UiPath. Se hizo la configuración del OCR y se comenzaron a leer todos los documentos, obteniendo así la habilidad de leer documentos escaneados o los descargados.
Un OCR normal solamente podría leer los documentos descargados, con el OCR creado por Rootstack, el cliente obtuvo la un bot capaz de leer documentos escaneados que podrían estar ilegibles.

Se eligió Amazon Textract por ser el OCR más completo y el que mayor apoyo ofrecía al problema que presentaba FCI con sus documentos escaneados y los de difícil visibilidad. Por ejemplo, en un documento con 10 productos, el OCR lee línea por línea y se van insertando en el software de FCI.
El Amazon Textract se utilizó con la versión community de UiPath, esta es gratuita.
Además de esto, se desarrolló una función para estar al pendiente de los posibles fallos del Bot, el cual al no poder procesar un documento por alguna razón, dispara de inmediato un correo a la o las personas asignadas a este proceso y así estén al tanto.
Tecnologías
UiPath es una de las herramientas más utilizadas a la hora de crear tecnologías y bots de RPA, o automatización robótica de procesos, las que ayudan a las empresas a acelerar los procesos tediosos y maximizar la productividad.
Por su parte, Amazon Textract "es un servicio de aprendizaje automático (ML) que extrae automáticamente texto, escritura a mano y datos de documentos escaneados. Va más allá del simple reconocimiento óptico de caracteres (OCR) para identificar, comprender y extraer datos de formularios y tablas", según la definición en su página web oficial.