OCR: Lo que debe saber

UiPath Community

 

En la versión comunitaria hay un OCR bueno y útil pero no tan potente y ese OCR permite la lectura de archivos con limitaciones, como por ejemplo: archivos con una tabla, archivos escaneados que no están claros, etc.

 

Su debilidad se nota si se compara con otras tecnologías OCR más potentes, como Document Understanding de UiPath, especialmente para la lectura de documentos basados ​​en inteligencia artificial.

 

uipath

 

En el OCR predeterminado con UiPath puedes descargar bibliotecas gratuitas en la versión comunitaria. Es ideal para leer archivos PDF con una estructura clara.

 

Su uso es básico: primero te pregunta qué quieres leer, le dice al OCR los datos que debe obtener del documento, como dirección, nombre, y así se obtiene todo lo necesario. Esta versión gratuita es potente, no tiene muchas limitaciones, pero todo dependerá siempre de cada archivo y su complejidad.

 

uipath

 

Con archivos escaneados, también funciona el OCR que viene por defecto con UiPath. Obtiene los datos sin procesar y desordenados, por lo que se tendría que aplicar un algoritmo para obtener la información ordenada. Lo positivo es que puede leer archivos escaneados y no es necesario recurrir a versiones de pago para realizar este proceso.

 

El OCR de UiPath Community es bastante potente a pesar de no tener todas las funciones que tiene una versión paga. Las limitaciones no son muy notorias, solo vienen por problemas de lectura de archivos, ya que esta versión gratuita puede fallar cuando un archivo no está correctamente escaneado, con escritura borrosa o escrita a mano por una persona.

 

OCR con licencia UiPath

 

Al contar con la versión paga, UiPath ofrece a sus usuarios un OCR con mayor potencia, que tiene la capacidad de leer documentos escaneados que no son muy claros, escritos a mano o con tablas complejas y datos sueltos.

 

El OCR licenciado da al desarrollador la posibilidad de "enseñar" a leer un documento con tablas complejas, por ejemplo, aquellas que tienen una sola columna con varias filas de información, algo que en la versión gratuita es prácticamente imposible de hacer y merecería. más trabajo, más tiempo y aumenta el presupuesto del proyecto.

 

uipath

 

El uso de este OCR, que se llama Document Understanding, es similar a la versión gratuita. Existe un proceso con el mismo trabajo de reframe para cualquiera de los dos tipos, solo que la versión paga viene con bibliotecas exclusivas para ello, como: Omnipage, Localserver, Intelligence OCR, que sirven para enseñar a los robots a leer documentos.

 

Un aspecto positivo de tener un OCR pago en UiPath es la posibilidad de tener varios bots ejecutándose al mismo tiempo en diferentes máquinas, algo que no es posible hacer en la versión gratuita, existe la posibilidad de tener varios bots ejecutándose, pero solo en una máquina al mismo tiempo.

 

Hay empresas que necesitan un bot para validar cómo funciona la tecnología y luego les es factible comenzar con la versión gratuita en la Comunidad UiPath y posteriormente, como necesitan más bots, analizan si es necesario un OCR con licencia.

 

La desventaja de Document Understanding es su proceso bastante complejo, a diferencia de la simplicidad de la versión gratuita. Además, puede resultar bastante caro, ya que es más económico pagar por bibliotecas de terceros compatibles con OCR y UiPath. Además, es posible que una herramienta de terceros ya venga equipada con todo el conocimiento para leer documentos, un proceso que a Document Understanding se le debe "enseñar" a realizar.

¿Su proyecto necesita UiPath Community OCR o UiPath Licensed OCR?

En definitiva, las funciones de OCR que vienen integradas con UiPath Community son óptimas pero tienen varias limitaciones a la hora de leer documentos escaneados, poco claros y con estructuras complejas.

¿Algunos motores de OCR requieren licencias separadas cuando se usan con UiPath y cómo maneja UiPath estas necesidades de licencia?

Sí, algunos motores de OCR, como Abbyy OCR, requieren licencias independientes cuando se utilizan con UiPath. UiPath ofrece opciones de licencia e integraciones para incorporar estos motores de terceros dentro de los flujos de trabajo de automatización, lo que garantiza que los usuarios puedan utilizar sin problemas estas capacidades de OCR.