UiPath tiene una versión gratuita para cualquier usuario y una versión de pago, ambas tienen disponible su propio sistema OCR, y estas tienen ligeras pero importantes diferencias entre ellas. Echemos un vistazo a lo que ofrece cada uno de ellos.
En la versión comunitaria hay un OCR bueno y útil pero no tan potente, y ese OCR permite la lectura de archivos con limitaciones, como por ejemplo: archivos con una tabla, archivos escaneados que no están claros, etcétera.
Su debilidad se nota si se compara con otras tecnologías OCR más potentes, como Document Understanding de UiPath, especialmente para la lectura de documentos basados en inteligencia artificial.
En el OCR predeterminado con UiPath, puede descargar bibliotecas gratuitas en la versión comunitaria. Es ideal para leer archivos PDF con una estructura clara.
Su uso es básico: primero te pregunta qué quieres leer, y al OCR se le dicen los datos que debe obtener del documento, como dirección y nombre, y así se obtiene todo lo necesario. Esta versión gratuita es potente, no tiene muchas limitaciones, pero todo dependerá siempre de cada archivo y su complejidad.
Con archivos escaneados, también funciona el OCR que viene por defecto con UiPath. Obtiene los datos sin procesar y desordenados, por lo que se tendría que aplicar un algoritmo para obtener la información ordenada. Lo positivo es que puede leer archivos escaneados y no es necesario recurrir a versiones de pago para realizar este proceso.
El OCR de UiPath Community es bastante potente a pesar de no tener todas las funciones que tiene una versión paga. Las limitaciones no son muy notorias, solo vienen por problemas de lectura de archivos, ya que esta versión gratuita puede fallar cuando un archivo no está correctamente escaneado, con escritura borrosa o escrita a mano por una persona.
Al contar con la versión paga, UiPath ofrece a sus usuarios un OCR con mayor potencia, que tiene la capacidad de leer documentos escaneados que no son muy claros, escritos a mano o con tablas complejas y datos sueltos.
El OCR licenciado da al desarrollador la posibilidad de "enseñar" a leer un documento con tablas complejas, por ejemplo, aquellas que tienen una sola columna con varias filas de información, algo que en la versión gratuita es prácticamente imposible de hacer y merecería. más trabajo, más tiempo y aumenta el presupuesto del proyecto.
El uso de este OCR, que se llama Document Understanding, es similar a la versión gratuita. Existe un proceso con el mismo trabajo de reframe para cualquiera de los dos tipos, solo que la versión paga viene con bibliotecas exclusivas para ello, como: Omnipage, Localserver e Intelligence OCR, que se utilizan para enseñar a los robots a leer documentos.
Un aspecto positivo de tener un OCR pago en UiPath es la posibilidad de tener varios bots ejecutándose al mismo tiempo en diferentes máquinas, algo que no es posible hacer en la versión gratuita, existe la posibilidad de tener varios bots ejecutándose, pero solo en una máquina al mismo tiempo.
Hay empresas que necesitan un bot para validar cómo funciona la tecnología y luego les es factible comenzar con la versión gratuita en la Comunidad UiPath y posteriormente, como necesitan más bots, analizan si es necesario un OCR con licencia.
La desventaja de Document Understanding es su proceso bastante complejo, a diferencia de la simplicidad de la versión gratuita. Además, puede resultar bastante caro, ya que es más económico pagar por bibliotecas de terceros compatibles con OCR y UiPath. Además, es posible que una herramienta de terceros ya venga equipada con todo el conocimiento para leer documentos, un proceso que a Document Understanding se le debe "enseñar" a realizar.
En definitiva, las funciones de OCR que vienen integradas con UiPath Community son óptimas pero tienen varias limitaciones a la hora de leer documentos escaneados, poco claros y con estructuras complejas.
Document Understanding puede realizar todas estas actividades, pero requerirá de un desarrollador experto en esta herramienta para que pueda enseñarle al bot todos los pasos necesarios para cada proceso.
Sí, algunos motores de OCR, como Abbyy OCR, requieren licencias independientes cuando se utilizan con UiPath. UiPath ofrece opciones de licencia e integraciones para incorporar estos motores de terceros dentro de los flujos de trabajo de automatización, lo que garantiza que los usuarios puedan utilizar sin problemas estas capacidades de OCR.
La comunidad UiPath OCR ofrece diversos motores de OCR, incluidos Google Cloud OCR, Microsoft OCR y Tesseract OCR, lo que permite a los usuarios elegir el que mejor se adapte a sus necesidades. Mejora los procesos de automatización al proporcionar una extracción precisa de texto a partir de imágenes y documentos, mejorando la eficiencia en las tareas de procesamiento de datos.