A Automação Robótica e o Processamento por Imagens

Com inteligência artificial e ferramentas de extração e tratamento de imagens, estamos prontos para a automação robótica dos fluxos de informação.

Eder Oelinton

13 de novembro de 2019

As tendências de automação em rotinas de escritório estão se direcionando para modelos robóticos em que uma grande quantidade de interfaces de aplicação é manipulada por “bots” especializados.

Mas enquanto a implementação do RPA (Robotic Process Automation) está em seu início, o fato é que a governança de workflow e as ferramentas de tratamento de informação por imagem atingiram um desenvolvimento notável nos últimos anos. Algo só comparável com a revolução da entrada de dados, a partir da disseminação do código de barras e sua captura óptica ao longo das décadas passadas.

Um exemplo claro dessa evolução está na sofisticação dos motores de OCR. Antes, esses reconhecedores ópticos de caracteres eram focados em entender algumas tipografias típicas, e quase sempre especializados em certas aplicações ou tipos de arquivo.

Ainda assim, os OCR tornaram o tratamento de informações muito mais ágil e permitiram reduzir enormemente a dependência do olho humano e das mãos para a coleta e leitura de dados alfanuméricos. E, é claro, para o preenchimento de arquivos ou formulários baseados em material impresso.

Desde o surgimento do OCR, porém, a indústria de software criou algoritmos envolvendo sua articulação com motores capazes de direcionar a leitura (com acionamento de ações voltadas para números ou letras, por exemplo) e com uma lógica da leitura adaptada ao tipo de material a ser lido, tornando praticamente universal seu espectro gráfico de leitura.

Um passo ainda mais adiante foi o surgimento dos leitores ópticos inteligentes (identificados na sigla ICR), que hoje atingem um nível de acerto acima de 97% na leitura de manuscritos e na conferência de assinaturas. Vieram, logo em seguida, os OMR (Leitores ópticos de marca), capazes de entender manchas gráficas indicativas em formulários.

Com este composto de tecnologias de captura, interpretação e transferência, é possível extrair, identificar, classificar e organizar informações contidas em qualquer tipo de mancha gráfica, seja ela uma cédula de documento, uma fotografia ou uma página impressa. Assim, uma vez tratados, certos detalhes dessas imagens podem ser convertidos em informações passíveis de serem distribuídas nos campos adequados de um formulário.

A Inteligência Artificial Entra em Cena

Nas suítes mais avançadas para a automação do fluxo de tratamento de informações, todo o processo conta agora com suporte de inteligência e aprendizado de máquina. Entra aí, notadamente, o uso intensivo de “Deep Learning”, causando um ponto de ruptura em relação à tecnologia tradicionalmente utilizada.

Mesmo uma imagem sofrível, de baixa resolução, capturada e enviada por meio móvel, pode ser a fonte dos mais diversos dados requeridos por um formulário eletrônico, por exemplo, para a abertura de uma conta, para um registro de apólice ou para um cadastro de crédito à distância.

Com o suporte de bibliotecas gráficas de documentos, o sistema de extração e leitura pode definir se aquela foto digital de um documento pessoal se trata de uma carteira de motorista ou um cartão de plano de saúde. E mais, se este documento em questão pertence aos padrões gráficos empregados pelo órgão emissor em determinado ano.

Sem exigir qualquer apoio humano, o sistema é capaz de identificar a placa de um carro (ou até mesmo o extenso número do chassi) dentro de uma foto, fazer a leitura dos caracteres e introduzi-los corretamente num relatório de sinistro de seguros.

Se a referida foto está mal enquadrada, ou mal posicionada, há Inteligência suficiente para corrigir esses parâmetros e realizar a leitura com a máxima correção. E quanto mais longo for o ciclo de serviços, maior é o nível de precisão que o sistema vai acumulando através de recursos de aprendizado de máquina.

Com pouca exigência de customização, engines de reconhecimento desse tipo podem ser orientados por regras de negócios adequadas a todos os tipos de processos. E ainda podem fazer a devida interface com bases de dados públicas ou privadas para tarefas de autenticação e conferência.

Em empresas usuárias da automação de fluxos, milhares de documentos são checados e autenticados em ritmo impensável para a realidade do processamento manual.

Para fortalecer ainda mais o binômio velocidade e confiabilidade, contamos hoje com a inteligência biométrica agregada às novas suítes. Associadas aos motores de busca e aos repositórios adequados, as ferramentas de autenticação podem consultar um ou vários arquivos simultâneos de documentos e de lá extrair o registro biométrico contido em fotos documentais de um indivíduo que está solicitando um cadastramento ou um serviço.

Desta extração, resultará a apresentação de um parâmetro praticamente infalível para a confrontação com uma ‘selfie’ solicitada pelo sistema, no momento exato do acesso, garantindo-se um nível de autenticação seguro para todos os tipos de transações e cadastros remotos.

De posse de uma foto mobile, ou de uma impressão digital extraída a partir da tela do celular, uma empresa de seguro saúde pode comparar os traços biométricos de um segurado com os de arquivos pré-existentes, validar a identidade do indivíduo e, a partir daí, liberar um procedimento hospitalar e abrir acesso à equipe médica ao prontuário desse segurado.

Ao se levar o serviço para o processamento em nuvem, atinge-se uma escala altíssima em volumes de documentos tratados por hora. Num ambiente financeiro, por exemplo, pode-se obter uma velocidade média de retorno inferior a 15 segundos. As taxas de acerto no modo automático também surpreendem, podendo ser superiores a 95% em alguns processos estratégicos.

Outra vantagem do modelo atual é que não há necessidade de se partir do zero para atingir seu nível de automação. Assim, não é preciso dispor de um ambiente digital nativo, podendo-se utilizar mecanismos de captura, conversão, tratamento e estruturação já a partir dos dados legados, através da simples integração via interfaces de transferência padronizadas (APIs com arquitetura REST).

Com o emprego de protocolos de compactação e comunicação mais econômicos de arquivos de imagens, é possível praticamente eliminar a dualidade local/remoto, sem grandes exigências de banda, e levar o processamento da informação para a nuvem ou distribuí-lo em múltiplos pontos.

Para complementar toda esta transformação digital, as arquiteturas mais maduras de tratamento inteligente do fluxo de documentos podem – e devem – contar com o apoio de um centro de curadoria onde eventuais desvios do padrão ou inconsistências de leitura são resolvidos por funcionários habilitados e devolvidos ao processo.

Aliás, este requisito essencial está presente também em qualquer ambiente de automação, por mais evoluído que seja. Ele funciona como a prova de que a robótica aplicada não está voltada para a eliminação, e sim para a valorização da inteligência humana.

Texto: Carlos Flávio de Souza Carlos Flávio de Souza é diretor de Tecnologia e Inovação da Flexdoc, empresa especializada em serviços e soluções para o tratamento de documentos por imagem, respondendo pelo processamento de até 12.000 contas bancárias por dia, com atuação também em Seguradoras e Governo.