Como a Magali Robot funciona?
Muitas pessoas perguntam como a Magali Robot consegue fazer a captura de datas e outras informações de contratos, classificar e segmentar documentos.
Vou escrever abaixo os princípios da plataforma Magali Robot começando pelo que não fazemos e que nos diferencia dos outros bots.
Como NÃO fazemos
O primeiro engano é acreditar que a captura é posicional. Definir um layout para captura de dados é uma tarefa inglória, pois a probabilidade de erro é enorme, principalmente porque os layouts de documentos e formulários mudam com frequência.
Até documentos gerados em uma mesma empresa mudam de layout com frequência e, dessa forma, seriam necessários vários templates posicionais para conseguir ler os documentos. Daria mais trabalho do que digitar tudo.
O segundo engano, e mais frequente entre os que estudam tecnologia, é acreditar que treinar uma ferramenta baseado na observação do trabalho humano. O treinamento de um mecanismo de machine learning exige um volume de dados muito grande, muitas vezes maior do que uma empresa dispõe. Então porque não usar o conteúdo de várias empresas para treinar? Para capturar informações muito básicas e comuns, seria possível, mas para obter informações diferenciadas, aquelas que o cliente precisa, aí fica muito mais difícil.
Então qual é a proposta da Magali Robot?
Acreditamos que podemos ensinar o robô assim como ensinamos um humano a ler e classificar um documento.
Costumamos dizer que a Magali Robot é um estagiário muito inteligente. Ela quando entra na empresa, não conhece nada, mas ela é capaz de aprender baseada nas instruções simples que o seu mentor transmite.
Quem seria esse mentor do robô?
O mentor pode ser um bibliotecário, arquivista ou qualquer pessoa ligada à gestão e classificação do documento. O trabalho dele é definir qual a melhor forma de classificar um documento dependendo de como a informação será usada no dia a dia da empresa ou departamento.
O que o mentor precisa fazer?
Inicialmente, ele precisa dizer quais informações serão capturadas e de que tipo são. Por exemplo: em um determinado acervo, a Magali Robot deve capturar TIPO DE DOCUMENTO, ASSUNTO, PARTES DO CONTRATO, DATA, CIDADE e REGISTRO NO CARTÓRIO.
Uma vez definidas quais informações, o mentor deve dizer como capturar cada informação. Algumas informações serão capturadas por contexto em todo o texto, como TIPO DE DOCUMENTO, ASSUNTO. Outras por informações constantes em uma base conhecida, como, CIDADE OU EMPRESA, por exemplo. Data é um tipo especial e ele deve saber encontrar datas ao longo do documento.
Por fim, o mentor deve mostrar para a Magali Robot, onde encontrar certas informações especiais, como onde encontrar a informação REGISTRO NO CARTÓRIO ao longo do texto. Essa informação exige mais detalhes como uma localização por contexto.
Conclusões
Capturar informações usando a Magali Robot é mais fácil porque é mais natural, é como, por exemplo, fazemos para explicar a um novo funcionário da empresa. A Magali Robot dispensa um volume enorme de documentos para treinamento e também não necessita de formatação padrão ou template de documentos.
.png)


Comentários
Postar um comentário