Provimento CG N.º 22/2014: Ideias para elaborar um Projeto de Digitali

Saiba como elaborar um Projeto de Digitalização de Acordo com as Recomendações da Corregedoria Geral da Justiça

February 20, 2019

Pelos idos de 2016 recebi de um prestador de serviços de digitalização, umas imagens digitalizadas de um serviço que estavam fazendo para um cartório que o cliente não estava aceitando. Realmente as imagens eram de péssima qualidade, principalmente o material encadernado, que não estavam adequadamente preparados e a iluminação não permitia nenhum ajuste de parâmetros para torná-las legíveis. Queriam que eu desse uma "melhorada" naquilo...

 

 

Introdução
 

Não bastasse as imagens ruins havia também por parte do prestador desconhecimento dos critérios técnicos exigidos para atender aquele perfil de cliente, ou seja, cartórios.

 

Infelizmente algumas vezes em pequenas e médias empresas deparamos com amigos ou parentes realizando o serviço da digitalização em detrimento da competência técnica de outros que até, e por isto inclusive, gostariam de realizar o trabalho.

 

Para esclarecimentos sobre o que é um projeto de digitalização vou comentar aqui sobre o "Provimento CG N.º 22/2014 destinado à elaboração dos arquivos de segurança (backups) das Serventias Extrajudiciais". É uma recomendação da Corregedoria Geral de como os Cartórios devem proceder para realizar digitalização de documentos. É um material conciso e completo e mesmo que você não seja de um cartório, poderá ser útil. Clique aqui para ver a íntegra.

 

Adicionalmente vou comentar sobre alguns dos critérios técnicos que estão neste documento.

 

clique aqui e entenda mais sobre o Plano de Gestão Documental

 

Critérios Técnicos

 

Os critérios técnicos destacados no provimento são importantes para qualquer projeto de digitalização. Eu diria que são a base do projeto.

 

Vamos comentar alguns.

 

a) Captura Conforme Recomendações do CONARQ (Conselho Nacional de Arquivos)

 

 

Se deseja um aprofundamento destas recomendações que, por coincidência, foram usadas no desenvolvimento do VIVO CAPTURE, vá neste artigo do meu blog.

 

Aqui vamos destacar alguns pontos:

 

- a escolha do equipamento. Na demanda que eu citei no início deste artigo algumas imagens de  livros que me passaram davam a nítida impressão de terem sido feitas com uso de câmeras fotográficas pois as condições de iluminação não estavam ideais (brilho intenso). Com certeza o equipamento não era o adequado. Deve-se ter cuidado para não cair na tentação do preço do serviço. Existem na internet várias propostas de projetos de "maquinetas" que fazem escaneamento de material encadernado. Algumas empresas montam isto e oferecem o serviço. Podem até funcionar, dependendo do volume de páginas a serem escaneadas. Mas não tem como garantir a qualidade. Tenha consciência de uma coisa, material encadernado da muito trabalho. As scanners que fazem este serviço se chamam "Planetárias" (ou copibook), e para você ter uma ideia de como é o trabalho veja este link.

 

- a definição dos metadados. Os metadados devem ser definidos pensando-se em como os documentos serão pesquisados quando estiverem disponíveis para consulta. Porém não se pode esquecer que para eles chegarem lá terão que passar pelo trabalho de captura. Se você tem dados referentes aos documentos que serão escaneados, defina quais deles podem ser agregados as imagens geradas na digitalização e importe estes dados no sistema de captura. Isto é muito útil pois minimiza erros de indexação e permite gerar relatórios de sobras. O que é este relatório? Imagine que no escaneamento a página referente ao início do documento não foi escaneada ou o digitador, no momento da digitação, comeu bola e pulou ? Então conseqüentemente dois documentos irão "juntar". Com o relatório de sobras você irá detectar que um dado lógico está "sobrando" e poderá no "Controle de Qualidade" corrigir este erro. Aliás o nome do relatório é "Relatório de Sobras Lógicas e Físicas".

 

clique aqui e veja as características do Arquivo Vivo

 

b) Duas Cópias de Segurança

 

 

Eu não vejo solução melhor que a nuvem. Tecnicamente a nuvem é um servidor em ambiente seguro com um software implementado de acordo com protocolos de segurança de acesso. Falando de forma bem simples este protocolo te dá uma senha de 2 KBytes para ter acesso aos documentos do storage. Comparando, a sua senha de acesso possui no máximo 10 bytes.

 

Com relação a fazer a cópia em HD removível deve-se ter cuidado de armazenar este HD em local adequado. Existem várias empresas que oferecem este serviço, são as chamadas "Cold Storages" (câmaras frias). O problema que surge é o de manter a cópia devidamente atualizada. Deve-se ter então a preocupação com a manutenção desta cópia.

 

c) Matriz com Resolução de 300 DPI

 

 

É importante que a matriz não receba nenhum tratamento, isto fará com que ela seja fiel ao documento original.

 

Por outro lado, apenas a resolução não gera uma matriz que permite um processamento ideal no caso de o próprio documento original estar ilegível. Para isto é necessário ajustarmos um parâmetro chamado de "profundidade de bits" (pixel type/depth). Quanto maior a profundidade melhor é o resultado do processamento.

 

Trabalhe sempre com jpeg (tonal) com 100% de qualidade. Ele será entre 4 e 5 vezes maior que o tiff (preto e branco), mas o resultado compensa. Se você viu o link da planetária acima vai entender que é um trabalho muito mais caro que isto.

 

Não se esqueça que tudo começa pelo Plano de Gestão Documental. Nele você vai destacar todos os tipos de documentos, os valores de cada tipo (se legal ou histórico), os formatos e as propriedades. Este plano deve ser feito antes até da aquisição dos equipamentos.

 

Em 2005 fizemos um programa de digitalização dos prontuários de arquivo morto (pessoas falecidas) para o Hospital das Clínicas da Faculdade de Medicina da USP em Ribeirão Preto. O objetivo era gerar uma grande base de informações voltadas para ensino e pesquisa. Todo o planejamento foi muito bem elaborado pela comissão de prontuários pois haviam, por exemplo, exames antigos impressos em mainframe IBM, coloridos e tamanho fora do padrão. A comissão desejava que a cor dos exames fosse preservada e que eles fossem escaneados integralmente como uma única folha.

 

Naquela época não se falava em BIG DATA e MACHINE LEARNING, mas se você pretende fazer digitalização para geração de BIG DATA é muito importante fazer o planejamento e seguir os critérios técnicos que foram observados como no caso acima citado do HCFMRP.

 

Corre-se o risco de produzir um material que depois não servirá para nada.

 

clique aqui e veja alguns de nossos Clientes e Casos de Uso

 

d) Uso de Certificação Digital

 

 

 

A Infraestrutura de Chave Pública Brasileira, conhecida por ICP - Brasil, foi instituída através de uma medida provisória chamada de MP 2.200-2 de agosto de 2001. Tem como objetivo dar validade jurídica para documentos e transações eletrônicas. Para isto ela define quem são as autoridades que emitem e mantém os certificados e quais são as autoridades que podem entregar este certificado para o cidadão comum ou empresas.

 

Tecnicamente falando o certificado digital é um procedimento que numa primeira etapa faz a criptografia dos bytes do seu arquivo de imagem e, na segunda etapa, faz o encapsulamento deste elemento criptografado em um formato em cujo layout ele vai adicionar umas chaves, demais informações do certificado digital usado e uma assinatura digital.

 

A assinatura digital é uma variável de mais de 30 bytes cujo valor é calculado matematicamente sobre o conteúdo do documento. É calculado uma vez na geração, gravado no cabeçalho do arquivo e depois todas as vezes que abre o documento ele é recalculado e o valor confrontado com o que está gravado. Se bater ele abre, se não bater ele informa que o conteúdo foi alterado. Isto garante a integridade do documento.

 

O documento certificado recebe duas chaves, a pública e a privada. A chave pública é colocada no layout do arquivo gerado. Isto permite que qualquer pessoa utilizando um programa especial de leitura consiga ver o conteúdo da informação. Isto quer dizer que a certificação não garante o sigilo da informação.

 

Já com relação a chave privada ela fica inacessível e é necessário ter um leitor e o cartão de o certificado digital emitido por autoridade competente. Ela é a chave que identifica o criador do documento, e estando desta forma ela garante a autoria da informação de forma inegável. Isto garante a autoria e o autor não consegue negar que foi feito por ele (ou usando o cartão dele).

 

Finalmente é importante ter claro que a certificação digital não garante em nada a qualidade da imagem. Não tem absolutamente nada a ver com isto.

 

clique aqui e veja opções de Digitalizações Remotas e Mobile


e) Sistema de Indexação

 

 

 

Vale lembrar que o Sistema de Indexação (o "capturing") possui as etapas de escaneamento, indexação e controle de qualidade. A localização precisa depende de realizar bem estas 3 etapas.

 

É sempre mais adequado que a indexação seja realizada com uso de dados aproveitados de outros sistemas da empresa para minimizar os erros de digitação. Mais vale uma indexação 100% correta do que uma indexação mais precisa porém sujeita a erros.

 

Agora se você não tem os dados para aproveitar e tem que digitar tudo do zero o adequado é fazer validações automáticas nos campos que permitem isto, como por exemplo, RG's, CPF's, códigos com dígito de verificação, datas e assim por diante. Outro recurso interessante é fazer o OCR (reconhecimento automático de palavras) em regiões específicas onde estão os campos que deseja como identificadores do documento. Atualmente temos nas plataformas de nuvem serviços como o Google Cloud Vision que oferecem um reconhecimento de texto excelente a preços acessíveis. Eu não só uso como também recomendo. 

 

O Controle de Qualidade é uma etapa do "capturing" que, a medida que houverem leis que permitam o descarte do documento original em papel, irá crescer em importância. A recomendação do CONARQ fala em atribuir valores aos documentos e fazer o controle dos documentos de maior valor. Muitos fazem o controle de um percentual do volume processado. São duas estratégias que não funcionam. No nosso software de captura, o VIVO CAPTURE, fazemos uma análise considerando algumas informações coletadas no escaneamento (angulo de correção da perspectiva, deskew) e na digitação (o operador pode marcar a qualidade da imagem e forçar o controle de qualidade) e assim priorizamos os documentos ruins no controle de qualidade. São critérios mais objetivos.

 

clique aqui e veja as características do Arquivo Vivo

 

Conclusões

 

Eu gosto deste provimento pois ele, além de especificar a necessidade da certificação digital, dá importância ao processo de digitalização.

 

A escolha dos dispositivos usados na geração das imagens, a geração de uma matriz fiel ao original, uma indexação confiável e um controle de qualidade eficiente são extremamente necessários de serem bem definidos no projeto de digitalização.

 

De que adianta certificar um documento que depois você não conseguirá ler não é verdade ?

 

VISITE O NOSSO SITE E CADASTRE O SEU EMAIL PARA RECEBER AS NOVIDADES!

 

 

 

ENTENDA NOSSO PROCESSO DE VENDA E COMECE AGORA

 

VISITE O NOSSO SITE!

 

 

 

 

 

 

Please reload

Our Recent Posts

Arquivo Vivo - Dê Vida para Seus Documentos

August 5, 2019

Faça Você Mesmo a Digitalização de Seus Documentos

June 3, 2019

Incremente seu Negócio com Digitalização de Documentos

April 1, 2019

1/1
Please reload

Tags