CONARQ - Recomendações para Digitalização - Capturing

CONARQ - Recomendações para Digitalização - Capturing

May 3, 2016

 

Em 2012 houve a necessidade do desenvolvimento de uma solução de captura de imagem de documentos que fosse 100% eficaz nos quesitos de pesquisa e validade jurídica. Me refiro aqui não ao valor legal, mas sim a fazer tudo de forma íntegra, rigorosa e contingenciada de modo a dificultar ao máximo a recusa deste documento eletrônico quando de sua necessidade jurídica. Foi então que, pesquisando na “internet”, deparamos com o documento "Recomendações para Digitalização de Documentos Arquivísticos Permanentes de 2010" do CONARQ, ponto de partida para o desenvolvimento do nosso produto VIVO CAPTURE.

 

 

 

O Conselho Nacional de Arquivos - CONARQ é um órgão colegiado, vinculado ao Arquivo Nacional do Ministério da Justiça que tem por finalidade definir a política nacional de arquivos públicos e privados, como órgão central de um Sistema Nacional de Arquivos, bem como exercer orientação normativa visando à gestão documental e à proteção especial aos documentos de arquivo.

 

Do que Esta Recomendação Trata

 

Esta recomendação trata dos seguintes assuntos:

  • Captura digital em imagem de documentos planos e encadernados: impressos, manuscritos, mapas, plantas, desenhos, gravuras, cartazes, microformas, diapositivos, negativos, cópias e ampliações fotográficas;

  • Padrões e boas práticas mínimas para a captura digital de imagens; produção de matrizes e derivadas, identificação do representante digital e controle de qualidade;

  • Formatos digitais para representantes digitais matrizes e derivados;

  • Metadados técnicos e administrativos;

  • Boas práticas gerais para armazenamento, segurança e preservação dos arquivos digitais; e,

  • Utilização de serviços terceirizados para a captura digital, armazenamento e acesso aos arquivos digitais.

 

clique aqui e entenda mais sobre o Plano de Gestão Documental

 

Projeto de Digitalização

 

Os requisitos contidos nesta recomendação visam garantir que um projeto de digitalização de documentos contemple:

  • geração de arquivos digitais com qualidade;

  • fidelidade ao documento original;  e

  • capacidade de interoperabilidade, evitando-se ao longo do tempo a necessidade de se refazer a digitalização, além de garantir a satisfação das necessidades de uso dos usuários finais.

De modo a se gerar um arquivo fiel ao documento original, deve-se identificar o menor caractere (linha, traço, ponto, mancha de impressão, carimbos) a ser digitalizado para a determinação da resolução óptica que garantirá sua legibilidade na versão digital.

 

Para a definição do tipo de equipamento de captura digital a ser utilizado, deve-se observar os tipos documentais existentes no acervo e sua quantificação, além das características físico-químicas de cada tipo de documento, para reduzir os riscos à integridade física do original.

 

clique aqui e veja as características do Vivo Capture

 

Captura Digital da Imagem

 

No processo de captura digital, deve-se observar:

  • os parâmetros que possam significar riscos ao documento original;

  • as condições de manuseio; 

  • a definição dos equipamentos de escaneamento; 

  • o tipo de iluminação; 

  • o estado de conservação; e

  • o valor intrínseco do documento original (isto é, atribuir maior qualidade possível para documentos que fazem parte do "mainstream business" da empresa).

A qualidade da imagem digital é o resultado dos seguintes fatores:

  • da resolução óptica adotada no escaneamento: geralmente expressa em pontos por polegada (dpi);

  • da profundidade de bit: que é número de bits utilizados para definir cada "pixel"; e,

  • dos níveis de compressão: usados para diminuir o tamanho do arquivo gerado. 

 

clique aqui e veja opções de Digitalizações Remotas e Mobile

 

Formatos dos Arquivos

 

Para a geração de arquivos (matrizes, ver próximo item), recomenda-se a adoção dos formatos abertos (open sources), por permitirem melhores condições de acesso e preservação em longo prazo, e uma menor dependência de software e hardware. Dentre estes formatos recomenda-se TIFF, ou JPEG ou PNG.

 

Matrizes e Derivadas

 

Para cada imagem gerada recomenda-se a geração de dois arquivos digitais, a matriz e a derivada.

A matriz deve ter:

  • alta qualidade de captura;

  • fidelidade junto ao documento original; e,

  • acesso restrito e gerenciado exclusivamente por técnicos em TI.

 

Fazendo-se o processamento da Imagem e das etapas seguintes referentes ao "capturing" (identificação, controle de qualidade, etc), é gerado a imagem derivada.

 

A imagem derivada é a imagem que será apresentada para o usuário final. Ela pode/deve receber tratamentos para permitir a melhor visualização possível. Dentre estes tratamentos tem: a interpolação (o aumento da definição), o ajuste da perspectiva, a limpeza, a eliminação das páginas em branco, etc.

 

Eis aqui um exemplo da importância de se gerar e manter a matriz: Considere uma página com um carimbo muito fraco e tenha sido devidamente eliminada pelo sistema. Ao consultar esta página, o usuário questiona o fato, caso não se tenha a imagem matriz nunca será possível comprovar o valor do documento.

 

O formato PDF é recomendado para apresentação das derivadas por ser capaz de exibir e compartilhar documentos de maneira compatível, independentemente de software, hardware ou sistema operacional.

 

clique aqui e veja as características do Arquivo Vivo

 

Metadados Técnicos

 

Os metadados técnicos descrevem as características do arquivo no que diz respeito ao processo de captura digital, onde deve ser descrito e registrado o ambiente tecnológico (software e hardware), bem como algumas das características físicas do documento, tais como tipo e dimensão. Estes metadados devem, preferencialmente estarem inseridos ou encapsulados no arquivo de imagem matriz e também descritos e registrados em planilhas ou banco de dados.

 

Controle de Qualidade no Processo da Captura

 

O controle de qualidade no processamento técnico de captura digital de imagem, deve ser realizado pelos responsáveis da captura digital da imagem, um conjunto de procedimentos técnicos com o propósito de efetuar a verificação da fidelidade do representante digital em relação ao documento original, e se foram obtidas as características técnicas requeridas como resolução, modo de cor e registro de metadados técnicos.
Recomenda-se a amostragem quando forem grandes volumes (quantidade de itens individuais) e com características muito homogêneas.
Recomenda-se o exame individual nos casos em que os documentos possuam grande valor intrínseco.

 

Conclusões

 

Em se tratando de um documento de 2.010 muito já se mudou tanto no aspecto de tecnologia quanto na experiência de termos desenvolvido um software em acordo com estas recomendações e assim sendo termos tido a oportunidade de valida-las, na prática.

 

Primeiramente é dar um OK bem grande na ideia de ter duas matrizes por página. Esta ideia traz mais segurança no processo, pois, tanto uma imagem pode ser danificada pelo software no processamento de uma melhoria, como ela também pode ser deletada indevidamente tanto na etapa da "Identificação" como no "Controle de Qualidade". Principalmente se for uma imagem "quase em branco".


Seguindo na questão do "Controle de Qualidade" do documento, recomenda-se para grandes volumes uma estratégia de amostragem estatística para seleção dos documentos que passarão pelo processo, e para casos de documentos de grande valor intrínseco olhar um a um. Mas o que fazer quando temos um grande volume de documentos de grande valor intrínseco, como por exemplo, contratos de empréstimos bancários? É importante então colocarmos no software de processamento de imagem, ferramentas que selecionem documentos que passarão pelo CQ (Controle de Qualidade). Dentre estas ferramentas podemos ter: ângulo de correção do "deskew" (perspectiva), baixa taxa de reconhecimento no OCR, marcação de documento pelo digitador, e outras .

 

Para finalizar, nos itens de segurança e preservação, mais especificamente arquivo sobre preservação, a recomendação coloca a possibilidade de armazenamento das Matrizes Digitais em "Fitas magnéticas do tipo LTO (Linear Tape-Open), e similares". Observe que isto, para 2.018, em que temos armazenamento em nuvem em grandes "players" como "Google", "Amazon" e "Microsoft" a partir de R$0,03 por GBytes/mês, será algo bem mais custoso de ser preservado. Já sobre segurança, a recomendação não coloca a questão do acesso ao conteúdo, mais especificamente não cita nada sobre criptografia destes arquivos.

 

 

VISITE O NOSSO SITE!

 

 

 

 

 

 

 

 

 

 

Please reload

Our Recent Posts

Arquivo Vivo - Dê Vida para Seus Documentos

August 5, 2019

Faça Você Mesmo a Digitalização de Seus Documentos

June 3, 2019

Incremente seu Negócio com Digitalização de Documentos

April 1, 2019

1/1
Please reload

Tags