Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Divbox

Tornar o arquivo pesquisável (OCR)

Panel
bgColor#FFFFFF

A tecnologia Optical Character Recognition (OCR) reconhece caracteres a partir de um arquivo de imagem ou mapa de bits. Através do OCR é possível digitalizar uma folha de texto impresso e obter um arquivo de texto editável. É necessário que todos os arquivos PDF encaminhados ao TCE-PB possuam conteúdo pesquisável. É possível tornar um documento digital pesquisável em dois momentos:

  • No momento da digitalização: nesse caso, deve-se marcar a opção de passar o OCR na hora da digitalização. Deve-se observar que nem todos os scanners possuem programas com esse recurso.

  • Após a digitalização: com documento já digitalizado, pega-se o arquivo PDF e o processa em uma ferramenta de OCR específica para essa função. Assim, o arquivo PDF originalmente não pesquisável será transformado em um com conteúdo pesquiável. Sugestão de Ferramentas de OCR (OmniPage, TextBridge, Adobe Capture, Abbyy FineReader, FreeOCR, Online-OCR, WonderShare PDF Editor).

 

 

Divbox

Conferência da Digitalização

Panel
bgColor#FFFFFF

Para assegurar que o documento foi corretamente digitalizado, é imprescindível que o digitalizador faça uma confe dos seguintes pontos:

  1. Conferência do número de páginas digitalizadas
    1. Se estiver sendo digitalizada apenas a frente das páginas, observar se o número da última página é o mesmo marcado acima da folha no aplicativo digitalizador. Caso haja alguma divergência, devem-se conferir as folhas.Exemplo: se foram digitalizadas 10 páginas, mas o número da última página é 11, provavelmente alguma página deixou de ser digitalizada.
    2. Se estiver sendo digitalizados frente e verso das páginas ou tons de cinza, a melhor opção é se passar as folhas verificando numeração.
    3. Eliminar as folhas em branco manualmente.
  2. Rotacionar as folhas, caso necessário, de modo que o texto fique posicionado corretamente para a leitura.
  3. Conferência de legibilidade: Na tela, ver a imagem em escala 1:1 - 100 %, verificar a legibilidade do documento;
  4. Imprimir uma folha do documento digitalizado e fazer exame a “olho nu”, da cópia impressa, para avaliar a qualidade da captura digital comparando com o documento original;
  5. Testar o sistema de busca, procurando-se uma palavra qualquer do texto, a fim de determinar se o OCR foi devidamente aplicado; 

...