Como fazer OCR em PDF com PDNob - Guia do Usuário
O Reconhecimento Óptico de Caracteres (OCR) permite extrair texto editável de imagens ou PDFs digitalizados. Usando o PDNob PDF Editor, você pode rapidamente tornar PDFs pesquisáveis e editáveis. Este guia mostra como instalar o recurso de OCR e aplicá-lo aos seus documentos passo a passo.
1. Entendendo o OCR
A tecnologia OCR (Reconhecimento Óptico de Caracteres) converte imagens digitalizadas ou PDFs baseados em imagem em texto editável e pesquisável. É especialmente útil para materiais impressos digitalizados e documentos escaneados, permitindo manipular conteúdos que antes não podiam ser editados.
2. Instalando o recurso de OCR
- Inicie o PDNob PDF Editor no seu computador.
- Na interface principal, clique no botão "OCR de PDF".
- Selecione os arquivos PDF no seu computador e clique em "Abrir" para importá-los no PDNob PDF Editor.
- Se solicitado, clique no botão "Baixar" para instalar o módulo de OCR.
3. Realizando OCR em PDFs
- Após a instalação, clique no botão "Executar OCR" na barra de ferramentas para iniciar o processamento.
- Na janela de configurações, selecione o modo de OCR adequado às suas necessidades:
-
Converter para texto editável
Transforma o texto digitalizado em conteúdo editável. Após o OCR, você pode editar, mover, copiar ou excluir texto diretamente no PDF. -
Converter para texto pesquisável na imagem
Mantém a imagem original intacta enquanto torna o texto pesquisável e selecionável, ideal para indexação sem alterar o layout. - Clique em "Executar OCR" para iniciar o reconhecimento.
- Após a conclusão do OCR, o texto se torna pesquisável e copiável. Ao escolher "Converter para texto editável", você também poderá editar diretamente no PDF.
4. Configurações avançadas de OCR (disponível no PDNob 2.0)
O PDNob 2.0 introduz configurações avançadas de OCR que aumentam a precisão do reconhecimento. Ativar esses recursos pode aumentar ligeiramente o tempo de processamento, mas melhora significativamente os resultados.
Acesse as opções avançadas abrindo o painel de configurações de OCR e clicando em Configurações avançadas. Você pode ativar ou desativar diferentes opções de processamento de imagem e detecção de texto conforme necessário. Veja a imagem abaixo como referência.
Principais opções incluem:
- Recortar página automaticamente – Detecta automaticamente os limites do conteúdo e corta as margens para melhorar a precisão do OCR.
- Endireitar página automaticamente – Alinha páginas inclinadas horizontalmente, garantindo melhor reconhecimento de texto.
- Aprimorar contraste local – Aumenta o contraste em pequenas áreas para tornar textos borrados mais nítidos, com mínima alteração de cor.
- Remover manchas escuras – Remove pequenas manchas escuras para deixar a página mais limpa.
- Remover ruído – Remove pontos brancos e interferências visuais para melhorar a clareza do OCR.
- Detectar texto em imagens – Extrai texto incorporado em imagens para uma cobertura completa de OCR.