Guía de Usuario de PDNob V2.0

Editor PDF todo en uno: edita, convierte, aplica OCR y anota archivos PDF fácilmente en Windows, Mac y Online

Disponible en:

Cómo aplicar OCR a un PDF con PDNob | Guía de Usuario

El reconocimiento óptico de caracteres (OCR) permite extraer texto editable de imágenes o archivos PDF escaneados. Con PDNob PDF Editor, puedes convertir rápidamente tus PDFs en documentos editables y con búsqueda de texto. Esta guía te mostrará paso a paso cómo instalar la función OCR y aplicarla a tus documentos.

1. Qué es el OCR

La tecnología OCR (Reconocimiento Óptico de Caracteres) convierte imágenes escaneadas o PDFs basados en imágenes en texto editable y con capacidad de búsqueda. Es especialmente útil para materiales impresos digitalizados y documentos escaneados, ya que permite editar contenido que antes no podía modificarse.

2. Cómo instalar la función OCR

  • Inicia PDNob PDF Editor en tu ordenador.
  • En la interfaz principal, haz clic en el botón "OCR PDF".
    ocr pdf
  • Selecciona los archivos PDF desde tu ordenador y haz clic en "Abrir" para importarlos a PDNob PDF Editor.
  • Si aparece una ventana emergente, haz clic en el botón "Descargar" para instalar el módulo OCR.

3. Realizar OCR en archivos PDF

  • Después de la instalación, pulsa el botón "OCR" en la barra de herramientas para comenzar el procesamiento.
  • En la ventana de configuración, selecciona el modo OCR que mejor se adapte a tus necesidades:
    • Convertir en texto editable
      Convierte el texto escaneado en contenido editable. Después del OCR, podrás editar, mover, copiar o eliminar texto directamente en el PDF.
    • Convertir en texto buscable dentro de la imagen
      Mantiene intacta la imagen escaneada original mientras hace que el texto sea buscable y seleccionable, ideal para indexación sin alterar el diseño.
  • Haz clic en "Realizar OCR" para iniciar el reconocimiento.
    ocr pdf
  • Una vez completado el OCR, el texto podrá buscarse y copiarse. Si eliges "Convertir en texto editable", también podrás editarlo directamente dentro del PDF.

4. Configuración avanzada de OCR (Disponible en PDNob 2.0)

PDNob 2.0 incorpora una configuración avanzada de OCR que mejora significativamente la precisión del reconocimiento. Activar estas funciones puede aumentar ligeramente el tiempo de procesamiento, pero mejora notablemente los resultados.

Accede a las opciones avanzadas abriendo el panel de configuración de OCR y haciendo clic en Configuración avanzada. Desde allí, puedes activar o desactivar distintas opciones de procesamiento de imagen y detección de texto según tus necesidades. Consulta la captura de pantalla a continuación como referencia.

ocr advanced settings

Las opciones principales incluyen:

  • Recortar página automáticamente – Detecta los límites del contenido y elimina márgenes innecesarios para mejorar la precisión del OCR.
  • Corregir inclinación automáticamente – Alinea horizontalmente las páginas inclinadas para garantizar un mejor reconocimiento del texto.
    auto deskew page
  • Mejorar contraste local – Incrementa el contraste en áreas pequeñas para aclarar texto borroso con cambios mínimos en los colores.
    enhance local contrast
  • Eliminar manchas oscuras – Limpia pequeños artefactos oscuros para obtener páginas más claras y legibles.
    remove dark spots
  • Eliminar ruido – Filtra puntos blancos e interferencias visuales para mejorar la claridad del OCR.
    remove noise
  • Detectar texto en imágenes – Extrae texto incrustado en imágenes para lograr una cobertura OCR más completa.
    detect text on pictures