如何使用 PDNob 進行 PDF OCR 文字辨識 - 使用指南
光學字元辨識(OCR)可從圖片或掃描版 PDF 擷取可編輯文字。透過 PDNob PDF 編輯器,您可以快速讓 PDF 變得可搜尋且可編輯。本指南將逐步帶您完成 OCR 功能安裝與套用至文件的操作流程。
- 01. 了解 OCR
- 02. 安裝 OCR 功能
- 03. 對 PDF 執行 OCR
- 04. 進階 OCR 設定(PDNob 2.0 提供)
1. 了解 OCR
OCR(光學字元辨識)技術可將掃描圖片或圖片型 PDF 轉換為可編輯、可搜尋的文字內容。這項功能特別適用於數位化紙本資料與掃描文件,讓原本無法編輯的內容也能輕鬆處理。
2. 安裝 OCR 功能
- 在您的電腦上啟動 PDNob PDF 編輯器。
- 在主介面中,點擊 「OCR PDF」 按鈕。
- 從電腦中選擇所需檔案,然後點擊 「開啟」 將其載入至 PDNob。
- 若系統提示,點擊 「下載」 按鈕以安裝 OCR 功能。
3. 如何對 PDF 檔案執行 OCR 文字辨識
- 安裝完成後,點擊上方工具列中的 「OCR」 按鈕以開始 OCR 流程。
- 將會顯示設定視窗,請依需求選擇 OCR 模式:
-
轉換為可編輯文本
將掃描文字轉換為完全可編輯內容。OCR 完成後,您可像一般文件一樣編輯、移動、複製或刪除 PDF 中的文字。 -
轉換為可搜尋文本
保留原始掃描影像,同時讓文字可搜尋與可選取。適合用於查找或索引內容,而不影響版面配置。 - 選擇適合的選項後,點擊 「執行 OCR」 開始文字辨識。
- OCR 完成後,辨識出的文字將可搜尋與複製。若選擇「轉換為可編輯文本」,還可直接在 PDF 中編輯文字。
4. OCR 進階設定(支援於 PDNob 2.0)
PDNob 2.0 新增 OCR 進階設定,讓使用者可最佳化辨識效果。啟用這些選項可提升準確度,但可能稍微降低處理速度。
若要使用這些功能,請開啟 OCR 設定面板並點擊 「進階設定」。您可以啟用或停用各項影像處理與文字偵測功能。請參考下方畫面了解入口位置。
以下為各項設定說明:
- 自動裁切頁面 – 自動偵測內容區域並裁切多餘邊緣,使頁面更精簡並提升 OCR 準確度。
- 自動校正頁面傾斜 – 校正傾斜頁面,使文字水平對齊,提升辨識精準度。
- 增強局部對比度 – 提升局部影像對比,使模糊文字更清晰,可能略微改變原始顏色。
- 去除黑點 – 去除小型黑點雜訊,讓頁面更乾淨並提升 OCR 效果。
- 去除雜點 – 過濾白色雜點與干擾,使文字邊緣更清晰,提升辨識效果。
- 偵測圖片中的文字 – 辨識並擷取圖片區域中的文字,達成更完整的 OCR 結果。