Akce OCR umožňuje rozpoznat text ve skenech/obrázcích pomocí technologie OCR. Akce obsahuje několik přizpůsobitelných parametrů viz níže.


Pamatujte na to, že pro využití této funkce je nutné mít licenci k PDF-XChange PRO, modul Enhanced OCR nepokrývá licence k PDF-Tools. 

  • Když dokument obsahuje text. Tento rozbalovací seznam umožňuje vybrat danou operaci v případě, že zdrojové dokumenty obsahují textovou vrstvu:
      • Provést OCR. V tomto případě budou zdrojové dokumenty zpracovány pomocí OCR.
      • Pokračovat ve zpracování bez OCR. Funkce OCR bude vynechána ze zpracování zdrojových dokumentů.
      • Přeskočit zpracování dokumentu. V tomto případě budou zdrojové dokumenty přeskočeny.


  • Více možností... Tato volba umožňuje zobrazit nebo nastavit parametry funkce OCR viz podkapitola Enhanced OCR.
  • Ignorovat vstupní rozsah stránek. Pokud je toto políčko zaškrtnuto, bude zcela ignorován jakýkoliv rozsah stránek zadaný v akcích Vyberte zdrojové dokumenty nebo Filtry souborů.
  • Otevře při běhu okno s nastavením. Pokud je zaškrtnuto, zobrazí se po spuštění daného nástroje dialogové okno OCR stránek (Enhanced) s nastavením převodu obrázků do formátu PDF.


 


Enhanced OCR (FineReader)

Rozsah stránek

V této sekci vyberte stránky, na kterých chcete pomocí funkce OCR rozpoznat text.

  • Stránky. Zde je možné vybrat rozsah stránek, které budou zpracování pomocí OCR.
  • Podmnožina. Zde je možné vybrat podmnožinu stránek.
  • Přeskočit stránky pokud již text obsahují. Pokud je zaškrtnuto, budou ze zpracování funkcí OCR vynechány stránky, které již obsahují textovou vrstvu.


Možnosti rozpoznání

Zde můžete nastavit parametry rozpoznání textu pomocí funkce OCR.


  • Jazyky. Výběr jazyka pro rozpoznání textu. Kromě českého jazyka jsou k dispozici další desítky jazyků.
  • Přesnost. Umožňuje nastavit přesnost rozpoznání textu pomocí funkce OCR.
  • Detekovat zkosení obsahu na stránce. Pokud je zaškrtnuto, bude aplikace detekovat zkosení obsahu na stránce.
  • Detekovat chybné natočení stránky. Pokud je zaškrtnuto, bude aplikace detekovat chybné natočení stránek.
  • Ignorovat text v grafických objektech. Zaškrtnutím této volby budou ze zpracování OCR vyloučeny ilustrace, diagramy, kresby atd.
  • Ignorovat firemní loga. Pokud je zaškrtnuto, nebude text rozpoznán ve vybraných obrázcích jako jsou loga, razítka, podpisy apod. Pomocí tlačítka lze vybrat obrázky, které budou při použití funkce OCR přeskočeny ze zpracování.
  • Ignorovat existující text na stránce. Aplikace provede OCR i přesto, že ve zdrojových dokumentech již textová vrstva existuje.
  • Ignorovat komentáře na stránce. V případě, že toto políčko zaškrtnuté, nebude rozpoznán text v komentářích.
  • Ignorovat formulářová pole na stránce. Pokud je zaškrtnuto, nebude rozpoznán text ve formulářových polích.


Možnosti výstupu 

V této části lze nastavit požadovaný Typ výstupu po provedení funkce OCR. 


  • Editovatelný text a obrázky. Tato volba přidá rozpoznaný text do nové viditelné textové vrstvy a odstraní původní obsah pod rozpoznaným textem.
  • Prohledavatelný obrázek. Tato volba zachová původní obsah a nad původním dokumentem pouze vytvoří novou textovou vrstvu pro prohledávání.


  • Opravit zkosení obsahu a chybné natočení stránky. Pokud je zaškrtnuto, budou automaticky narovnány zkosené nebo chybně natočené stránky.
  • Nakreslit ohraničení tabulek. Pokud je zaškrtnuto, pokusí se OCR nakreslit do tabulky ohraničení buněk.


  


Pro spuštění OCR stiskněte tlačítko OK.