Současně s uvedením verze 9, byl uveden také nový modul Enhanced OCR založený na knihovnách ABBYY® OCR SDK (FineReader), který je přesnější a spolehlivější v rozpoznávání textu ve skenech než předchozí modul. V tomto článku si ukážeme, jak postupovat v případě, že nám stačí vytvořit nad skenovaným obsahem tzv. textovou vrstvu. To umožní prohledávání textu dle zadaných klíčových slov.


Vytvoření textové vrstvy ve skenovaném PDF dokumentu

1 Otevřete skenovaný soubor PDF v menu Soubor > Otevřít.

2 Na kartě Konverze vyberte položku OCR.



3 Následně se otevře dialogové okno OCR stránek (Enhanced) s nastavením funkce OCR. Možnosti nastavení modulu Enhanced OCR najdete na následující stránce.


Pokud chcete vytvořit pouze prohledavatelnou textovou vrstvu bez konverze, vyberte v sekci Možnosti výstupu volbu Prohledavatelný obrázek.



Rozsah stránek

V této sekci vyberete stránky, na kterých chcete pomocí OCR rozpoznat text.

Možnosti rozpoznání

Zde můžete nastavit parametry rozpoznání textu.

  • Jazyky. Výběr jazyka pro rozpoznání textu. K dispozici je čeština a další desítky jazyků. 
  • Přesnost. Umožňuje nastavit přesnost rozpoznání textu. 
  • Detekovat zkosení obsahu na stránce.
  • Detekovat chybné natočení stránky.
  • Ignorovat text v grafických objektech. Pokud je zaškrtnuto, nebude text rozpoznán v grafických objektech jako jsou razítka, podpisy apod.
  • Ignorovat existující text na stránce. Aplikace provede OCR i přesto, že textová vrstva již existuje.
  • Ignorovat komentáře na stránce. V případě, že toto políčko zaškrtnuté, nebude rozpoznán text v v komentářích.
  • Ignorovat formulářová pole na stránce. Text ve formulářových polích též nebude rozpoznán.

Možnosti výstupu 

V této části lze nastavit Typ výstupu po provedení funkce OCR. Pokud chcete jen vytvořit prohledavatelnou textovou vrstvu, tak vyberte volbu:

  • Prohledavatelný obrázek. Tato volba zachová původní obsah a pouze nad původním dokumentem vytvoří novou textovou vrstvu. Pokud si přejete vytvořit zcela nový dokument s rozpoznanou textovou vrstvou, pak zaškrtněte políčko Vytvořit nový dokument.


4 Proces rozpoznání textu pomocí modulu Enhanced OCR spustíte stisknutím tlačítka OK.

5 Pokud bylo vytvoření textové vrstvy úspěšné zjistí uživatel jednoduše. V textu již lze vyhledávat nebo je možné ho vybrat pomocí nástroje Výběr textu.