Jelikož společnost „České překlady“:https://www.ceskepreklady.cz/odborne-preklady.html používá pro překlad naprosté většiny dokumentů CAT nástroje, musíme často provádět převod dokumentů dodaných v needitovatelné podobě přes tzv. OCR programy (optické rozpoznávání znaků, z anglického Optical Character Recognition). Jako ideálním pomocníkem se jeví program ABBYY FineReader.

Narážíme ovšem na problémy s formátováním. V závislosti na nastavení způsobu převodu se FineReader pokusí výsledný text naformátovat sám, ovšem postupuje při tom poměrně neohrabaně a výsledný text bývá sice opticky věrnou kopií předlohy, ovšem pro další editování poměrně nepřizpůsobivou (texty jsou rozděleny do množství oddílů, textových polí, sloupců, apod.).

Po exportu z ABBYY do Wordu (bez formátování) je třeba provést několik kroků:

  1. Zrušit stínování, respektive nastavit stínování na „žádné“. ABBYY automaticky nastaví stínování na „bílé“, což na bílé stránce nepoznáme, ale některé CAT nástroje, např. Wordfast, s tím mají potom problémy.
  2. Zrušit dvojité mezery, pomocí CTRL+H. ABBYY bohužel neformátuje odsazení pomocí tabulátorů, ale mezerami. Pro další práci je třeba dvojité mezery odstranit a k formátování použít tabulátory a posuvníky.
  3. Zrušit zalomení stránek a oddílů.
  4. Označit celý text a zvolit jeden druh fontu (druh a velikost písma), podle toho, který styl v textu převládá. ABBYY totiž někdy přiřadí textu, který je v originále psaný stejnou velkostí písma, různou velikost fontu (např. část udělá jako velikost 10,5 a část jako 11, čehož si třeba při formátování ani nevšimnete, ale celkově to pak nevypadá dobře). Proto doporučujeme vždy vyjít z jednoho druhu a jedné velikosti písma a pak pokračoval dál.
  5. Pokračovat formátováním textu, tzn. především nadpisy (případně včetně stylů, pokud je součástí textu obsah), sloupce, apod.
  6. Pozor na texty, které mají být v záhlaví a zápatí a na čísla stránek ABBYY vše automaticky vkládá do textu

Specifickým problémem jsou tabulky:

  1. ABBYY některé texty nerozpozná jako tabulku a převede je jako prostý text, pak musí následovat složité formátování ve Wordu, tzn. tabulky vytvářet a vkládat do nich obsah. To lze vyřešit přímo v ABBYY – označením příslušné části textu a změnou „Change Block Type“ na „Table“ a novým načtením bloku. Ve verzi ABBYY 8 je bohužel jedna chyba – při exportu se nově načtené části textu posunou na konec příslušné stránky, tabulku je potom při formátování ve Wordu potřeba vyjmout a umístit na správné místo.
  2. ABBYY špatně rozpoznává buňky, někdy vloží text, který má být ve více řádcích, do jedné buňky, někde naopak jednu buňku s textem na více řádcích převede tak, že ve Wordu z toho vznikne několik buněk pod sebou. To lze vyřešit přímo v ABBYY tak, že označíte příslušné buňky a kliknutím na pravé tlačítko vyberete Table cells -> a jednu z možností Split cells, Merge cells nebo Merge rows.
  3. ABBYY při exportu do Wordu nastaví pevnou šířku řádků buněk, což potom činí problémy při práci s Wordfastem a veškerém editování (při prodloužení textu). Proto je ideální všechny tabulky označit a změnit nastavení výšky řádku na „nejméně“.
  4. ABBYY vytváří tabulky tak, že vnější ohraničení tabulky udělá tlustší čarou než vnitřek. Je dobré na to při formátování textu ve Wordu pamatovat a vždycky ohraničení sjednotit.

Václav Baláček



Komentáře

  1. František Sousedík 8. května 2012

    Po exportu z ABBYY do Wordu (bez formátování) …
    V které verzi jste to dělal? Já jsem na možnost bez formátování nenarazil.
    F. Sousedik

  2. Václav Baláček 8. července 2013

    V anglické verzi je to „plain text“ – pod Tools – Options – 3. Save

Okomentujte příspěvek