Temat konwersji OCR plików PDF potrzebnych do tłumaczenia instrukcji obsługi jest bardzo ciekawy. Przyjrzyjmy się tym razem bliżej, jak zachowują się po przetworzeniu tabele i obrazy zawierające edytowalny tekst.

Problemy z tabelami po konwersji OCR

1. Jednolita wysokość wierszy

Często automatyczne narzędzia do konwersji PDF przy przenoszeniu tabel do formatu Microsoft Word przypisują stałą wysokość wierszom. Gdy tekst po tłumaczeniu się rozszerzy, może nie mieścić się w polach, częściowo wypływać i jak i znikać. Konieczne będzie manualne dostosowanie rozmiarów komórek w takiej sytuacji.

2. Ukryte obramowania

Brak widocznych linii w tabelce nie oznacza, że tabela nie istnieje. Zamiast struktury tabeli niektóre konwertery stosują tabulatory, podziały akapitów i spacje, by odtworzyć oryginalny układ. Całość może się rozjechać, ponieważ tekst docelowy zwykle jest obszerniejszy (zobacz na poniższej grafice brakujący obrys oznaczony zieloną ramką).

3. Niespójne wyrównanie tekstu w komórkach

Często opiera się wyrównanie zawartości w komórkach na znacznikach na linijce, co prowadzi do niespójności. Mogą być wyrównane do lewej z postrzępionym marginesem, choć komórki, przykładowo, powinny być wyśrodkowane. Problem staje się widoczny i wymaga ponownej, ręcznej korekty formatowania przy większej ilości tłumaczonego tekstu technicznego.

Problemy z obrazami i adnotacjami

Poniżej znajduje się typowa tabela z liniami siatki ustawionymi jako „ukryte”:

Główne wyzwania przy konwersji:

Automatyczne konwertery PDF mogą zaburzyć układ i strukturę podpisów oraz adnotacji:

Przetłumaczony tekst techniczny może zostać rozdzielony na 2–3 kolumny, co zaburza pierwotny design.

Zdania bywają łamane w niewłaściwych miejscach przez nieplanowane podziały akapitów.

Fragmenty jednej frazy mogą trafić do różnych pól tekstowych bez automatycznego dopasowania ich do nowej długości.

Mogą pojawić się zbędne sekcje i dodatkowe podziały.

Tak wygląda tekst tabeli w narzędziu wspomagającym tłumaczenie – CAT:

Podsumowanie i rekomendacje

Powyższe poruszone problemy mają na celu uwypuklenie trudności przy pracy z plikami PDF (np. łamanie zdań w środku, nadmiar znaczników, ukryte części po tłumaczeniu technicznym).

Aby uzyskać czytelną, jednoznaczną strukturę i zminimalizować nakład pracy związany z formatowaniem oraz tłumaczeniem, zdecydowanie zalecam wcześniejsze przygotowanie dokumentów do narzędzi CAT. Dzięki temu zaoszczędzisz czas, wysiłek i koszty.


Potrzebujesz profesjonalnego tłumaczenia technicznego z języka niemieckiego? Skontaktuj się ze mną w sprawie konwersji plików PDF i fachowego tłumaczenia instrukcji.