O Niemcach i półprzewodnikach (z przymrużeniem oka)

Budowa pierwszej w Warszawie na piechotę, rowerem most na Wiśle i likwidacji wybiegu dla niedźwiedzi na trasie GM to dwa najbardziej elektryzujących rekord jest określone planu wokół zoo
 
Ten tajemniczy tekst to fragment z internetu przetłumaczony z polskiego na nasze za pomocą programu komputerowego. Zawierający go artykuł został wybrany losowo – no może niezupełnie, szukałem czegoś neutralnego politycznie i światopoglądowo – a następnie potraktowany automatycznym tłumaczem Google (http://translate.google.pl), najpierw z polskiego na angielski, potem z powrotem z angielskiego na polski. W ten sposób najłatwiej ocenić jakość tłumaczenia. Dociekliwy Czytelnik może spróbować sam odgadnąć głęboki sens zawarty w powyższym zdaniu. Uważny odbiorca znajdzie rozwiązanie gdzieś w środku artykułu, niecierpliwych zaś przestrzegam przed zbyt szybkim zmierzaniem do puenty.
 
Różnorodność języków, którymi się porozumiewamy, była wyzwaniem od zawsze. Utrudnia życie podróżnikom, przeszkadza w rozwijaniu kontaktów handlowych, ogranicza zasięg literatury. Można sobie z tym poradzić na dwa sposoby: najszybciej i najłatwiej jest skorzystać z tłumacza – jednak wtedy musimy zaufać umiejętnościom obcej osoby bez gwarancji czy nasze słowa zostaną właściwie przekazane. Można także samemu nauczyć się obcego języka – jest to jednak metoda długa i wymagająca wielkiego wysiłku. Nic więc dziwnego, że szukamy drogi na  skróty, aby szybko i bezboleśnie przełożyć myśl z jednego języka na drugi. Rozwiązaniem mógłby być automatyczny tłumacz.
 
Pomysł ten najszybciej urzeczywistnił się w literaturze fantastycznej. W kontaktach z obcymi cywilizacjami trzeba przecież jakoś zapewnić możliwość wzajemnego porozumiewania się. Najczęściej przybysze z innej planety – dysponujący oczywiście znacznie bardziej zaawansowaną techniką od naszej – posiadają urządzenia, które w krótkim czasie uczą się „ziemskiego” języka (ciekawe, którego?), aby potem tłumaczyć „w locie” wypowiedzi obu stron. Czy takie tłumaczenie bez znajomości kontekstu kulturowego jest w ogóle możliwe? – nad tym autorzy nie zastanawiają się. Dotknął tego problemu Stanisław Lem w powieści Solaris, gdzie inna cywilizacja podejmuje próby nawiązania kontaktu, które jednak, ze względu na brak wspólnych doświadczeń, kończą się fiaskiem. 
 
Bardziej na serio o próbach skonstruowania maszyny do tłumaczenia pisał 30 lat temu Julisz Jerzy Herlinger, w popularnej książce dla młodzieży „Historie niewiarygodne”. W erze komputerów zadanie wydaje się proste: wystarczy wprowadzić do pamięci listę słów i ich odpowiedników w drugim języku, a komputer zrobi resztę. To jednak tylko pozory: jedno słowo może mieć wiele znaczeń – w każdym języku inne. Mamy więc piłkę (do kopania) i piłkę (do cięcia metalu), zamek (błyskawiczny) i zamek (budowlę) – przykłady można mnożyć. W drugim języku każdemu znaczeniu odpowiada zupełnie inny wyraz, ale skąd algorytm tłumaczący ma wiedzieć, które zastosować?  W zdaniu: „wczoraj kupiłem sobie piłkę”, trudno się domyślić o jaki przedmiot chodzi, ale już przy wyrażeniach: „wczoraj w Castoramie kupiłem sobie piłkę” albo „wczoraj kupiłem sobie piłkę i jutro z synem idziemy pograć” – wątpliwości raczej nie mamy. Tylko czy program tłumacza będzie wiedzieć, że w Castoramie nie sprzedają sprzętu sportowego? Albo czy będzie na tyle mądry, aby z sąsiadujących zdań wychwycić kontekst? We wspomnianej książce znajdziemy opis próby tłumaczenia w dwie strony – z angielskiego na niemiecki, a następnie z niemieckiego na angielski – zdania „german jest półprzewodnikiem”. Wynik końcowy brzmiał: „Niemiec jest półkierownikiem”, co świadczyć miało o tym, że problem jest nietrywialny.
 
Jakiś czas później pojawiły się w sprzedaży kieszonkowe słowniki elektroniczne, dostępne dla każdego. Są to wygodne urządzenia, małe i lekkie, przydatne zwłaszcza w podróży, gdy liczy się każdy kilogram, ale mają jedną wadę – odwzorowują słowo w słowo. Spróbujmy za jego pomocą przetłumaczyć na angielski zdanie „miedź jest przewodnikiem” (z germanem byłoby zbyt prosto). Na początku idzie łatwo: miedź to po angielsku copper, ale potem zaczynają się schody. Pod hasłem „przewodnik” mamy bowiem następujące odpowiedniki:  guide, conductor, guide-book, leader oraz itinerary, vehicle, president oznaczające kolejno: przewodnika (np. wycieczki), materiał przewodzący prąd elektryczny, przewodnik turystyczny (ksiażkę), przywódcę, plan podróży, pojazd (?) oraz prezesa. Słownik drukowany jest pod tym względem lepszy, bo zawiera rozszerzone opisy wyjaśniające, jednak i tu brak miejsca nie pozwala na omówienie wszystkich wieloznaczności. Dlatego rola tłumacza, z obszerną wiedzą na temat nie tylko języka, ale także dziedzictwa kulturowego obydwu stron, długo jeszcze pozostanie niezastąpiona.
 
A jednak. Oto na scenie pojawił się tłumacz Google, narzędzie wspierające wyszukiwanie informacji w światowych zasobach sieci. Jak większość produktów Google ma bardzo prosty interfejs – ot, dwa okienka, jedno na wpisanie tekstu oryginalnego, drugie na tłumaczenie, ale pod spodem kryje się bardzo zaawansowany algorytm. Na początek nie mogłem sobie odmówić przyjemności sprawdzenia przykładu z książki Herlingera. Wpisałem: „German is a semiconductor” i w odpowiedzi dostałem: „Deutsch ist ein Halbleiter” – blisko, blisko. Deutsch znaczy tyle co Niemiec, niemiecki, a Halbleiter składa się z dwóch części: Halb (połowa) oraz Leiter (przewodnik, ale także kierownik, menedżer, dyrektor). To jednak nie do końca prawda. German (półprzewodnik) to po angielsku nie German (który rzeczywiście oznacza Niemca), tylko Germanium, zaś niemieckie Halbleiter oznacza tylko i wyłącznie półprzewodnik, a nie żadnego „półkierownika”. Prawidłowe zdanie „Germanium is a semiconductor” po przetłumaczeniu w obie strony wygląda identycznie. Czyli albo Herlinger wszystko wymyślił (dość nieudolnie), albo w latach 70-tych mieli naprawdę słabiutkie komputery.
 
Weźmy zatem na warsztat zdanie z miedzią. Wpisujemy z lewej strony „miedź jest przewodnikiem”, z prawej dostajemy tłumaczenie na angielski „copper is a conductor” – prawidłowo! Teraz spróbujmy zmienić jedno słowo: „Piotr jest przewodnikiem” – wyświetla się „Peter is a guide” – brawo! Widać program umie rozpoznać znaczenie sąsiadujących wyrazów i odpowiednio dobrać kontekst. 
 
Tłumaczowi Google możemy też podać adres strony www, aby w wyniku otrzymać identyczną stronę, tyle że z przetłumaczonymi wszystkimi tekstami. Imponujące. Kilka razy skorzystałem z tej funkcjonalności na stronach w językach hiszpańskim i francuskim, których ni w ząb nie rozumiem. Tłumaczenie nie jest doskonałe, zwłaszcza na polski, który jest językiem trudnym ze względu na fleksję, ale po przejściu na angielski da się przynajmniej zrozumieć sens. Można przypuszczać, że z czasem algorytm będzie się rozwijać i tłumaczenia będą coraz lepsze.
 
Wróćmy do przykładu, który przytoczyłem na początku. Oryginalny tekst brzmi następująco: „budowa pierwszej w Warszawie pieszo-rowerowej kładki nad Wisłą oraz likwidacja wybiegu dla misiów przy trasie WZ to dwa najbardziej elektryzujące zapisy wyłożonego właśnie planu zagospodarowania okolic zoo”. Porównując go z tym, co wyszło po dwukrotnym przepuszczeniu przez tłumacza Google, trudno znaleźć podobieństwa. Ale spróbujmy inaczej – czy można nie tracąc sensu tak uprościć to zdanie tak, aby algorytm tłumacza sobie z nim poradził? No to do dzieła! zamiast „pieszo-rowerowej”, napiszmy „dla pieszych i rowerzystów”, „elektryzujące” zamieńmy na „intrygujące” a „wyłożonego” na „udostępnionego”. Trzeba jeszcze rozwinąć skrót WZ, zmodyfikować trochę szyk zdania i oto mamy: „Budowa pierwszej kładki nad Wisłą dla pieszych i rowerzystów w Warszawie oraz likwidacja wybiegu dla misiów przy trasie "Wschód-Zachód" to dwa najbardziej intrygujące zapisy udostępnionego właśnie planu zabudowy okolic zoo” – a po tłumaczeniu polsko-angielsko-polskim (przytaczam dosłownie): „budowa pierwszej kładki nad Wisłą DLA Pieszych i rowerzystów w Warszawie oraz Likwidacja wybiegu DLA misiów PRZY trasie "Wschód-Zachód"  do DWA najbardziej intrygujące zapisy udostępnionego wlasnie planu zabudowy okolic zoo”. Podobne, prawda?
 
Być może odkryliśmy właśnie kierunek, w jakim podążać będzie piśmiennictwo XXI wieku – upraszczanie języka, aby ułatwić pracę automatycznym tłumaczom. Nie byłaby to zła tendencja, bo niektóre artykuły prasowe pisane są tak, że sprawiają trudność w odbiorze nawet czytelnikom z wyższym wykształceniem. Na takiej zmianie mogłyby tylko zyskać. Czyżby więc nadchodził kres zawodu tłumacza? Na koniec spróbowałem przepuścić uproszczony tekst przez maszynkę polsko-niemiecko-polską. Wynik tłumaczenia, mówi sam za siebie: „budowa pierwszego mostu na Wiśle w Warszawie dla pieszych i rowerzystów oraz zniesienia startu i lądowisko dla niedźwiedzi po drodze, "Wschód-Zachód" to dwa rekordy najbardziej fascynujące jest to, wspólnego planu budynku w Zoo”.
 
I to by było na tyle.
 
(pad)