TAU2017/Ćwiczenia

Motywem przewodnim zajęć będzie przygotowanie systemu tłumaczącego z języka niemiecki na angielski (WMT-2017).

Podczas zajęć będziemy korzystać z m.in.:

 • systemu operacyjnego Linux,
 • otwartoźródłowego systemu tłumaczenia maszynowego Moses,
 • platformy Gonito do śledzenia postępów.

Zadanie z trenowaniem Mosesa

Punkty: 125. Termin: zajęcia 25 października 2017.

Wyuczyć przy użyciu Mosesa translator dla wybranej pary języków (w nawiasie podaję punkty za poszczególne elementy):

 • w miarę możliwości przynajmniej kilkaset tysięcy par zdań,
 • rozmiar/sensowność korpusu (20 pkt)
 • poprawność pre-procesingu (15 pkt)
 • poprawność całej procedury (20 pkt)
 • zastosowanie kompaktowych tablic (5 pkt)
 • wyliczyć BLEU na odłożonym korpusie (moses-scripts/generic/multi-bleu.perl, 15 pkt),
 • ocenić jakość tłumaczenia (na „oko” – opisać wrażenia, porównać z Googlem etc.) (5 pkt),
 • znaleźć ciekawe przykłady (zaskakujące/śmieszne przykłady źle tłumaczone, zaskakujące przykłądy dobrze tłumaczone) (15 pkt),
 • przedstawić system (8-minutowa prezentacja (15 pkt) + pokaz działania systemu na żywo (10 pkt)).
 • plus ogólne wrażenie (5 pkt)