TAU2017/Ćwiczenia

Motywem przewodnim zajęć będzie przygotowanie systemu tłumaczącego z języka niemiecki na angielski (WMT-2017).

Podczas zajęć będziemy korzystać z m.in.:

  • systemu operacyjnego Linux,
  • otwartoźródłowego systemu tłumaczenia maszynowego Moses,
  • platformy Gonito do śledzenia postępów.

Zadanie z trenowaniem Mosesa

Punkty: 125. Termin: zajęcia 25 października 2017.

Wyuczyć przy użyciu Mosesa translator dla wybranej pary języków (w nawiasie podaję punkty za poszczególne elementy):

  • w miarę możliwości przynajmniej kilkaset tysięcy par zdań,
  • rozmiar/sensowność korpusu (20 pkt)
  • poprawność pre-procesingu (15 pkt)
  • poprawność całej procedury (20 pkt)
  • zastosowanie kompaktowych tablic (5 pkt)
  • wyliczyć BLEU na odłożonym korpusie (moses-scripts/generic/multi-bleu.perl, 15 pkt),
  • ocenić jakość tłumaczenia (na „oko” – opisać wrażenia, porównać z Googlem etc.) (5 pkt),
  • znaleźć ciekawe przykłady (zaskakujące/śmieszne przykłady źle tłumaczone, zaskakujące przykłądy dobrze tłumaczone) (15 pkt),
  • przedstawić system (8-minutowa prezentacja (15 pkt) + pokaz działania systemu na żywo (10 pkt)).
  • plus ogólne wrażenie (5 pkt)