TAU2016/Ćwiczenia 1

Ćwiczenia 1

Jako korpusu równoległego używać będziemy rosyjskich i polskich napisów filmowych.

Tłumaczenie napisów jest dostępne jako wyzwanie na platformie Gonito.

# zakładam, że jesteśmy w środku opensubtitles-rupl, po sklonowaniu repozytorium
cd train
zcat train.tsv.gz | head -n 5 # wyświetli 5 pierwszych par zdań

Zadanie C101

Punkty: 15. Termin: zajęcia 12 października 2016.

Wymyślić jakiś prosty (być może „głupi”) sposób wygenerowania tłumaczenia (czy raczej pseudotłumaczenia), tak by uzyskać niezerowy wynik (w metryce BLEU) na platformie Gonito.

Aby uzyskać punkty, rozwiązanie musi zostać zgłoszone na platformie Gonito.net w wyzwaniu opensubtitles-rupl. Tamże znajdą Państwo wszelkie informacje.