Nasz artykuł "Using Part of Speech N-grams for Improving Automatic Speech Recognition of Polish" został przyjęty na konferencji MLDM 2013 w Nowym Jorku. Artykuł opisuje pierwsze eksperymenty naszego nowego podejścia do wykorzystania tagów pochodzących z analizatorów morfologicznych do modelowania języka w rozpoznawaniu mowy. Kluczem sukcesu okazało się ograniczenie tagów POS (Part-of-speech) do węższej liczby kategorii, rezygnując ze szczegółowego opisu. Opracowany model 3-gramowy korzysta z estymacji Wittena-Bella 2-gramami.
www.dsp.agh.edu.pl
www.dsp.agh.edu.pl