23 lip 2014

Mgr inż. Piotr Żelasko

Jako pierwszy na swoim roku obronił się dzisiaj Piotr Żelasko. Jego praca "Rozpoznawanie mowy w telefonii" została oceniona na 5.0.

"Centrum zainteresowań mojej pracy stanowi problem nauczenia systemu rozpoznawania mowy radzenia sobie z obecnością oddechów i pauz wypełnionych. W szczególności, zajmę się:
-  stworzeniem prostego, pokazowego systemu dialogowego z modułem rozpoznawania mowy opartym na systemie Sarmata [Ziółko et al., 2011];
- przygotowaniem korpusu zawierającego oddechy i pauzy wypełnione wyekstrahowane ze spontanicznej mowy ciągłej;
- opracowaniem rozwiązania, które pozwoli systemowi rozpoznawania mowy osiągnąć lepsze rezultaty podczas rozpoznawania mowy, w której znajdują się wyraźne oddechy i pauzy wypełnione.

W pierwszej kolejności omówię strukturę transferu danych pomiędzy urządzeniem klienta a centralą systemu dialogowego oraz przedstawię przygotowany przeze mnie scenariusz przykładowego systemu dialogowego. Następnie opiszę krótko najważniejsze cechy systemu rozpoznawania mowy i przykładowy sposób połączenia go z systemem dialogowym. Pozostałą część pracy poświęcę na szczegółowy opis oddechów i pauz wypełnionych oraz na przedstawienie mojej metody uwzględnienia ich w modelu wypowiedzi, wraz z wynikami testów."

www.dsp.agh.edu.pl

6 lip 2014

Pokonferencyjne artykuły XXII Pacific Voice Conference

IEEE opublikowało wybrane prace organizowanej przez nas XXII Pacific Voice Conference. Zapraszamy do lektury. Prace dotyczą rozpoznawania mówców i mowy, w tym zastosowań do leczenia mowy patologicznej, rozwiajania własnego głosu przez ludzi.

www.dsp.agh.edu.pl