Rozpoznawanie Mowy

11 sty 2012

Audycja w Radiofonii

Zapis rozmowy o interfejsach głosowych przeprowadzonej ze mną w ramach programu Rozmowy fakultatywne.

10 sty 2012

Przykłady komercyjnych systemów głosowych na rynku IT

12 stycznia, mgr inż. Łukasz Dyląg wygłosi wykład pt. "Przykłady komercyjnych systemów głosowych na rynku IT" w sali C3 p. 501 o godzinie 10.45. Pan Łukasz jest pracownikiem firmy Pirios S.A. Zapraszamy.

22 gru 2011

O nas na stronie głównej AGH

"Dynamiczny rozwój branży IT już od wielu lat kreśli kierunek rozwoju instytucji, przedsiębiorstw, a nawet całych gałęzi przemysłu. W tej dziedzinie to, co jeszcze wczoraj nie było możliwe, jutro stanie się faktem. Bogactwo pomysłów i rozwiązań jest wprost niewyobrażalne. Dowodem na to, a zarazem kolejną cegiełką w rozwoju technologii informatycznych, jest urządzenie opracowane przez naukowców z Akademii Górniczo-Hutniczej, które możemy określić jako słuchającego wirtualnego doradcę. Nowatorstwo pomysłu polega na opracowaniu programu umożliwiającego rozmowę z komputerem w języku polskim. [...]"

- Ilona Trębacz, Biuletyn AGH

2 gru 2011

Przetwarzanie mowy

Właśnie odebraliśmy pierwsze egzemplarze naszej monografii "Przetwarzanie mowy" opublikowanej przez Wydawnictwa AGH.

Monografia poświęcona jest technologiom mowy ze szczególnym uwzględnieniem języka polskiego. Opisuje historię badań i rozwoju w dziedzinie przetwarzania mowy. Przedstawia liczne aspekty teorii sygnałów jednowymiarowych, zarówno analogowych jak i cyfrowych. Prezentuje zagadnienia filtracji, analizy częstotliwościowej i teorii falek. Opisano również metody parametryzacji, segmentacji i odszumiania sygnału mowy. Zobrazowano sposoby kompresji i standardowe techniki kodowania sygnału mowy w telekomunikacji. Przedstawiono metody klasyfikacji i modele stosowane w rozpoznawaniu mowy i mówców, w tym modele językowe. Omówione zostały zarówno standardowe rozwiązania, takie jak niejawne modele Markowa czy n-gramy, jak i te mniej znane, zwłaszcza powiązane z badaniami prowadzonymi przez autorów i ich współpracowników. Krótko scharakteryzowano inne technologie mowy, takie jak synteza mowy, systemy dialogowe czy rozpoznawanie emocji w sygnale mowy. Dokonano podsumowania osiągnięć i dostępnych zasobów akademickich i komercyjnych, szczególnie dla technologii mowy polskiej.

Streszczenie, spis treści i pierwszy rozdział są dostępne w pdfie.

28 lis 2011

I miejsce AGH w rankingu „Kuźnia prezesów”!

AGH odniosło wielki sukces wyprzedzając Politechnikę Warszawską i zajmując pierwsze miejsce w kluczowym i najbardziej przejrzystym rankingu oceniającym losy absolwentów "Kuźnia prezesów" Rzeczpospolitej.

21 lis 2011

Audiowizualny korpus mowy

Wykonaliśmy audiowizualny korpus mowy polskiej. Wszelkie znaki na niebie i w internecie pokazują, ze jest to pierwszy taki korpus, w sensie pierwszy dla naszego języka. Szczegóły na stronie Zespołu.

17 paź 2011

LTC 2011 w Poznaniu

Nasz artykuł "Impact of choice of training data and patterns reduction in speaker dependent speech recognition" został przyjęty na 5th Language & Technology Conference w Poznaniu. Praca prezentuje wyniku eksperymentów wykorzystania różnych baz wzorców akustycznych w rozpoznawaniu mowy.