google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0
11 sty 2012
Audycja w Radiofonii
Zapis rozmowy o interfejsach głosowych przeprowadzonej ze mną w ramach programu Rozmowy fakultatywne.
10 sty 2012
Przykłady komercyjnych systemów głosowych na rynku IT
12 stycznia, mgr inż. Łukasz Dyląg wygłosi wykład pt. "Przykłady komercyjnych systemów głosowych na rynku IT" w sali C3 p. 501 o godzinie 10.45. Pan Łukasz jest pracownikiem firmy Pirios S.A. Zapraszamy.
22 gru 2011
O nas na stronie głównej AGH
"Dynamiczny rozwój branży IT już od wielu lat kreśli kierunek rozwoju instytucji, przedsiębiorstw, a nawet całych gałęzi przemysłu. W tej dziedzinie to, co jeszcze wczoraj nie było możliwe, jutro stanie się faktem. Bogactwo pomysłów i rozwiązań jest wprost niewyobrażalne. Dowodem na to, a zarazem kolejną cegiełką w rozwoju technologii informatycznych, jest urządzenie opracowane przez naukowców z Akademii Górniczo-Hutniczej, które możemy określić jako słuchającego wirtualnego doradcę. Nowatorstwo pomysłu polega na opracowaniu programu umożliwiającego rozmowę z komputerem w języku polskim. [...]"- Ilona Trębacz, Biuletyn AGH
2 gru 2011
Przetwarzanie mowy
Właśnie odebraliśmy pierwsze egzemplarze naszej monografii "Przetwarzanie mowy" opublikowanej przez Wydawnictwa AGH.
Monografia poświęcona jest technologiom mowy ze szczególnym uwzględnieniem języka polskiego. Opisuje historię badań i rozwoju w dziedzinie przetwarzania mowy. Przedstawia liczne aspekty teorii sygnałów jednowymiarowych, zarówno analogowych jak i cyfrowych. Prezentuje zagadnienia filtracji, analizy częstotliwościowej i teorii falek. Opisano również metody parametryzacji, segmentacji i odszumiania sygnału mowy. Zobrazowano sposoby kompresji i standardowe techniki kodowania sygnału mowy w telekomunikacji. Przedstawiono metody klasyfikacji i modele stosowane w rozpoznawaniu mowy i mówców, w tym modele językowe. Omówione zostały zarówno standardowe rozwiązania, takie jak niejawne modele Markowa czy n-gramy, jak i te mniej znane, zwłaszcza powiązane z badaniami prowadzonymi przez autorów i ich współpracowników. Krótko scharakteryzowano inne technologie mowy, takie jak synteza mowy, systemy dialogowe czy rozpoznawanie emocji w sygnale mowy. Dokonano podsumowania osiągnięć i dostępnych zasobów akademickich i komercyjnych, szczególnie dla technologii mowy polskiej.
Streszczenie, spis treści i pierwszy rozdział są dostępne w pdfie.
Monografia poświęcona jest technologiom mowy ze szczególnym uwzględnieniem języka polskiego. Opisuje historię badań i rozwoju w dziedzinie przetwarzania mowy. Przedstawia liczne aspekty teorii sygnałów jednowymiarowych, zarówno analogowych jak i cyfrowych. Prezentuje zagadnienia filtracji, analizy częstotliwościowej i teorii falek. Opisano również metody parametryzacji, segmentacji i odszumiania sygnału mowy. Zobrazowano sposoby kompresji i standardowe techniki kodowania sygnału mowy w telekomunikacji. Przedstawiono metody klasyfikacji i modele stosowane w rozpoznawaniu mowy i mówców, w tym modele językowe. Omówione zostały zarówno standardowe rozwiązania, takie jak niejawne modele Markowa czy n-gramy, jak i te mniej znane, zwłaszcza powiązane z badaniami prowadzonymi przez autorów i ich współpracowników. Krótko scharakteryzowano inne technologie mowy, takie jak synteza mowy, systemy dialogowe czy rozpoznawanie emocji w sygnale mowy. Dokonano podsumowania osiągnięć i dostępnych zasobów akademickich i komercyjnych, szczególnie dla technologii mowy polskiej.
Streszczenie, spis treści i pierwszy rozdział są dostępne w pdfie.
28 lis 2011
I miejsce AGH w rankingu „Kuźnia prezesów”!
AGH odniosło wielki sukces wyprzedzając Politechnikę Warszawską i zajmując pierwsze miejsce w kluczowym i najbardziej przejrzystym rankingu oceniającym losy absolwentów "Kuźnia prezesów" Rzeczpospolitej.
21 lis 2011
Audiowizualny korpus mowy
Wykonaliśmy audiowizualny korpus mowy polskiej. Wszelkie znaki na niebie i w internecie pokazują, ze jest to pierwszy taki korpus, w sensie pierwszy dla naszego języka. Szczegóły na stronie Zespołu.
17 paź 2011
LTC 2011 w Poznaniu
Nasz artykuł "Impact of choice of training data and patterns reduction in speaker dependent speech recognition" został przyjęty na 5th Language & Technology Conference w Poznaniu. Praca prezentuje wyniku eksperymentów wykorzystania różnych baz wzorców akustycznych w rozpoznawaniu mowy.
Subskrybuj:
Posty (Atom)