29 sie 2013

Nasza konferencja uzyskała patronat IEEE

Informacje o Pacific Voice Conference w Krakowie na stronie IEEE.

Pełne publikacje mają również ukazać się w zasobach IEEE.


Książki z Teorii Sygnałów

Dostępnych jest wiele podręczników akademickich związanych tematycznie z przetwarzaniem sygnałów:

  • R. G. Lyons, Wprowadzenie do cyfrowego przetwarzania sygnałów. Warszawa: WK, 2000.
  • J. Szabatin, Podstawy teorii sygnałów. Warszawa: WK, 2000.
  • T. P. Zieliński, Cyfrowe przetwarzanie sygnałów Warszawa: Wydawnictwa Komunikacji i Ła¸czności, 2009.

Książka B. i M. Ziółko, "Przetwarzanie mowy" przedstawia jedynie wybrane fragmenty teorii sygnałów mające największe znaczenie w inżynieryjskiej praktyce technologii mowy. Te najważniejsze zagadnienia to przede wszystkim analiza częstotliwościowa mowy i filtracja sygnałów mowy. Prezentacja tych zagadnień wymaga posługiwania się matematycznymi modelami mowy i filtrów.

www.dsp.agh.edu.pl

23 sie 2013

Stypendia w Tajlandii

"Uniwersytet King Mongkut’s University of Technology North Bangkok informuje o możliwości ubiegania się przez polskich studentów o stypendium na studiach magisterskich z dziedziny IT.

Stypendium może otrzymać 6 studentów rokrocznie. Obejmie ono koszty kształcenia przez okres 2 lat, dodatkowo kwota w wysokości 6 tys. bahtów tajskich miesięcznie przeznaczona jest na wykorzystanie na pomoce badawcze oraz dydaktyczne.

Zachęcamy do zapoznania się ze stroną internetową www.it-admission.com oraz do bezpośredniego kontaktu mailowego pod adresem: sirapatb@kmutnb.ac.th oraz garys@kmutnb.ac.th."

7 sie 2013

Komputer rozumie odgłosy paszczą - Bloomberg

"Przyszłość technologii rozpoznawania mowy to nie tylko wirtualne asystentki w rodzaju Siri. To także infolinie, zapisywanie na żywo dialogów i danych oraz… narzędzia do podsłuchów. [...]

– Jeżeli system ma rozpoznawać jedno z trzydziestu słów, to zadanie jest znacznie łatwiejsze niż, gdy jest ich około miliona, czyli tyle ile mniej więcej zawiera cały słownik języka polskiego – mówi dr inż. Bartosz Ziółko z Akademii Górniczo-Hutniczej w Krakowie, gdzie trwają prace m.in. nad systemem rozpoznawania mowy polskiej SARMATA. – System korzystający ze słownika o ograniczonej, niedużej liczbie słów osiąga nawet 100 proc. bezbłędnego rozpoznania, ale jeśli damy większy słownik i nagrania będą mową codzienną, to jego skuteczność może spaść do zera – dodaje ekspert. [...]

– Spodziewam się, że w ciągu najbliższych 5 lat możliwe będzie sterowanie komputerami osobistymi za pomocą głosu – mówi dr Ziółko.""

- Jarosław Marczuk

Całość na Bloomberg

Korpus polskiego języka migowego

"Ponad 300 godzin nagrań i 200 tys. opisanych znaków języka migowego znajduje się w opracowywanym od trzech lat, na Uniwersytecie Warszawskim korpusie polskiego języka migowego (PJM). Już teraz jest on największym zbiorem danych o języku migowym na świecie.

Korpus językowy to zbiór danych tekstowych dostępnych w formie elektronicznej, stanowiący materiał do badań nad językiem. Naukowcy pracujący nad korpusem PJM najpierw nagrywają zamigane rozmowy i wypowiedzi osób głuchych, a potem te nagrania analizują i opisują użyte znaki i konstrukcje gramatyczne.

„Obecnie mamy nagranych prawie 80 głuchych użytkowników PJM. W sumie to ponad 300 godzin nagrań. Zbiór wyodrębnionych i sklasyfikowanych elementów liczy już około 200 tys. Pod tym względem mamy teraz największy korpus języka migowego na świecie” – powiedział PAP kierujący pracami dr Paweł Rutkowski z Pracowni Lingwistyki Migowej Uniwersytetu Warszawskiego."

- Ewelina Krajczyńska

Więcej na PAP

5 sie 2013

Badania nad wirtualnym tłumaczem języka migowego

"Wirtualny tłumacz języka migowego mógłby znacznie uprościć komunikację z osobami niemymi. Aby jednak taki system mógł powstać, trzeba m.in. zgromadzić ogromny zasób danych i zaprojektować odpowiednie algorytmy - opowiada dr inż. Jakub Gałka z Akademii Górniczo-Hutniczej w Krakowie.

Projekt "Wirtualny tłumacz komunikacji migowej" AGH oraz firmy Unico Software rozpocznie się jesienią tego roku i finansowany będzie w ramach Programu Badań Stosowanych Narodowego Centrum Badań i Rozwoju (NCBR).

"Będziemy badać, jakie technologie można zastosować w takim wirtualnym tłumaczu. Chcemy opracować m.in. metody pozyskiwania, przetwarzania i interpretowania obrazu wideo czy sygnału dźwiękowego" - mówi w rozmowie z PAP kierownik projektu, dr inż. Jakub Gałka z Wydziału Informatyki, Elektroniki i Telekomunikacji AGH w Krakowie."

- Ludwika Tomala, PAP