google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

3 mar 2013

Studencki Festiwal Informatyczny

14-16 marca odbędzie się na AGH Studencki Festiwal Informatyczny. Zostałem poproszony o przygotowanie jednego z wystąpień (o przetwarzaniu mowy), które odbędzie się o 10.00 14 marca w głównej sali U-2. Serdecznie zapraszam!

www.dsp.agh.edu.pl

2 mar 2013

IEEE ICME


Nasz artykuł "WAVELET METHOD FOR BREATH DETECTION IN AUDIO SIGNALS" został przyjęty na IEEE International Conference on Multimedia and Expo w San Jose w Dolinie Krzemowej. Badania były prowadzone w celu automatycznego wstawiania interpunkcji w dyktowanych tekstach przy rozpoznawaniu mowy. Jednym z kryteriów podejmowania takiej decyzji będzie opracowana metoda detekcji oddechów. Algorytm okazał się niezwykle czuły. Część odkrytych przez niego oddechów można usłyszeć dopiero po odtworzeniu wyłącznie wskazanego miejsca nagrania. Ucho ludzkie przy ciągłym sygnale okazało się mniej skuteczne niż prototyp naszego oprogramowania.


www.dsp.agh.edu.pl

1 mar 2013

Koło naukowe Spectrum

Pragniemy serdecznie zaprosić wszystkich zainteresowanych na spotkanie organizacyjne KN Spectrum, które odbędzie się w poniedziałek 04.03.2013 w sali C2/420 o godz. 16.00.

  Działalność w Uczelnianych Kołach Naukowych gwarantuje szerokie spektrum możliwości rozwoju. Jest doskonałą okazją do zdobycia dodatkowej wiedzy i umiejętności, które staną się sporym atutem na rynku pracy.

  Tematyka działalności KN Spectrum dotyczy szeroko pojętej techniki przetwarzania sygnałów, w szczególności:
   • technologii przetwarzania mowy (rozpoznawania, analizy, syntezy i biometrii głosu),
   • modelowania zjawisk akustycznych (np. na potrzeby gier komputerowych),
   • akceleracji sprzętowej przetwarzania sygnałów,
   • przetwarzania i analizy danych mulitmedialnych,
   • systemów wbudowanych.

  Koło Naukowe Spectrum dzięki wielu projektom badawczym realizowanym przez Zespół Przetwarzania Sygnałów KE AGH we współpracy z firmami, umożliwi wydajną współpracę z przemysłem i poznanie praktycznych zastosowań wiedzy zdobywanej podczas studiów.

         Serdecznie zapraszamy,
              Jakub Gałka, Mariusz Mąsior
                   www.dsp.agh.edu.pl

27 lut 2013

Artykuł o bazie różnojęzycznych fonemów

Drugi nasz artykuł przyjęty na tegoroczną konferencję BDAS to Baza danych nagrań mowy do analizy porównawczej różnojęzycznych fonemów. Artykuł prezentuje system gromadzenia, archiwizacji i akustycznej analizy wielojęzycznych próbek mowy. Głównym celem badań jest analiza porównawcza fonemów dla kilkuset języków i stworzenie drzewa genealogicznego języków świata. Opisana została implementacja systemu jako bazy danych z portalem internetowym. Przedstawiono informacje dotyczące zawartości i formy bazy, perspektyw rozwoju i zastosowań w lingwistyce komputerowej.

Portal, na którym powstaje baza jest dostępny pod adresem http://speechsamples.agh.edu.pl/.

26 lut 2013

BDAS'2013

To już czwarta z rzędu konferencja BDAS na której przyjęto nasz artykuł. Tym razem będziemy prezentować pracę "BAZA DANYCH NAGRAŃ MOWY EMOCJONALNE" podsumowującą opracowany przez nas korpus. Korpus ten jest jedynym tego typu zasobem dla języka polskiego, który jest dostępny na licencji naukowej i komercyjnej. Opisaliśmy sposób rejestracji, parametry, strukturę, metadane i licencję bazy danych. Przedstawiliśmy także przykładowe zastosowania do opracowania metod detekcji stanów emocjonalnych w głosie oraz normalizacji nagrań na potrzeby ASR.

www.dsp.agh.edu.pl

24 lut 2013

Speech samples

Uruchomiliśmy stronę poświęconą projektowi Analiza porównawcza różnojęzycznych fonemów dzięki której będzie powstawać baza próbek nagrań kilkuset języków. Strona jest ogólnodostępna i darmowa - speechsamples.agh.edu.pl