16 mar 2010

Konferencje na temat mowy i języka

13th International Conference on Text, Speech and Dialogue September 6-10 Brno 15,22.III http://www.tsdconference.org/tsd2010/conf_dates.html

2010 International Conference on Audio, Language and Image Processing 23-25.Nov Shanghai 31.III http://www.icalip2010.cn/
SIPS IEEE Workshop on Signal Processing Systems 10.VI
San Francisco 31.III http://www.sips2010.org/

7th International Conference on
Natural Language Processing August 16-18 Reykjavik 12.IV http://icetal.ru.is/

IASTED on Computational Intelligence ~CI 2010~ August 23 – 25 Maui, Hawaii
1.IV http://www.iasted.org/conferences/cfp-711.html

10. Conference on Natural Language Processing September 6-8 Saarbrücken 23.IV http://www.konvens2010.de/home_en.html

Interspeech 26-30.09 Makuhari, Japonia 30.IV 2.VII http://www.interspeech2010.org/

Fourth IEEE International Conference on Semantic Computing September 22-24 Pittsburgh 3.V http://www.ieee-icsc.org/

CLA'10-NL1 :: Computational Linguistics - Applications (CLA'10) October 18-20 Wisła 31.05 http://www.imcsit.org/pg/289/231

ICASSP 2011-05-22 Praga www.icassp2011.com/

10 mar 2010

Ekstrakcja mowy z zagłuszonego sygnału przy użyciu filtrów Wienera

Nasz artykuł "Wiener Filtration for Speech Extraction from the Intentionally Corrupted
Signals" został przyjęty na konferencję IEEE International Symposium on Industrial Electronics (ISIE-2010).

Artykuł opisuje nasze metody i eksperymenty w zakresie stosowania filtrów Wienera do odzyskiwania mowy naumyślnie zagłuszonej na przykład przez radio z muzyką. Metoda zakłada użycie 2 mikrofonów i wykorzystanie różnic w sygnałach w nich wykrywanych.

Analiza skupień i redukcja wymiarowości w hierarchicznym modelu korpusowym

Nasz artykuł "Analiza skupień i redukcja wymiarowości w hierarchicznym modelu korpusowym" został przyjęty na konferencje Bazy danych: Aplikacje i Systemy 2010.

Automatyczna klasyfikacja tekstu pisanego znajduje szerokie zastosowanie w systemach informacyjnych, między innymi w filtrach e-mail, eksploracji danych (ang. data mining ) oraz korekcie tekstu. W tej pracy opisujemy system bazodanowy, który słauży pomiarowi stopnia dopasowania hipotez wypowiedzi w systemie automatycznego rozpoznawania mowy. Wypowiedzi są porównywane do tekstów zgromadzonych w hierarchicznie uporządkowanym korpusie.
Model języka polskiego, jaki przyjęliśmy w analizach, jest modelem przestrzeni wektorowej (ang. vector space model ). Każdy dokument pochodzący z korpusu jest traktowany jak wektor należący do przestrzeni wektorowej, co pozwala na zastosowanie metod algebry liniowej na korpusie tekstu jako całości.
W pracy posługujemy się bazami tekstu o rozmiarach rzędu kilku gigabajtów, dlatego przedstawiamy metody o liniowej złożoności czasowej względem rozmiaru korpusu i prezentujemy użycie relacyjnej plikowej bazy danych typu sqlite3 do przechowywania i przeszukiwania danych.