Nasz artykuł "Wiener Filtration for Speech Extraction from the Intentionally Corrupted
Signals" został przyjęty na konferencję IEEE International Symposium on Industrial Electronics (ISIE-2010).
Artykuł opisuje nasze metody i eksperymenty w zakresie stosowania filtrów Wienera do odzyskiwania mowy naumyślnie zagłuszonej na przykład przez radio z muzyką. Metoda zakłada użycie 2 mikrofonów i wykorzystanie różnic w sygnałach w nich wykrywanych.
google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0
10 mar 2010
Analiza skupień i redukcja wymiarowości w hierarchicznym modelu korpusowym
Nasz artykuł "Analiza skupień i redukcja wymiarowości w hierarchicznym modelu korpusowym" został przyjęty na konferencje Bazy danych: Aplikacje i Systemy 2010.
Automatyczna klasyfikacja tekstu pisanego znajduje szerokie zastosowanie w systemach informacyjnych, między innymi w filtrach e-mail, eksploracji danych (ang. data mining ) oraz korekcie tekstu. W tej pracy opisujemy system bazodanowy, który słauży pomiarowi stopnia dopasowania hipotez wypowiedzi w systemie automatycznego rozpoznawania mowy. Wypowiedzi są porównywane do tekstów zgromadzonych w hierarchicznie uporządkowanym korpusie.
Model języka polskiego, jaki przyjęliśmy w analizach, jest modelem przestrzeni wektorowej (ang. vector space model ). Każdy dokument pochodzący z korpusu jest traktowany jak wektor należący do przestrzeni wektorowej, co pozwala na zastosowanie metod algebry liniowej na korpusie tekstu jako całości.
W pracy posługujemy się bazami tekstu o rozmiarach rzędu kilku gigabajtów, dlatego przedstawiamy metody o liniowej złożoności czasowej względem rozmiaru korpusu i prezentujemy użycie relacyjnej plikowej bazy danych typu sqlite3 do przechowywania i przeszukiwania danych.
Automatyczna klasyfikacja tekstu pisanego znajduje szerokie zastosowanie w systemach informacyjnych, między innymi w filtrach e-mail, eksploracji danych (ang. data mining ) oraz korekcie tekstu. W tej pracy opisujemy system bazodanowy, który słauży pomiarowi stopnia dopasowania hipotez wypowiedzi w systemie automatycznego rozpoznawania mowy. Wypowiedzi są porównywane do tekstów zgromadzonych w hierarchicznie uporządkowanym korpusie.
Model języka polskiego, jaki przyjęliśmy w analizach, jest modelem przestrzeni wektorowej (ang. vector space model ). Każdy dokument pochodzący z korpusu jest traktowany jak wektor należący do przestrzeni wektorowej, co pozwala na zastosowanie metod algebry liniowej na korpusie tekstu jako całości.
W pracy posługujemy się bazami tekstu o rozmiarach rzędu kilku gigabajtów, dlatego przedstawiamy metody o liniowej złożoności czasowej względem rozmiaru korpusu i prezentujemy użycie relacyjnej plikowej bazy danych typu sqlite3 do przechowywania i przeszukiwania danych.
22 lut 2010
Ankieta: 77 proc. absolwentów AGH z 2008 r. znalazło pracę
"Ponad trzy czwarte (77 proc.) absolwentów Akademii Górniczo-Hutniczej w Krakowie z 2008 roku znalazło już zatrudnienie - 80 proc. z nich pracuje w zawodzie zgodnym z wykształceniem, a niemal 90 proc. deklaruje, że w swojej pracy korzysta z wiedzy uzyskanej na studiach - wynika z badań "Losy zawodowe absolwentów AGH - rocznik 2008"."
PAP - Nauka w Polsce agt/kap/
19 lut 2010
Zdjęcia z ceremonii wręczenia dyplomów - York 2010
Ceremonie w Anglii są zawsze bardzo uroczyste i dumne. Tak i było z wręczeniem dyplomu doktora. Poniżej w stroju doktora. Kolor szarfy oznacza dziedzinę, a kształt czapki uzyskany tytuł.
Główna ceremonia
Uścisk rektora, po prawej profesor informatyki wywołujący dyplomantów ze swojego wydziału.
Uroczystość na wydziale
Zdjęcie z jednym z moich promotorów
Główna ceremonia
Uścisk rektora, po prawej profesor informatyki wywołujący dyplomantów ze swojego wydziału.
Uroczystość na wydziale
Zdjęcie z jednym z moich promotorów
15 lut 2010
Nasz artykuł "Evaluation of Errors in Polish Phones Segmentation for Different Types of Transitions" został przyjęty na konferencji MELECON. Artykuł opisuje skuteczność segmentacji mowy na fonemy w zależności od rozdzielanej pary. Najłatwiejsze w wykryciu są granice miedzy dwoma głoskami zwartymi(/p/, /b/, /t/, /d/, /k/, /g/), a najtrudniejsze między samogłoskami ustnymi (/i/, /y/, /e/, /a/, /o/, /u/), a samogłoskami nosowymi (/ę/, /ą/).
5 lut 2010
Rozpoznawanie myśli
"Przez pięć lat uważano, że znajduje się w stanie wegetatywnym. 29-letni mężczyzna okazał się jednak być świadomy i komunikuje się za pomocą myśli. [...]
Naukowcy z Wielkiej Brytanii i Belgii za pomocą funkcjonalnego rezonansu magnetycznego zbadali mózg mężczyzny, który uległ w 2003 roku wypadkowi. Seria testów ujawniła, że sparaliżowany i pozbawiony świadomości (przynajmniej tak sądzono) jest w stanie udzielać myślami odpowiedzi "tak" i "nie" na pytania (m.in. czy twój ojciec ma na imię Thomas")."
- tvn24
29 sty 2010
Konferencja KU KDM'10
Nasz artykuł na temat obliczeń prowadzonych na superkomputerach został przyjęty na konferencję KU KDM'10.
Subskrybuj:
Posty (Atom)