google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

10 mar 2010

Analiza skupień i redukcja wymiarowości w hierarchicznym modelu korpusowym

Nasz artykuł "Analiza skupień i redukcja wymiarowości w hierarchicznym modelu korpusowym" został przyjęty na konferencje Bazy danych: Aplikacje i Systemy 2010.

Automatyczna klasyfikacja tekstu pisanego znajduje szerokie zastosowanie w systemach informacyjnych, między innymi w filtrach e-mail, eksploracji danych (ang. data mining ) oraz korekcie tekstu. W tej pracy opisujemy system bazodanowy, który słauży pomiarowi stopnia dopasowania hipotez wypowiedzi w systemie automatycznego rozpoznawania mowy. Wypowiedzi są porównywane do tekstów zgromadzonych w hierarchicznie uporządkowanym korpusie.
Model języka polskiego, jaki przyjęliśmy w analizach, jest modelem przestrzeni wektorowej (ang. vector space model ). Każdy dokument pochodzący z korpusu jest traktowany jak wektor należący do przestrzeni wektorowej, co pozwala na zastosowanie metod algebry liniowej na korpusie tekstu jako całości.
W pracy posługujemy się bazami tekstu o rozmiarach rzędu kilku gigabajtów, dlatego przedstawiamy metody o liniowej złożoności czasowej względem rozmiaru korpusu i prezentujemy użycie relacyjnej plikowej bazy danych typu sqlite3 do przechowywania i przeszukiwania danych.

22 lut 2010

Ankieta: 77 proc. absolwentów AGH z 2008 r. znalazło pracę

"Ponad trzy czwarte (77 proc.) absolwentów Akademii Górniczo-Hutniczej w Krakowie z 2008 roku znalazło już zatrudnienie - 80 proc. z nich pracuje w zawodzie zgodnym z wykształceniem, a niemal 90 proc. deklaruje, że w swojej pracy korzysta z wiedzy uzyskanej na studiach - wynika z badań "Losy zawodowe absolwentów AGH - rocznik 2008"."


PAP - Nauka w Polsce agt/kap/

19 lut 2010

Zdjęcia z ceremonii wręczenia dyplomów - York 2010

Ceremonie w Anglii są zawsze bardzo uroczyste i dumne. Tak i było z wręczeniem dyplomu doktora. Poniżej w stroju doktora. Kolor szarfy oznacza dziedzinę, a kształt czapki uzyskany tytuł.






Główna ceremonia


Uścisk rektora, po prawej profesor informatyki wywołujący dyplomantów ze swojego wydziału.










Uroczystość na wydziale






Zdjęcie z jednym z moich promotorów








15 lut 2010

Nasz artykuł "Evaluation of Errors in Polish Phones Segmentation for Different Types of Transitions" został przyjęty na konferencji MELECON. Artykuł opisuje skuteczność segmentacji mowy na fonemy w zależności od rozdzielanej pary. Najłatwiejsze w wykryciu są granice miedzy dwoma głoskami zwartymi(/p/, /b/, /t/, /d/, /k/, /g/), a najtrudniejsze między samogłoskami ustnymi (/i/, /y/, /e/, /a/, /o/, /u/), a samogłoskami nosowymi (/ę/, /ą/).

5 lut 2010

Rozpoznawanie myśli

"Przez pięć lat uważano, że znajduje się w stanie wegetatywnym. 29-letni mężczyzna okazał się jednak być świadomy i komunikuje się za pomocą myśli. [...]

Naukowcy z Wielkiej Brytanii i Belgii za pomocą funkcjonalnego rezonansu magnetycznego zbadali mózg mężczyzny, który uległ w 2003 roku wypadkowi. Seria testów ujawniła, że sparaliżowany i pozbawiony świadomości (przynajmniej tak sądzono) jest w stanie udzielać myślami odpowiedzi "tak" i "nie" na pytania (m.in. czy twój ojciec ma na imię Thomas")."


- tvn24

29 sty 2010

27 sty 2010

Najlepszy zawód na świecie

"Zawodem o największych perspektywach jeszcze na wiele lat jest specjalista IT, i dotyczy to również Polski - powiedział Orłowski. Dodał, że przedsiębiorcy zarówno w Polsce, jak i za granicą, oczekują od rządów zmiany systemu edukacji tak, by kształcił on specjalistów od zarządzania produkcją, ograniczania ryzyka, optymalizacji zatrudnienia, inżynierów."


- tvn24