google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

23 wrz 2010

IEEE ICSC

IEEE International Conference on Semantic Computing organizowana na Carnegie Mellon University w Pittsburghu wyróżnia się wśród innych konferencji na których byłem. Jest dużo uczestników z firm. Jest dużo "niestandardowych" punktów programu takich jak demonstracje działających systemów czy prezentacje laboratoriów uniwersytetu. Dość specyficzne jest także to, że trwa około 12 godzin dziennie. Nie łatwo jest temu podołać.

28 lip 2010

CLA IMCSIT

Nasz artykuł "Polish Phones Statistics" został przyjęty na Computational Linguistics – Applications (CLA'10) w ramach International Multiconference on Computer Science and Information Technology w Wiśle.

Artykuł opisuje statystyki fonemów, bifonów i trifonów, uwzględniając połączenia między wyrazowe, ponieważ spacja nie została włączona do słowniaka możliwych fonemów. Wyniki są opracowane na podstawie przeanalizowania tekstów z 267 000 000 słowami. Zostały również porównane do wyników profesora Jassema opublikowanych kilka dzięsięcioleci temu na podstawie niewielkiej liczby trankrypcji audycji radiowych.

19 lip 2010

Oblężenie na AGH

"Podczas tegorocznej rekrutacji chęć studiowania na Akademii Górniczo-Hutniczej zgłosiło ponad 15,5 tys. maturzystów. To o prawie 4 tys. więcej niż przed rokiem. Uczelnia obsadziła wszystkie przygotowane miejsca. UJ, na którym wolne miejsca jeszcze zostały, ogłosił już drugi nabór.

[...]

Na Akademii największą popularnością cieszyły się: budownictwo (8,4 osoby na jedno miejsce), geodezja i kartografia (7,8), kulturoznawstwo (6,4), socjologia (6) oraz mniej znane kierunki, jak inżynieria akustyczna (5,2), inżynieria biomedyczna (4,8), zarządzanie (4,5) oraz turystyka i rekreacja, gdzie na jedno miejsce było prawie 4 chętnych.
[...]
"


- Aneta Zadroga, Gazeta Wyborcza Kraków

Informacje zamieszczone w gazecie nie oddają jednak poprawnie jak trudno było dostać się na poszczególne kierunki dlatego podaję progi punktowe wybranych kierunków na AGH w 2010 (7 najwyższych, Elektronikę i Telekomunikację oraz 2 wymienione w artykule jako cieszące się największą popularnością):

1. Automatyka i Robotyka, inż. (EAIiE) 909
2. Informatyka, inż.(EAIiE) 865
Informatyka Stosowana, (EAIiE) inż. 865
3. Inżynieria Akustyczna, inż. 851
4. Budownictwo, inż. 846
5. Inżynieria Biomedyczna, inż. 830
Geodezja i Kartografia, inż. 830
[...]
Elektronika i Telekomunikacja, inż. 708
Turystyka i Rekreacja, lic. 652
Kulturoznawstwo, lic. 625

9 lip 2010

2nd IEEE/IET International Conference on Audio, Language and Image Processing

Nasz artykuł "SPEECH MODELLING USING PHONEME SEGMENTATION AND MODIFIED WEIGHTED
LEVENSHTEIN DISTANCE" został przyjęty do prezentacji na The 2nd IEEE/IET International Conference on Audio, Language and Image Processing, będącej jedną z największych konferencji wyspecjalizowanych w przetwarzaniu mowy i języka. Praca opisuję naszą najskuteczniejszą metodę modelowania akustycznego umożliwiającą generowanie listy hipotez słów na podstawie porównywania parametrów sygnału mowy z bazą wzorców głosek. Metoda opiera się o metrykę edycyjną (Levenshteina). Modyfikacja polega na precyzyjniejszej ocenie podstawień zależnie od różnic między oczekiwanym fonemem a zaobserwowanymi parametrami.

Interspeech 2010

Naszym dużym sukcesem było przyjęcie artykułu "Perceptual Wavelet Decomposition for Speech Segmentation" na Interspeech 2010, ponieważ jest to najbardziej ceniona konferencja w dziedzinie przetwarzania języka mówionego na świecie. Prawie połowa nadesłanych prac została odrzucona. Artykuł opisuje modyfikację transformaty falkowej dostosowującą ją do lepszego scharakteryzowania sygnału mowy i umożliwiając trafniejszą segmentację.

The 4th International Conference on Multimedia and Ubiquitous Engineering (MUE 2010)

Nasz artykuł "Polish n-grams and their correction process" został przyjęty na konferencję The 4th International Conference on Multimedia and Ubiquitous Engineering (MUE 2010). Artykuł opisuje zebrane przez nas statystyki n-gramowe języka polskiego wraz z oprogramowaniem utworzonym do ich półautomatycznego poprawiania.

Fourth IEEE International Conference on Semantic Computing

Nasza propozycja dema systemu rozpoznawania mowy została przyjęta na Fourth IEEE International Conference on Semantic Computing w Pitsburgu, USA. W materiałach konferencyjnych zostanie również opublikowany artykuł "Automatic Speech Recognition System Based on Wavelet Analysis". Zaprezentujemy najnowszą wersję systemu AGH ASR. Będzie ona zawierała między innymi 3 metody modelowania akustycznego, konstruowanie zdań, modelowanie 1 i 2 gramami oraz analizą semantyczną.