28 lip 2010

CLA IMCSIT

Nasz artykuł "Polish Phones Statistics" został przyjęty na Computational Linguistics – Applications (CLA'10) w ramach International Multiconference on Computer Science and Information Technology w Wiśle.

Artykuł opisuje statystyki fonemów, bifonów i trifonów, uwzględniając połączenia między wyrazowe, ponieważ spacja nie została włączona do słowniaka możliwych fonemów. Wyniki są opracowane na podstawie przeanalizowania tekstów z 267 000 000 słowami. Zostały również porównane do wyników profesora Jassema opublikowanych kilka dzięsięcioleci temu na podstawie niewielkiej liczby trankrypcji audycji radiowych.

19 lip 2010

Oblężenie na AGH

"Podczas tegorocznej rekrutacji chęć studiowania na Akademii Górniczo-Hutniczej zgłosiło ponad 15,5 tys. maturzystów. To o prawie 4 tys. więcej niż przed rokiem. Uczelnia obsadziła wszystkie przygotowane miejsca. UJ, na którym wolne miejsca jeszcze zostały, ogłosił już drugi nabór.

[...]

Na Akademii największą popularnością cieszyły się: budownictwo (8,4 osoby na jedno miejsce), geodezja i kartografia (7,8), kulturoznawstwo (6,4), socjologia (6) oraz mniej znane kierunki, jak inżynieria akustyczna (5,2), inżynieria biomedyczna (4,8), zarządzanie (4,5) oraz turystyka i rekreacja, gdzie na jedno miejsce było prawie 4 chętnych.
[...]
"


- Aneta Zadroga, Gazeta Wyborcza Kraków

Informacje zamieszczone w gazecie nie oddają jednak poprawnie jak trudno było dostać się na poszczególne kierunki dlatego podaję progi punktowe wybranych kierunków na AGH w 2010 (7 najwyższych, Elektronikę i Telekomunikację oraz 2 wymienione w artykule jako cieszące się największą popularnością):

1. Automatyka i Robotyka, inż. (EAIiE) 909
2. Informatyka, inż.(EAIiE) 865
Informatyka Stosowana, (EAIiE) inż. 865
3. Inżynieria Akustyczna, inż. 851
4. Budownictwo, inż. 846
5. Inżynieria Biomedyczna, inż. 830
Geodezja i Kartografia, inż. 830
[...]
Elektronika i Telekomunikacja, inż. 708
Turystyka i Rekreacja, lic. 652
Kulturoznawstwo, lic. 625

9 lip 2010

2nd IEEE/IET International Conference on Audio, Language and Image Processing

Nasz artykuł "SPEECH MODELLING USING PHONEME SEGMENTATION AND MODIFIED WEIGHTED
LEVENSHTEIN DISTANCE" został przyjęty do prezentacji na The 2nd IEEE/IET International Conference on Audio, Language and Image Processing, będącej jedną z największych konferencji wyspecjalizowanych w przetwarzaniu mowy i języka. Praca opisuję naszą najskuteczniejszą metodę modelowania akustycznego umożliwiającą generowanie listy hipotez słów na podstawie porównywania parametrów sygnału mowy z bazą wzorców głosek. Metoda opiera się o metrykę edycyjną (Levenshteina). Modyfikacja polega na precyzyjniejszej ocenie podstawień zależnie od różnic między oczekiwanym fonemem a zaobserwowanymi parametrami.

Interspeech 2010

Naszym dużym sukcesem było przyjęcie artykułu "Perceptual Wavelet Decomposition for Speech Segmentation" na Interspeech 2010, ponieważ jest to najbardziej ceniona konferencja w dziedzinie przetwarzania języka mówionego na świecie. Prawie połowa nadesłanych prac została odrzucona. Artykuł opisuje modyfikację transformaty falkowej dostosowującą ją do lepszego scharakteryzowania sygnału mowy i umożliwiając trafniejszą segmentację.

The 4th International Conference on Multimedia and Ubiquitous Engineering (MUE 2010)

Nasz artykuł "Polish n-grams and their correction process" został przyjęty na konferencję The 4th International Conference on Multimedia and Ubiquitous Engineering (MUE 2010). Artykuł opisuje zebrane przez nas statystyki n-gramowe języka polskiego wraz z oprogramowaniem utworzonym do ich półautomatycznego poprawiania.

Fourth IEEE International Conference on Semantic Computing

Nasza propozycja dema systemu rozpoznawania mowy została przyjęta na Fourth IEEE International Conference on Semantic Computing w Pitsburgu, USA. W materiałach konferencyjnych zostanie również opublikowany artykuł "Automatic Speech Recognition System Based on Wavelet Analysis". Zaprezentujemy najnowszą wersję systemu AGH ASR. Będzie ona zawierała między innymi 3 metody modelowania akustycznego, konstruowanie zdań, modelowanie 1 i 2 gramami oraz analizą semantyczną.

2 lip 2010

Oferta pracy z Zespole Inżynierii Lingwistycznej IPI PAN

Zespół Inżynierii Lingwistycznej w Instytucie Podstaw Informatyki PAN
poszukuje osób do współpracy w kilku prowadzonych przez nas projektach
związanych z różnymi poziomami lingwistycznego znakowania tekstu.

Praca polega na weryfikacji poprawności, uzupełnieniu i modyfikacji
informacji wprowadzonej metodami automatycznymi. Jest to np.:

• „głęboki” opis składniowy w formie drzew składników bezpośrednich
(selekcja spośród automatycznie generowanych drzew),

• „płytki” opis w formie grup składniowych,

• ujednoznacznianie sensów słów na podstawie kontekstu,

• znakowanie nazw własnych i jednostek wieloczłonowych (za pomocą
graficznego edytora struktur drzewiastych).

Prace, w zależności od projektu, będą się odbywać w najbliższych kilku
do kilkunastu miesiącach.

lkobylinski na serwerze ipipan.waw.pl.