Nasz artykuł "Polish Phones Statistics" został przyjęty na Computational Linguistics – Applications (CLA'10) w ramach International Multiconference on Computer Science and Information Technology w Wiśle.
Artykuł opisuje statystyki fonemów, bifonów i trifonów, uwzględniając połączenia między wyrazowe, ponieważ spacja nie została włączona do słowniaka możliwych fonemów. Wyniki są opracowane na podstawie przeanalizowania tekstów z 267 000 000 słowami. Zostały również porównane do wyników profesora Jassema opublikowanych kilka dzięsięcioleci temu na podstawie niewielkiej liczby trankrypcji audycji radiowych.
google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0
28 lip 2010
19 lip 2010
Oblężenie na AGH
"Podczas tegorocznej rekrutacji chęć studiowania na Akademii Górniczo-Hutniczej zgłosiło ponad 15,5 tys. maturzystów. To o prawie 4 tys. więcej niż przed rokiem. Uczelnia obsadziła wszystkie przygotowane miejsca. UJ, na którym wolne miejsca jeszcze zostały, ogłosił już drugi nabór.
[...]
Na Akademii największą popularnością cieszyły się: budownictwo (8,4 osoby na jedno miejsce), geodezja i kartografia (7,8), kulturoznawstwo (6,4), socjologia (6) oraz mniej znane kierunki, jak inżynieria akustyczna (5,2), inżynieria biomedyczna (4,8), zarządzanie (4,5) oraz turystyka i rekreacja, gdzie na jedno miejsce było prawie 4 chętnych.
[...]
"
- Aneta Zadroga, Gazeta Wyborcza Kraków
Informacje zamieszczone w gazecie nie oddają jednak poprawnie jak trudno było dostać się na poszczególne kierunki dlatego podaję progi punktowe wybranych kierunków na AGH w 2010 (7 najwyższych, Elektronikę i Telekomunikację oraz 2 wymienione w artykule jako cieszące się największą popularnością):
1. Automatyka i Robotyka, inż. (EAIiE) 909
2. Informatyka, inż.(EAIiE) 865
Informatyka Stosowana, (EAIiE) inż. 865
3. Inżynieria Akustyczna, inż. 851
4. Budownictwo, inż. 846
5. Inżynieria Biomedyczna, inż. 830
Geodezja i Kartografia, inż. 830
[...]
Elektronika i Telekomunikacja, inż. 708
Turystyka i Rekreacja, lic. 652
Kulturoznawstwo, lic. 625
9 lip 2010
2nd IEEE/IET International Conference on Audio, Language and Image Processing
Nasz artykuł "SPEECH MODELLING USING PHONEME SEGMENTATION AND MODIFIED WEIGHTED
LEVENSHTEIN DISTANCE" został przyjęty do prezentacji na The 2nd IEEE/IET International Conference on Audio, Language and Image Processing, będącej jedną z największych konferencji wyspecjalizowanych w przetwarzaniu mowy i języka. Praca opisuję naszą najskuteczniejszą metodę modelowania akustycznego umożliwiającą generowanie listy hipotez słów na podstawie porównywania parametrów sygnału mowy z bazą wzorców głosek. Metoda opiera się o metrykę edycyjną (Levenshteina). Modyfikacja polega na precyzyjniejszej ocenie podstawień zależnie od różnic między oczekiwanym fonemem a zaobserwowanymi parametrami.
LEVENSHTEIN DISTANCE" został przyjęty do prezentacji na The 2nd IEEE/IET International Conference on Audio, Language and Image Processing, będącej jedną z największych konferencji wyspecjalizowanych w przetwarzaniu mowy i języka. Praca opisuję naszą najskuteczniejszą metodę modelowania akustycznego umożliwiającą generowanie listy hipotez słów na podstawie porównywania parametrów sygnału mowy z bazą wzorców głosek. Metoda opiera się o metrykę edycyjną (Levenshteina). Modyfikacja polega na precyzyjniejszej ocenie podstawień zależnie od różnic między oczekiwanym fonemem a zaobserwowanymi parametrami.
Interspeech 2010
Naszym dużym sukcesem było przyjęcie artykułu "Perceptual Wavelet Decomposition for Speech Segmentation" na Interspeech 2010, ponieważ jest to najbardziej ceniona konferencja w dziedzinie przetwarzania języka mówionego na świecie. Prawie połowa nadesłanych prac została odrzucona. Artykuł opisuje modyfikację transformaty falkowej dostosowującą ją do lepszego scharakteryzowania sygnału mowy i umożliwiając trafniejszą segmentację.
The 4th International Conference on Multimedia and Ubiquitous Engineering (MUE 2010)
Nasz artykuł "Polish n-grams and their correction process" został przyjęty na konferencję The 4th International Conference on Multimedia and Ubiquitous Engineering (MUE 2010). Artykuł opisuje zebrane przez nas statystyki n-gramowe języka polskiego wraz z oprogramowaniem utworzonym do ich półautomatycznego poprawiania.
Fourth IEEE International Conference on Semantic Computing
Nasza propozycja dema systemu rozpoznawania mowy została przyjęta na Fourth IEEE International Conference on Semantic Computing w Pitsburgu, USA. W materiałach konferencyjnych zostanie również opublikowany artykuł "Automatic Speech Recognition System Based on Wavelet Analysis". Zaprezentujemy najnowszą wersję systemu AGH ASR. Będzie ona zawierała między innymi 3 metody modelowania akustycznego, konstruowanie zdań, modelowanie 1 i 2 gramami oraz analizą semantyczną.
2 lip 2010
Oferta pracy z Zespole Inżynierii Lingwistycznej IPI PAN
Zespół Inżynierii Lingwistycznej w Instytucie Podstaw Informatyki PAN
poszukuje osób do współpracy w kilku prowadzonych przez nas projektach
związanych z różnymi poziomami lingwistycznego znakowania tekstu.
Praca polega na weryfikacji poprawności, uzupełnieniu i modyfikacji
informacji wprowadzonej metodami automatycznymi. Jest to np.:
• „głęboki” opis składniowy w formie drzew składników bezpośrednich
(selekcja spośród automatycznie generowanych drzew),
• „płytki” opis w formie grup składniowych,
• ujednoznacznianie sensów słów na podstawie kontekstu,
• znakowanie nazw własnych i jednostek wieloczłonowych (za pomocą
graficznego edytora struktur drzewiastych).
Prace, w zależności od projektu, będą się odbywać w najbliższych kilku
do kilkunastu miesiącach.
lkobylinski na serwerze ipipan.waw.pl.
poszukuje osób do współpracy w kilku prowadzonych przez nas projektach
związanych z różnymi poziomami lingwistycznego znakowania tekstu.
Praca polega na weryfikacji poprawności, uzupełnieniu i modyfikacji
informacji wprowadzonej metodami automatycznymi. Jest to np.:
• „głęboki” opis składniowy w formie drzew składników bezpośrednich
(selekcja spośród automatycznie generowanych drzew),
• „płytki” opis w formie grup składniowych,
• ujednoznacznianie sensów słów na podstawie kontekstu,
• znakowanie nazw własnych i jednostek wieloczłonowych (za pomocą
graficznego edytora struktur drzewiastych).
Prace, w zależności od projektu, będą się odbywać w najbliższych kilku
do kilkunastu miesiącach.
lkobylinski na serwerze ipipan.waw.pl.
Subskrybuj:
Posty (Atom)