Udostępniliśmy dokumentację projektu Scarlett Mansion. Sama gra nadal znajduje się na tym samym serwerze i jest widoczna pod adresem mansion.elektro.agh.edu.pl. Zostanie tam do samego końca, najprawdopodobniej serwera, który jest jednym z najstarszych nadal działających na AGH komputerów i do tego został porzucony w pawilonie w którym dawniej mieliśmy biuro. Zdarzają mu się coraz częściej słabsze dni, kiedy nie odpowiada, ale póki co uparcie, wiernie, samoczynnie wstaje ze wsparciem kawałka kartonika, który wepchnęliśmy w klawiaturę dociskając odpowiedni klawisz potrzebny przy bootowaniu . Na nowy serwer wrzucimy raczej wersję 2.0, jeśli taka powstanie ... Wydawnictwo AGH wydało dokumentację związaną z projektem w postaci małej książki (i nie chodzi o javadoc z linku powyżej). Nie jest ona dystrybuowana, ale jeśli ktoś byłby zainteresowany egzemplarzem lub udziałem w projekcie to proszę o kontakt.
google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0
18 kwi 2013
Audycja Euranet+ na antenie Jedynki Polskiego Radia
Już wkrótce będziemy gośćmi magazynu europejskiego Euranet+ na antenie
Jedynki Polskiego Radia.
Prowadzący program to Artur Wolski. Odcinek ma być poświęcony projektom badawczym finansowanym z Unii Europejskiej, których aplikacje będą miały zastosowanie dla statystycznego Kowalskiego.
Data emisji jeszcze nie jest znana. Dowiemy się prawdopodobnie w poniedziałek, kiedy mają być zrealizowane nagrania. Przewidujemy w trakcie audycji demonstrację naszego systemu rozpoznawania mowy SARMATA. Zapraszamy!!!
Prowadzący program to Artur Wolski. Odcinek ma być poświęcony projektom badawczym finansowanym z Unii Europejskiej, których aplikacje będą miały zastosowanie dla statystycznego Kowalskiego.
Data emisji jeszcze nie jest znana. Dowiemy się prawdopodobnie w poniedziałek, kiedy mają być zrealizowane nagrania. Przewidujemy w trakcie audycji demonstrację naszego systemu rozpoznawania mowy SARMATA. Zapraszamy!!!
17 kwi 2013
Konferencja SLSP 2013
Nasz artykuł "Speech/Music Discrimination via Energy Density Analysis" został przyjęty na 1st International Conference on Statistical Language and Speech Processing która odbędzie się w Tarragonie w Hiszpanii. Artykuł opisuje metodę którą stosujemy przy wstępnej analizie nagrań w których znajduje się sygnał mowy do weryfikacji czy rzeczywiście on tam jest, a jeśli tak to czy nie jest przerywany w niektórych miejscach muzyką.
www.dsp.agh.edu.pl
www.dsp.agh.edu.pl
16 kwi 2013
Problemy Kryminalistyki
Nasz artykuł "Zastosowanie algorytmu DTW jako narzędzia w identyfikacji mówcy" został przyjęty do druku w Problemach Kryminalistyki, wydawanych przez Centralne Laboratorium Kryminalistyczne Policji.
W artykule omówiono problemy związane z identyfikacją mówcy i przedstawiono propozycję procedury ułatwiającej proces identyfikacji w części akustycznej. Koncepcja opiera się na metodach programowania dynamicznego, a w szczególności algorytmu znanego jako DTW (ang. Dynamic Time Warping). Przeprowadzone zostały testy, wskazujące na przydatność proponowanej procedury przy próbie ustalenia, które samogłoski oraz formanty pozwalają dostatecznie zróżnicować mówców, indywidualizując tym samym dostatecznie każdego.
www.dsp.agh.edu.pl
Głosowa biometria na AGH
W ramach projektu Biometryczna weryfikacja i identyfikacja głosu kierowanego przez dr inż. Jakuba Gałkę już po kilku miesiącach projektu zrealizowano prototyp systemu weryfikacji tożsamości osób dzwoniących. Wstępne testy potwierdziły skuteczność metody i zaimplementowanego rozwiązania, a komercyjny partner projektu - firma Unico Software - prowadzi rozmowy na temat jego wdrożenia, między innymi w infoliniach banków.
7 kwi 2013
Agregator polskich blogów naukowych
Nasz blog został dołączony do spisu blogów naukowych na Agregatorze polskich blogów naukowych. Jest to ciekawy projekt katalogujący to co sama nazwa wskazuje...
www.dsp.agh.edu.pl
www.dsp.agh.edu.pl
6 kwi 2013
9th International Conference on Machine Learning and Data Mining MLDM 2013
Nasz artykuł "Using Part of Speech N-grams for Improving Automatic Speech Recognition of Polish" został przyjęty na konferencji MLDM 2013 w Nowym Jorku. Artykuł opisuje pierwsze eksperymenty naszego nowego podejścia do wykorzystania tagów pochodzących z analizatorów morfologicznych do modelowania języka w rozpoznawaniu mowy. Kluczem sukcesu okazało się ograniczenie tagów POS (Part-of-speech) do węższej liczby kategorii, rezygnując ze szczegółowego opisu. Opracowany model 3-gramowy korzysta z estymacji Wittena-Bella 2-gramami.
www.dsp.agh.edu.pl
www.dsp.agh.edu.pl
Subskrybuj:
Posty (Atom)