google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

17 kwi 2013

Konferencja SLSP 2013

Nasz artykuł "Speech/Music Discrimination via Energy Density Analysis" został przyjęty na 1st International Conference on Statistical Language and Speech Processing która odbędzie się w Tarragonie w Hiszpanii. Artykuł opisuje metodę którą stosujemy przy wstępnej analizie nagrań w których znajduje się sygnał mowy do weryfikacji czy rzeczywiście on tam jest, a jeśli tak to czy nie jest przerywany w niektórych miejscach muzyką.

www.dsp.agh.edu.pl

16 kwi 2013

Problemy Kryminalistyki

Nasz artykuł "Zastosowanie algorytmu DTW jako narzędzia w identyfikacji mówcy" został przyjęty do druku w Problemach Kryminalistyki, wydawanych przez Centralne Laboratorium Kryminalistyczne Policji. 
W artykule omówiono problemy związane z identyfikacją mówcy i przedstawiono propozycję procedury ułatwiającej proces identyfikacji w części akustycznej. Koncepcja opiera się na metodach programowania dynamicznego, a w szczególności algorytmu znanego jako DTW (ang. Dynamic Time Warping). Przeprowadzone zostały testy, wskazujące na przydatność proponowanej procedury przy próbie ustalenia, które samogłoski oraz formanty pozwalają dostatecznie zróżnicować mówców, indywidualizując tym samym dostatecznie każdego.

www.dsp.agh.edu.pl

Głosowa biometria na AGH

W ramach projektu Biometryczna weryfikacja i identyfikacja głosu kierowanego przez dr inż. Jakuba Gałkę już po kilku miesiącach projektu zrealizowano prototyp systemu weryfikacji tożsamości osób dzwoniących. Wstępne testy potwierdziły skuteczność metody i zaimplementowanego rozwiązania, a komercyjny partner projektu - firma Unico Software - prowadzi rozmowy na temat jego wdrożenia, między innymi w infoliniach banków.

6 kwi 2013

9th International Conference on Machine Learning and Data Mining MLDM 2013

Nasz artykuł "Using Part of Speech N-grams for Improving Automatic Speech Recognition of Polish" został przyjęty na konferencji MLDM 2013 w Nowym Jorku. Artykuł opisuje pierwsze eksperymenty naszego nowego podejścia do wykorzystania tagów pochodzących z analizatorów morfologicznych do modelowania języka w rozpoznawaniu mowy. Kluczem sukcesu okazało się ograniczenie tagów POS (Part-of-speech) do węższej liczby kategorii, rezygnując ze szczegółowego opisu. Opracowany model 3-gramowy korzysta z estymacji Wittena-Bella 2-gramami.

www.dsp.agh.edu.pl

3 kwi 2013

Modelowanie i Pomiary w Medycynie

Nasz artykuł "Modelowanie i detekcja oddechu w sygnale akustycznym" został przyjęty na konferencję "Modelowanie i Pomiary w Medycynie" MPM'2013, która odbędzie się 19 - 23 maja 2013r. w Krynicy Zdroju. Artykuł opisuje nasza metodę wykrywania oddechów w nagraniu mowy i jej potencjał do zastosowań w inżynierii biomedycznej.

www.dsp.agh.edu.pl

30 mar 2013

Ways to Ptolanguage 3

Od wielu lat są znane silne przesłanki archeologiczne wskazujące, że człowiek migrował z Afryki do Europy i Azji, a dalej do Ameryk oraz Australii i Oceanii. W 2011 Nature opublikowało artykuł Atkinsona potwierdzający tą hipotezę poprzez zależności lingwistyczne. Na konferencji Ways to Protolanguage 3 opowiemy o rozpoczynanych przez nas badaniach mających na celu zweryfikowanie tej wiedzę poprzez analizę częstotliwościową próbek kilkuset języków oraz ich alfabetów fonetycznych. Wystąpienie zostało przyjęto pod tytułem "Phonemes analysis for genealogical tree of world languages" i stanowi realizację projektu „Analiza porównawcza różnojęzycznych fonemów” finansowanego przez Narodowe Centrum Nauki. Nasza baza próbek języków powstaje na stronie speechsamples.agh.edu.pl. Będzie ogólnodostępnym i darmowym zasobem.