google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

16 wrz 2014

Syntezowanie mowy oddechem

Science Alert opisuje ciekawy wynalazek dla osób z zaburzeniami mowy. Polega on na generowaniu mowy w oparciu o oddechy. Więcej na Science Alert.


1 wrz 2014

Kolejny rekord oglądalności

Sierpień będąc miesiącem zamknięcia uczelni i wakacji nie brzmi jak termin pobicia ilości odwiedzin naszej strony www.dsp.agh.edu.pl, ale jednak. Było 4769. Wynik ten osiągnęliśmy w dużej mierze w ostatnim dniu, dzięki temu, że Slashdot opublikował na stronie głównej kategorii "games" artykuł o nowym filmie pokazującym naszą bibliotekę dźwiękową w Quake'u.

18 sie 2014

IEEE Region 8 Student and Young Professional Congress

W ramach IEEE Region 8 Student and Young Professional Congress młodzi naukowcy z Europy, Afryki i Bliskiego wschodu tłumnie odwiedzili nasze laboratorium. Marcin Witkowski prezentował nasz system biometryczny, a Tomek Pędzimąż trójwymiarowy silnika audio do gier.



www.dsp.agh.edu.pl

8 sie 2014

PAP o Sarmacie i Techmo

"Sarmata to system komputerowy, który rozpoznaje polskie słowa. Większość podobnych technologii jest opartych na języku angielskim. Konstruktorzy z AGH „nauczyli” swój system rozpoznawać tysiąc polskich komend. Tym samym otworzyli Polakom możliwość głosowego komunikowania się z urządzeniami cyfrowymi. Pierwsze wdrożenia nastąpią w telekomunikacji."

Więcej na PAP 

6 sie 2014

Two-microphone dereverberation for Polish ASR

Nasz artykuł "Two-microphone dereverberation for Polish ASR" został przyjęty do druku w czasopiśmie z Listy Filadelfijskiej Archives of Acoustics. Praca powstała we współpracy z University of Surrey i opisuje eksperymenty z rozpoznawaniem mowy polskiej i angielskiej w warunkach pogłosu.

www.dsp.agh.edu.pl

5 sie 2014

PVC zindeksowane w SCOPUSie

Pełne artykuły pokonferencyjne XXII PVC zostały zindeksowane przez Scopus. Scopus to baza artykułów porównywalna jakościowo z Web of Knowledge Thomson Reuters, tylko trochę większa, ale za to z bardziej klarownymi zasadami indeksowania konferencji, które w wypadku WoK nie są w żaden sposób zdefiniowane i coraz częściej sprowadzają się do tego, że jeśli wydawcą jest konkurencja Thomson Reuters to artykuły nie są indeksowane. Niestety z jakiś powodów Scopus jest zupełnie ignorowany przez polskie Ministerstwo Nauki i Szkolnictwa Wyższego. Ale juz na przykład cenione raporty SCIMAGO (m.in. używane do wyliczania rankingu Webometrics) korzystają z danych SCOPUSa.

www.dsp.agh.edu.pl

23 lip 2014

Mgr inż. Piotr Żelasko

Jako pierwszy na swoim roku obronił się dzisiaj Piotr Żelasko. Jego praca "Rozpoznawanie mowy w telefonii" została oceniona na 5.0.

"Centrum zainteresowań mojej pracy stanowi problem nauczenia systemu rozpoznawania mowy radzenia sobie z obecnością oddechów i pauz wypełnionych. W szczególności, zajmę się:
-  stworzeniem prostego, pokazowego systemu dialogowego z modułem rozpoznawania mowy opartym na systemie Sarmata [Ziółko et al., 2011];
- przygotowaniem korpusu zawierającego oddechy i pauzy wypełnione wyekstrahowane ze spontanicznej mowy ciągłej;
- opracowaniem rozwiązania, które pozwoli systemowi rozpoznawania mowy osiągnąć lepsze rezultaty podczas rozpoznawania mowy, w której znajdują się wyraźne oddechy i pauzy wypełnione.

W pierwszej kolejności omówię strukturę transferu danych pomiędzy urządzeniem klienta a centralą systemu dialogowego oraz przedstawię przygotowany przeze mnie scenariusz przykładowego systemu dialogowego. Następnie opiszę krótko najważniejsze cechy systemu rozpoznawania mowy i przykładowy sposób połączenia go z systemem dialogowym. Pozostałą część pracy poświęcę na szczegółowy opis oddechów i pauz wypełnionych oraz na przedstawienie mojej metody uwzględnienia ich w modelu wypowiedzi, wraz z wynikami testów."

www.dsp.agh.edu.pl