Science Alert opisuje ciekawy wynalazek dla osób z zaburzeniami mowy. Polega on na generowaniu mowy w oparciu o oddechy. Więcej na Science Alert.
google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0
16 wrz 2014
1 wrz 2014
Kolejny rekord oglądalności
Sierpień będąc miesiącem zamknięcia uczelni i wakacji nie brzmi jak termin pobicia ilości odwiedzin naszej strony www.dsp.agh.edu.pl, ale jednak. Było 4769. Wynik ten osiągnęliśmy w dużej mierze w ostatnim dniu, dzięki temu, że Slashdot opublikował na stronie głównej kategorii "games" artykuł o nowym filmie pokazującym naszą bibliotekę dźwiękową w Quake'u.
18 sie 2014
IEEE Region 8 Student and Young Professional Congress
W ramach IEEE Region 8 Student and Young Professional Congress młodzi naukowcy z Europy, Afryki i Bliskiego wschodu tłumnie odwiedzili nasze laboratorium. Marcin Witkowski prezentował nasz system biometryczny, a Tomek Pędzimąż trójwymiarowy silnika audio do gier.
www.dsp.agh.edu.pl
www.dsp.agh.edu.pl
8 sie 2014
PAP o Sarmacie i Techmo
"Sarmata to system komputerowy, który rozpoznaje polskie słowa. Większość podobnych technologii jest opartych na języku angielskim. Konstruktorzy z AGH „nauczyli” swój system rozpoznawać tysiąc polskich komend. Tym samym otworzyli Polakom możliwość głosowego komunikowania się z urządzeniami cyfrowymi. Pierwsze wdrożenia nastąpią w telekomunikacji."
Więcej na PAP
6 sie 2014
Two-microphone dereverberation for Polish ASR
Nasz artykuł "Two-microphone dereverberation for Polish ASR" został przyjęty do druku w czasopiśmie z Listy Filadelfijskiej Archives of Acoustics. Praca powstała we współpracy z University of Surrey i opisuje eksperymenty z rozpoznawaniem mowy polskiej i angielskiej w warunkach pogłosu.
www.dsp.agh.edu.pl
5 sie 2014
PVC zindeksowane w SCOPUSie
Pełne artykuły pokonferencyjne XXII PVC zostały zindeksowane przez Scopus. Scopus to baza artykułów porównywalna jakościowo z Web of Knowledge Thomson Reuters, tylko trochę większa, ale za to z bardziej klarownymi zasadami indeksowania konferencji, które w wypadku WoK nie są w żaden sposób zdefiniowane i coraz częściej sprowadzają się do tego, że jeśli wydawcą jest konkurencja Thomson Reuters to artykuły nie są indeksowane. Niestety z jakiś powodów Scopus jest zupełnie ignorowany przez polskie Ministerstwo Nauki i Szkolnictwa Wyższego. Ale juz na przykład cenione raporty SCIMAGO (m.in. używane do wyliczania rankingu Webometrics) korzystają z danych SCOPUSa.
www.dsp.agh.edu.pl
23 lip 2014
Mgr inż. Piotr Żelasko
Jako pierwszy na swoim roku obronił się dzisiaj Piotr Żelasko. Jego praca "Rozpoznawanie mowy w telefonii" została oceniona na 5.0.
"Centrum zainteresowań mojej pracy stanowi problem nauczenia systemu rozpoznawania mowy radzenia sobie z obecnością oddechów i pauz wypełnionych. W szczególności, zajmę się:
- stworzeniem prostego, pokazowego systemu dialogowego z modułem rozpoznawania mowy opartym na systemie Sarmata [Ziółko et al., 2011];
- przygotowaniem korpusu zawierającego oddechy i pauzy wypełnione wyekstrahowane ze spontanicznej mowy ciągłej;
- opracowaniem rozwiązania, które pozwoli systemowi rozpoznawania mowy osiągnąć lepsze rezultaty podczas rozpoznawania mowy, w której znajdują się wyraźne oddechy i pauzy wypełnione.
W pierwszej kolejności omówię strukturę transferu danych pomiędzy urządzeniem klienta a centralą systemu dialogowego oraz przedstawię przygotowany przeze mnie scenariusz przykładowego systemu dialogowego. Następnie opiszę krótko najważniejsze cechy systemu rozpoznawania mowy i przykładowy sposób połączenia go z systemem dialogowym. Pozostałą część pracy poświęcę na szczegółowy opis oddechów i pauz wypełnionych oraz na przedstawienie mojej metody uwzględnienia ich w modelu wypowiedzi, wraz z wynikami testów."
www.dsp.agh.edu.pl
Subskrybuj:
Posty (Atom)