29 sty 2015

Inż. Jakub Antoniuk

Kolejną ciekawą pracą dyplomową zrealizowaną w naszym zespole była "Aplikacja do wydobywania mowy z nagrania słabej jakości" wykonana i obroniona przez Jakuba Antoniuka. Serdecznie Gratulujemy!!!

"Celem tej pracy inzynierskiej była implementacja metod do wydobywania mowy z nagrania słabej jakości w środowisku MATLAB. Wybrano metodę odejmowania widmowego oraz wybielania. W poniższej pracy zarówno metody, jak i ich implementacja w użytym środowisku programistycznym zostały dokładnie opisane. Opisano również˙ wpływ doboru parametrów użytych funkcji na wynik działania programu. Końcowa aplikacja korzysta z obu metod, wykorzystując je z różnymi parametrami. Wyniki działania ˙ programu zostały przedstawione na dwóch rodzajach nagrań: sztucznie zaszumionych nagrań mowy, oraz rzeczywistych nagrań mowy z głośnym otoczeniem."

www.dsp.agh.edu.pl

19 sty 2015

inż. Błażej Chwiećko

Tej zimy przewidujemy bardzo wiele prac inżynierskich realizowanych w naszym zespole. Tak wiele że aż trudno się nam doliczyć. Listę otworzył dzisiaj Błażej Chwiećko broniąc pracę "Aplikacja do wykrywania reklam w radiu". Praca opisuje analizę możliwości wykonania aplikacji która przełączałaby stacje radiowe podczas reklam. Dyplomant zliczył statystyki stosunku mowy do muzyki w 12 stacjach radiowych i wykonał prototyp na iOS. Gratulujemy dyplomu !!!

"Pierwszym z poruszanych w tej pracy inżynierskiej zagadnień jest stworzenie aplikacji na system iOS, w którym zaprezentowano historię mobilnego oprogramowania firmy Apple, architekturę oraz zintegrowane środowisko deweloperskie - Xcode wraz z oferowanymi przez nie możliwościami. Drugim przedstawionym w pracy tematem jest klasyfikacja sygnału dźwiękowego na mowę lub muzykę. Zaprezentowano najważniejsze problemy dyskryminacji treści, a także, stosowane w XX wieku, sposoby klasyfikacji sygnału. Szczegółowo opisano również algorytm Minimum Energy Density bazujący na analizie lokalnej energii sygnału oraz etapy tworzenie prototypu aplikacji oferującej możliwość odtwarzania radia z pre-definiowanych źródeł internetowych, jak i dodawania streamów użytkownika. W aplikacji zaimplementowano możliwość wyświetlania informacji dotyczących procentowego udziału muzyki na danym kanale, które otrzymano analizując fragmenty nagrań stacji radiowych opisywanym algorytmem klasyfikującym. "

www.dsp.agh.edu.pl

7 sty 2015

Ciekawostki branży głosowej

Nuance dodaje biometrię głosu do swojego systemu przeznaczonego dla samochodów.

http://www.businesswire.com/news/home/20150106005385/en/Nuance%E2%80%99s-Dragon-Drive-Adds-Voice-Biometrics-Virtual#.VK1JviuG-qk

http://finance.yahoo.com/news/nuance-dragon-drive-adds-voice-130000994.html

http://findbiometrics.com/nuance-announces-dragon-id-voice-biometrics-for-mobile/

VocaONE uruchamia darmową usługę sieciową do biometrycznego głosowego logowania:

http://www.finextra.com/news/announcement.aspx?pressreleaseid=58154 (za darmo !)

https://www.vocaone.com/vocapass.html

Lattice Semiconductor  wprowadza na rynek niskoenergetyczny układ elektroniczny ( iCE40 na bazie FPGA) do nasłuchiwania i rozpoznawania komend głosowych, do zastosowań np. w sprzęcie AGD, smart home itd.