Rozpoznawanie Mowy

11 lut 2015

Telewizory gromadzą korpusy mowy

Polskie Radio donosi o ciekawych oświadczeniach Samsunga na temat ich Smart TV. Podobno firma rozbudowuje swój korpus rejestrując to co się mówi przy telewizorach z funkcją rozpoznawania mowy. Ja się temu nie dziwię, ale to się chyba nie przyjmie społecznie ;)

Więcej na http://www.polskieradio.pl/23/3/Artykul/1373872

2 lut 2015

Co Polacy sądzą o biometrii

Bardzo ciekawy artykuł o podejściu Polaków do biometrii głosowej ukazał się w Dzienniku Internautów.

"Ostatnio otrzymaliśmy np. analizę postaw Polaków wobec stosowanych obecnie metod uwierzytelniania ze szczególnym naciskiem na weryfikację głosową. Badanie zostało przeprowadzone przez TNS Polska na zlecenie Nuance Communications, odbyło się w listopadzie 2014 r. i objęło 1000-osobową grupę internautów między 18 a 65 rokiem życia."

"Z badania tego wynika, że blisko połowa respondentów (47%) czuje się zmęczona liczbą haseł dostępu, kodów i PIN-ów, które trzeba zapamiętać. 46% denerwuje się, kiedy system wymusza tworzenie skomplikowanych haseł. 27% twierdzi, że nie lubi tokenów, ponieważ łatwo je zgubić."

Więcej na di.com.pl

Inż. Robert Dyjas

W miniony czwartek Robert Dyjas obronił bardzo dobrą pracę inżynierską polegającą na znaczącym rozwinięciu naszego korpusu mowy (o 111 mówców). Dane są dla nas tym istotniejsze, że są realnymi nagraniami telefonicznymi ukierunkowanymi tematycznie na treść najistotniejsza z punktu widzenia wdrożeń Sarmaty. Gratulujemy i dziękujemy za współpracę!!!

www.dsp.agh.edu.pl

29 sty 2015

Inż. Jakub Antoniuk

Kolejną ciekawą pracą dyplomową zrealizowaną w naszym zespole była "Aplikacja do wydobywania mowy z nagrania słabej jakości" wykonana i obroniona przez Jakuba Antoniuka. Serdecznie Gratulujemy!!!

"Celem tej pracy inzynierskiej była implementacja metod do wydobywania mowy z nagrania słabej jakości w środowisku MATLAB. Wybrano metodę odejmowania widmowego oraz wybielania. W poniższej pracy zarówno metody, jak i ich implementacja w użytym środowisku programistycznym zostały dokładnie opisane. Opisano również˙ wpływ doboru parametrów użytych funkcji na wynik działania programu. Końcowa aplikacja korzysta z obu metod, wykorzystując je z różnymi parametrami. Wyniki działania ˙ programu zostały przedstawione na dwóch rodzajach nagrań: sztucznie zaszumionych nagrań mowy, oraz rzeczywistych nagrań mowy z głośnym otoczeniem."

www.dsp.agh.edu.pl

19 sty 2015

inż. Błażej Chwiećko

Tej zimy przewidujemy bardzo wiele prac inżynierskich realizowanych w naszym zespole. Tak wiele że aż trudno się nam doliczyć. Listę otworzył dzisiaj Błażej Chwiećko broniąc pracę "Aplikacja do wykrywania reklam w radiu". Praca opisuje analizę możliwości wykonania aplikacji która przełączałaby stacje radiowe podczas reklam. Dyplomant zliczył statystyki stosunku mowy do muzyki w 12 stacjach radiowych i wykonał prototyp na iOS. Gratulujemy dyplomu !!!

"Pierwszym z poruszanych w tej pracy inżynierskiej zagadnień jest stworzenie aplikacji na system iOS, w którym zaprezentowano historię mobilnego oprogramowania firmy Apple, architekturę oraz zintegrowane środowisko deweloperskie - Xcode wraz z oferowanymi przez nie możliwościami. Drugim przedstawionym w pracy tematem jest klasyfikacja sygnału dźwiękowego na mowę lub muzykę. Zaprezentowano najważniejsze problemy dyskryminacji treści, a także, stosowane w XX wieku, sposoby klasyfikacji sygnału. Szczegółowo opisano również algorytm Minimum Energy Density bazujący na analizie lokalnej energii sygnału oraz etapy tworzenie prototypu aplikacji oferującej możliwość odtwarzania radia z pre-definiowanych źródeł internetowych, jak i dodawania streamów użytkownika. W aplikacji zaimplementowano możliwość wyświetlania informacji dotyczących procentowego udziału muzyki na danym kanale, które otrzymano analizując fragmenty nagrań stacji radiowych opisywanym algorytmem klasyfikującym. "

www.dsp.agh.edu.pl

7 sty 2015

Ciekawostki branży głosowej

Nuance dodaje biometrię głosu do swojego systemu przeznaczonego dla samochodów.

http://www.businesswire.com/news/home/20150106005385/en/Nuance%E2%80%99s-Dragon-Drive-Adds-Voice-Biometrics-Virtual#.VK1JviuG-qk

http://finance.yahoo.com/news/nuance-dragon-drive-adds-voice-130000994.html

http://findbiometrics.com/nuance-announces-dragon-id-voice-biometrics-for-mobile/

VocaONE uruchamia darmową usługę sieciową do biometrycznego głosowego logowania:

http://www.finextra.com/news/announcement.aspx?pressreleaseid=58154 (za darmo !)

https://www.vocaone.com/vocapass.html

Lattice Semiconductor wprowadza na rynek niskoenergetyczny układ elektroniczny ( iCE40 na bazie FPGA) do nasłuchiwania i rozpoznawania komend głosowych, do zastosowań np. w sprzęcie AGD, smart home itd.

11 lut 2015

Telewizory gromadzą korpusy mowy

2 lut 2015

Co Polacy sądzą o biometrii

Inż. Robert Dyjas

29 sty 2015

Inż. Jakub Antoniuk

19 sty 2015

inż. Błażej Chwiećko

7 sty 2015

Ciekawostki branży głosowej

28 lis 2014

Kraków Startup TV Ep. 21: Top 500 Innovators

Szukaj na tym blogu

Translate

Archiwum bloga

Obserwatorzy

Łączna liczba wyświetleń