Rozpoznawanie Mowy

2 mar 2015

Inż. Jerzy Wolf

W dniu dzisiejszym swoją bardzo ciekawą pracę dyplomową "Testowanie odporności systemu
weryfikacji mówcy na aktorską modulację głosową" obronił Jerzy Wolf. Gratulujemy, a o jego próbach włamań radzimy poczytać.

"Przedmiotem niniejszej pracy jest zbadanie zagadnienia naśladowania głosu innej osoby i przetestowanie odporności systemu weryfikacji mowy Voice Color firmy Techmo na tego typu ataki.Na potrzeby pracy użyto dwóch typów nagrań mówców oryginalnych i nagrań naśladowczych. Pierwszy typ nagrań składał się z nagrań ochotników, którzy zgodzili się użyczyć swojego głosu na potrzeby testów systemu weryfikacji mówcy. W tym przypadku osobą próbującą naśladować mówców oryginalnych jest autor pracy (dalej: naśladowca), co umożliwiło dokładniejsze opisanie wyzwań i problemów związanych z tego typu próbą oszukania systemu. Drugim typem plików dźwiękowych, których użyto do przetestowania systemu, były nagrania zawodowego aktora głosowego specjalizującego się w naśladownictwie, Jamesa Arnolda Taylora (dalej: aktor), który dostarczył swoje próby naśladowania pięciu innych znanych aktorów razem z nagraniami oryginalnymi, na których się wzorował.Scenariusz badania zakładał próby oszukania systemu poprzez skuteczne zalogowanie się naśladowców na cudze konto zabezpieczone wygenerowanym wcześniej na podstawie nagrań oryginalnych modelem mówcy. Dla zachowania autentyczności warunków testu próbki głosu mówców oryginalnych i naśladowców zrealizowane zostały podczas autentycznych rozmów telefonicznych."

www.dsp.agh.edu.pl

24 lut 2015

Dyplom MNiSW

Nasz zespół otrzymał na targach w Centrum Nauki Kopernik dyplomy od Ministra Nauki i Szkolnictw Wyższego za projekty Voice Color i RAYAV.

www.dsp.agh.edu.pl

14 lut 2015

Bezpieczne hasło, którego nie da się zgubić ani zapomnieć brzmi nierealnie? To możliwe, a odpowiedzą na powyższe pytanie jest biometria.

Bank Smart właśnie ogłosił wprowadzenie zabezpieczeń biometrycznych, takich jak logowanie hasłem głosowym. Choć na razie dzięki wypowiedzeniu magicznej, wydawałoby się, formułki "Zaloguj mnie do Banku Smart" jesteśmy w stanie dostać się tylko do aplikacji pozwalającej na korzystanie z usług mobilnych, to już teraz jest to jedyna taka usługa w całej Polsce i zarazem pierwsza w Europie.

- Na razie głos służy jedynie przy logowaniu do bankowości mobilnej. Nie jest on wykorzystywany do autoryzacji przelewu. To musimy zrobić jeszcze ręcznie - mówi w wywiadzie dla Money.pl Małgorzata Halaba z Banku Smart.

Stanowi to jednak naturalne uzupełnienie wcześniejszej funkcjonalności, jaką jest głosowa nawigacja po opcjach i funkcjach konta. Kilka słów, takich jak: "przelew, babcia, sto złotych" wystarcza do przeprowadzenia transakcji.

Biometria w bankowości jest już wykorzystywana od lat, ale do tej pory sprowadzała się najczęściej do wykorzystywania odcisków palców. Te jednak, podobnie jak inne dotychczas stosowane zabezpieczenia, były zabezpieczeniem fizycznym - wymagającym obecności na miejscu ich weryfikowania. W wypadku ludzkiego głosu, ta trudność nie występuje. Przedstawiciele Banku Smart właśnie to uważają za istotę mobilności i bezpieczeństwa:

"Na brzmienie Twojego głosu wpływa rozmiar, kształt i grubość strun głosowych, a oprócz tego również narządy mowy takie jak usta, gardło lub nos. Szansa, by wszystkie te cechy były identyczne u dwóch różnych osób jest niemal zerowa. W Banku SMART dodatkowo analizujemy również Twój styl wypowiedzi – akcenty, czy wypowiadanie głosek. Nie musisz się obawiać, że ktoś nagra Twoją wypowiedź a następnie zaloguje się na konto – system rozpoznaje takie przypadki i od razu uniemożliwia logowanie się do banku."

Bank Smart reklamuje się jako pierwszy prawdziwie mobilny bank w Polsce. Tym samym korzysta z dziedzictwa mBanku, który z kolei reklamował się jako pierwszy bank prawdziwie internetowy - co w żaden sposób nie zaskakuje, gdy przyjrzymy się dokładniej osobie Sławomira Lachowskiego - który stoi za oboma tymi przedsięwzięciami.

www.dsp.agh.edu.pl

11 lut 2015

Telewizory gromadzą korpusy mowy

Polskie Radio donosi o ciekawych oświadczeniach Samsunga na temat ich Smart TV. Podobno firma rozbudowuje swój korpus rejestrując to co się mówi przy telewizorach z funkcją rozpoznawania mowy. Ja się temu nie dziwię, ale to się chyba nie przyjmie społecznie ;)

Więcej na http://www.polskieradio.pl/23/3/Artykul/1373872

2 lut 2015

Co Polacy sądzą o biometrii

Bardzo ciekawy artykuł o podejściu Polaków do biometrii głosowej ukazał się w Dzienniku Internautów.

"Ostatnio otrzymaliśmy np. analizę postaw Polaków wobec stosowanych obecnie metod uwierzytelniania ze szczególnym naciskiem na weryfikację głosową. Badanie zostało przeprowadzone przez TNS Polska na zlecenie Nuance Communications, odbyło się w listopadzie 2014 r. i objęło 1000-osobową grupę internautów między 18 a 65 rokiem życia."

"Z badania tego wynika, że blisko połowa respondentów (47%) czuje się zmęczona liczbą haseł dostępu, kodów i PIN-ów, które trzeba zapamiętać. 46% denerwuje się, kiedy system wymusza tworzenie skomplikowanych haseł. 27% twierdzi, że nie lubi tokenów, ponieważ łatwo je zgubić."

Więcej na di.com.pl

Inż. Robert Dyjas

W miniony czwartek Robert Dyjas obronił bardzo dobrą pracę inżynierską polegającą na znaczącym rozwinięciu naszego korpusu mowy (o 111 mówców). Dane są dla nas tym istotniejsze, że są realnymi nagraniami telefonicznymi ukierunkowanymi tematycznie na treść najistotniejsza z punktu widzenia wdrożeń Sarmaty. Gratulujemy i dziękujemy za współpracę!!!

www.dsp.agh.edu.pl

29 sty 2015

Inż. Jakub Antoniuk

Kolejną ciekawą pracą dyplomową zrealizowaną w naszym zespole była "Aplikacja do wydobywania mowy z nagrania słabej jakości" wykonana i obroniona przez Jakuba Antoniuka. Serdecznie Gratulujemy!!!

"Celem tej pracy inzynierskiej była implementacja metod do wydobywania mowy z nagrania słabej jakości w środowisku MATLAB. Wybrano metodę odejmowania widmowego oraz wybielania. W poniższej pracy zarówno metody, jak i ich implementacja w użytym środowisku programistycznym zostały dokładnie opisane. Opisano również˙ wpływ doboru parametrów użytych funkcji na wynik działania programu. Końcowa aplikacja korzysta z obu metod, wykorzystując je z różnymi parametrami. Wyniki działania ˙ programu zostały przedstawione na dwóch rodzajach nagrań: sztucznie zaszumionych nagrań mowy, oraz rzeczywistych nagrań mowy z głośnym otoczeniem."

2 mar 2015

Inż. Jerzy Wolf

24 lut 2015

Dyplom MNiSW

14 lut 2015

Bank na każde zawołanie

11 lut 2015

Telewizory gromadzą korpusy mowy

2 lut 2015

Co Polacy sądzą o biometrii

Inż. Robert Dyjas

29 sty 2015

Inż. Jakub Antoniuk

Szukaj na tym blogu

Translate

Archiwum bloga

Obserwatorzy

Łączna liczba wyświetleń