google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0
Pokazywanie postów oznaczonych etykietą ASR. Pokaż wszystkie posty
Pokazywanie postów oznaczonych etykietą ASR. Pokaż wszystkie posty

19 cze 2016

Smartfony mają zniknąć za 5 lat ?

... i to głównie przez niechęć do ekranów i zużywanej przez nie energii. Tak wskazuje ankieta przeprowadzona przez Ericssona na 100 00 osób: http://www.cnbc.com/2015/12/09/people-think-the-smartphone-will-be-dead-in-5-years-ericsson.html

10 cze 2015

Detecting Recorded Speech for Polish Language

Nasz artykuł o wykrywaniu automatycznych sekretarek został przyjęty na konferencję IEEE Africon. Artykuł ocenia trzy metody które mają zastosowanie do  wspomnianego zadania. Testy zostały przeprowadzone ze względu na  zainteresowanie zastosowaniami tego typu oprogramowania. Może ono służyć do obniżenia kosztów prowadzenia działalności polegającego na wydzwanianiu do klientów poprzez unikanie sytuacji w której automat rozmawia z automatem.


"Three possible methods of detecting recorded speech were analysed and tested according to their applicability in the field of voicemail detection in this paper. Methods chosen for testing were: transmission channel characteristics extraction with PFCC, recorded speech detection with trained pattern classifier, differences in transmission channels and speech recognition. Most of the tests gave results credible enough to confirm methods’ usefulness in the field of voicemail detection. Suggestions of implementation possibilities and parameters of each method and possible trends of further studies were also included."



28 paź 2014

Robot obsługujący klientów w Dolinie Krzemowej

"Klient może przyjść do sklepu z jakąś śrubką i powiedzieć: "Panie robocie, potrzebuję tego więcej". Jeśli takie śruby są dostępne, robot poinformuje o tym, a następnie zaprowadzi klienta do właściwej półki - mówi Kyle Nel, dyrektor laboratorium innowacji firmy Lowe's Companies Inc., do której należą sklepy Orchard Supply Hardware. Roboty rozpoznają język angielski i hiszpański."
Więcej na TVN24bis 

The Role of Acoustic Features in Marking Accent and Delimiting Sentence Boundaries in Spoken Polish

Nasza publikacja "The Role of Acoustic Features in Marking Accent and Delimiting Sentence Boundaries in Spoken Polish" została przyjęta do druku w czasopiśmie Acta Physica Polonica (Impact Factor 0.604). Opisujemy w niej modele statystyczne dotyczące korelacji między realizacjami fonemów a ich położeniem w zdaniu i akcentem.

www.dsp.agh.edu.pl

23 paź 2014

Two-Microphone Dereverberation for Automatic Speech Recognition of Polish

Nasz artykuł "Two-Microphone Dereverberation for Automatic Speech Recognition of Polish" ukazał się w Archives of Acoustics (IF: 0.829). Publikacja prezentuje metody wspierające rozpoznawanie mowy nagrań z echem. Publikacja jest wynikiem wyjazdu jednego z naszych studentów (Mikołaj Kundegórski) na staż w ramach programu Erasmus- Socrates do Anglii. Obecnie Mikołaj jest pracownikiem Uniwersytetu w Durham gdzie zajmuje się przetwarzaniem obrazów.

www.dsp.agh.edu.pl

30 wrz 2014

Automatyczna sekretarka przychodni

Prosimy o pomoc w zbieraniu danych do badań. Proszę wczuć się w rolę pacjenta, który dzwoni do przychodni i umawia się na wizytę. Chodzi o sformułowanie kilku wypowiedzi na podstawie przedstawionych danych o celu i terminie wizyty.  Znajduje się ona pod poniższym linkiem: 

https://docs.google.com/forms/d/1eLVidso0I7xUwA5y9nAUTX4GKzGuiJ_28UXqCPW4QUM/viewform

Dziękujemy z góry za wypełnienie ankiety!
www.dsp.agh.edu.pl

24 cze 2014

Pół godziny na infolinii

Dzisiaj próbowałem odblokować telefon który w nie do końca znanych mi okolicznościach został zablokowany gdy byłem w Stanach. Sam początek był tragiczny. W tej samej informacji w której przekazano mi, że nie mogę wykonywać połączeń wychodzących napisano też że mam zadzwonić na infolinię. Gdy odpisałem, że nie mogę zadzwonić bo właśnie zablokowaliście mi telefon, firma nie widziała w tym żadnego problemu.

Potem było coraz gorzej. Zadzwoniłem na wskazany numer z pożyczonego telefonu. Najpierw klapa bo chcą żebym wybrał numer 1 lub 2 a tu ekran dotykowy nieaktywny w trakcie rozmowy... (rozpoznawanie mowy między 1 a 2 to potrafi zrobić 90% naszych studentów).

Przełożyłem nieswoją kartę do swojego telefonu i dzwonię ponownie. Po wybraniu numeru odezwała się Pani, tłumacze jej swój problem, na spokojnie. Ona weryfikuje moją tożsamość pytając o nazwisko i pesel (i to podobno jest bezpieczniejsze od biometrii!!!). Potem mówi żebym czekał. Po kilku minutach wraca i mówi, że ma problemy techniczne i mnie przełączy do koleżanki. Ok. Myślę sobie poznam koleżankę. Niestety nie, kolejny automat i wybór menu. Rozłączam się i dzwonię ponownie do pierwszej. Mówię, że było menu, na co ona to proszę wybrać opcję odblokowanie karty. Acha ... Przełącza mnie. Takiej opcji nie ma, wybieram "czy jesteś naszym klientem - tak". "Podaj identyfikator klienta"... Dzwonię do pierwszej i mówię, że nie pamiętam swojego identyfikatora (a w domu, gdzie mam to zapisane, nie będę miał nie swojej karty sim żeby móc zadzwonić ...). Pani mówi żebym czekał i że mi sprawdzi. Kolejna minuta upływa i mówi że ma problemy techniczne, że spróbuje mnie połączyć jeszcze raz, a jak się nie uda to żebym zadzwonił na pełnopłatny numer bezpośrednio do owej koleżanki (na razie płaciłem tylko 1 zł za każde dzwonienie).

Po przełączeniu pojawiło sie  to samo menu, więc tym razem wybrałem "połącz z konsultantem". Nie było koleżanki, był pan. Tłumaczę swoją sprawę, mówi żebym poczekał, wraca po kilku minutach i mówi żebym zasilił konto. Na co ja że tego już próbowałem i system nie chciał przyjąć ode mnie pieniędzy. Podpowiadam , że może jest jakaś kwota którą trzeba wrzucić gdy numer jest zablokowany. Pan mówi żebym znowu czekał. Po jakimś czasie wraca i mówi, że puści mi melodyjkę i żebym czekał dalej. Kilka minut później melodyjka niepokojąca zarzyna się jakby w analogowym urządzeniu zaczęło brakować zasilania, ale czekam. Pan wraca i mówi żebym spróbował jeszcze raz, a jak się nie uda to spróbował nie przez internet ,tylko w bankomacie i żebym spisywał komunikaty. Jak się z różnych źródeł nie uda, to żebym wysłał pisemnie reklamację.

Naprawdę potrzebujemy przełomu technologicznego w tym temacie ...

www.dsp.agh.edu.pl

SIGMAP

Nasz artykuł o modelowaniu ciszy, oddechów itp. w rozpoznawaniu mowy "HMM-based breath and Filled Pauses Elimination in ASR" został przyjęty na konferencji SIGMAP 2014. Jest to bardzo ambitna konferencja, w niektórych latach indeksowana przez Thomson Reuters w Web of Knowledge oraz w Scopusie. Cieszymy się szczególnie, ponieważ głównym autorem tak dojrzałej publikacji i samego toku badań jest student przed obroną pracy magisterskiej - Piotr Żelasko. Gratulujemy!

www.dsp.agh.edu.pl

17 cze 2014

Samsung kupi Nuance?

Taka właśnie plotka krąży. Pisze o tym Wall Street Journal. Czy to by oznaczało że Siri przestanie działać, bo licencja dla Apple zostanie wycofana? W efekcie tej wiadomości akcje Nuance podrożały prawie o 10%. Więcej

dsp.agh.edu.pl

4 cze 2014

2 kwi 2014

Na jakie cyfry stranskrybował się Slayer?

Dawid wpuścił wczoraj na wejście systemu Sarmata ustawionego na rozpoznawanie cyfr piosenkę Slayera. Kto zgadnie jakie cyfry się rozpoznały? ;)