google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

23 lip 2014

Mgr inż. Piotr Żelasko

Jako pierwszy na swoim roku obronił się dzisiaj Piotr Żelasko. Jego praca "Rozpoznawanie mowy w telefonii" została oceniona na 5.0.

"Centrum zainteresowań mojej pracy stanowi problem nauczenia systemu rozpoznawania mowy radzenia sobie z obecnością oddechów i pauz wypełnionych. W szczególności, zajmę się:
-  stworzeniem prostego, pokazowego systemu dialogowego z modułem rozpoznawania mowy opartym na systemie Sarmata [Ziółko et al., 2011];
- przygotowaniem korpusu zawierającego oddechy i pauzy wypełnione wyekstrahowane ze spontanicznej mowy ciągłej;
- opracowaniem rozwiązania, które pozwoli systemowi rozpoznawania mowy osiągnąć lepsze rezultaty podczas rozpoznawania mowy, w której znajdują się wyraźne oddechy i pauzy wypełnione.

W pierwszej kolejności omówię strukturę transferu danych pomiędzy urządzeniem klienta a centralą systemu dialogowego oraz przedstawię przygotowany przeze mnie scenariusz przykładowego systemu dialogowego. Następnie opiszę krótko najważniejsze cechy systemu rozpoznawania mowy i przykładowy sposób połączenia go z systemem dialogowym. Pozostałą część pracy poświęcę na szczegółowy opis oddechów i pauz wypełnionych oraz na przedstawienie mojej metody uwzględnienia ich w modelu wypowiedzi, wraz z wynikami testów."

www.dsp.agh.edu.pl

11 lip 2014

6 lip 2014

Pokonferencyjne artykuły XXII Pacific Voice Conference

IEEE opublikowało wybrane prace organizowanej przez nas XXII Pacific Voice Conference. Zapraszamy do lektury. Prace dotyczą rozpoznawania mówców i mowy, w tym zastosowań do leczenia mowy patologicznej, rozwiajania własnego głosu przez ludzi.

www.dsp.agh.edu.pl

27 cze 2014

Praca w Wenecji :)

*PhD Position in Computer Vision*
*University IUAV of Venice, Italy*
*Closing date: 15th July 2014*

Applications are invited for a fully-funded PhD studentship in Computer Vision. 
The successful candidate will be working on specific projects related to mobile vision and video surveillance. 
The candidate must be grounded in the basics of computer vision, have solid mathematical ability and good programming skills (knowledge of C/C++ and OpenCV is preferable, and basic knowledge on mobile programming - Android/Java - is a good addition, though not mandatory), and have attitude in scientific research and publications.
*Candidates must have a master degree or equivalent.*

The three-year PhD program will take place in the historical city centre of Venice, the most beatiful city in the world. 

Supervisor: Dr Andrea Prati

For expression of interest or enquiries, please contact Dr. Andrea Prati: andrea.prati@iuav.it. You may be asked to participate to a Skype (or equivalent) meeting for a specific informal interview.

24 cze 2014

Pół godziny na infolinii

Dzisiaj próbowałem odblokować telefon który w nie do końca znanych mi okolicznościach został zablokowany gdy byłem w Stanach. Sam początek był tragiczny. W tej samej informacji w której przekazano mi, że nie mogę wykonywać połączeń wychodzących napisano też że mam zadzwonić na infolinię. Gdy odpisałem, że nie mogę zadzwonić bo właśnie zablokowaliście mi telefon, firma nie widziała w tym żadnego problemu.

Potem było coraz gorzej. Zadzwoniłem na wskazany numer z pożyczonego telefonu. Najpierw klapa bo chcą żebym wybrał numer 1 lub 2 a tu ekran dotykowy nieaktywny w trakcie rozmowy... (rozpoznawanie mowy między 1 a 2 to potrafi zrobić 90% naszych studentów).

Przełożyłem nieswoją kartę do swojego telefonu i dzwonię ponownie. Po wybraniu numeru odezwała się Pani, tłumacze jej swój problem, na spokojnie. Ona weryfikuje moją tożsamość pytając o nazwisko i pesel (i to podobno jest bezpieczniejsze od biometrii!!!). Potem mówi żebym czekał. Po kilku minutach wraca i mówi, że ma problemy techniczne i mnie przełączy do koleżanki. Ok. Myślę sobie poznam koleżankę. Niestety nie, kolejny automat i wybór menu. Rozłączam się i dzwonię ponownie do pierwszej. Mówię, że było menu, na co ona to proszę wybrać opcję odblokowanie karty. Acha ... Przełącza mnie. Takiej opcji nie ma, wybieram "czy jesteś naszym klientem - tak". "Podaj identyfikator klienta"... Dzwonię do pierwszej i mówię, że nie pamiętam swojego identyfikatora (a w domu, gdzie mam to zapisane, nie będę miał nie swojej karty sim żeby móc zadzwonić ...). Pani mówi żebym czekał i że mi sprawdzi. Kolejna minuta upływa i mówi że ma problemy techniczne, że spróbuje mnie połączyć jeszcze raz, a jak się nie uda to żebym zadzwonił na pełnopłatny numer bezpośrednio do owej koleżanki (na razie płaciłem tylko 1 zł za każde dzwonienie).

Po przełączeniu pojawiło sie  to samo menu, więc tym razem wybrałem "połącz z konsultantem". Nie było koleżanki, był pan. Tłumaczę swoją sprawę, mówi żebym poczekał, wraca po kilku minutach i mówi żebym zasilił konto. Na co ja że tego już próbowałem i system nie chciał przyjąć ode mnie pieniędzy. Podpowiadam , że może jest jakaś kwota którą trzeba wrzucić gdy numer jest zablokowany. Pan mówi żebym znowu czekał. Po jakimś czasie wraca i mówi, że puści mi melodyjkę i żebym czekał dalej. Kilka minut później melodyjka niepokojąca zarzyna się jakby w analogowym urządzeniu zaczęło brakować zasilania, ale czekam. Pan wraca i mówi żebym spróbował jeszcze raz, a jak się nie uda to spróbował nie przez internet ,tylko w bankomacie i żebym spisywał komunikaty. Jak się z różnych źródeł nie uda, to żebym wysłał pisemnie reklamację.

Naprawdę potrzebujemy przełomu technologicznego w tym temacie ...

www.dsp.agh.edu.pl

SIGMAP

Nasz artykuł o modelowaniu ciszy, oddechów itp. w rozpoznawaniu mowy "HMM-based breath and Filled Pauses Elimination in ASR" został przyjęty na konferencji SIGMAP 2014. Jest to bardzo ambitna konferencja, w niektórych latach indeksowana przez Thomson Reuters w Web of Knowledge oraz w Scopusie. Cieszymy się szczególnie, ponieważ głównym autorem tak dojrzałej publikacji i samego toku badań jest student przed obroną pracy magisterskiej - Piotr Żelasko. Gratulujemy!

www.dsp.agh.edu.pl