BBC opisuje system dla osobom niemówiących umożliwiający wzajemne spotkania z wykorzystaniem syntezy mowy. Prace są prowadzone przez Human-Computer Interaction Group z Wydziału Informatyki na University of York.
google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0
12 gru 2012
11 gru 2012
Seminarium poświęcone finansowaniu badań młodych naukowców
"Rada Młodych Naukowców zaprasza na trzecie seminarium z cyklu „Mechanizmy finansowania badań młodych naukowców w Polsce", które odbędzie się 14 grudnia 2012 roku w Auditorium Maximum Uniwersytetu Jagiellońskiego (przy ul. Krupniczej 33). Początek o godz. 11.00. Celem spotkań jest przybliżenie naukowcom zasad przygotowywania wniosków o granty badawcze. Przedstawiciele Narodowego Centrum Nauki oraz Narodowego Centrum Badań i Rozwoju przedstawiają nie tylko aktualnie oferowane programy, ale także omawiają błędy popełniane przez wnioskodawców oraz doradzają jak ich unikać."
- agh.edu.pl
10 gru 2012
Zasady udanej interakcji człowieka z maszyną
Fragment książki "Przetwarzanie mowy" B. Ziółko i M. Ziółko
Jest wiele zasad tworzenia interfejsów graficznych. Zasady przydatne przy opracowaniu interakcji głosowej nie zostały tak dokładnie przeanalizowane. Jest jednak kilka ogólnych i podstawowych, do których należy się stosować. Komunikacja powinna być szybka. Oznacza to, że użytkownik nie powinien być narażony na wykonywanie żadnych czynności, które nie są niezbędne w danej sytuacji. Przykładowo wymuszanie potwierdzania każdorazowo “tak, to miałem na myśli”, jest wbrew tej zasadzie.
Dobry interfejs powinien także zakładać, że użytkownik ma tendencję do zapominania ważnych rzeczy, jeśli nie są one jego celem. Standardowym przykładem jest to, że bankomaty (w Europie) najpierw oddają kartę, a potem wydają pieniądze. W założeniu (poniekąd słusznym), w odwrotnej sytuacji ludzie często zapominaliby zaczekać na kartę, po otrzymaniu pieniędzy, po które przyszli do bankomatu. W praktyce, w Stanach Zjednoczonych i Azji (gdzie zwykle kolejność jest odwrotna i wiąże się z komendą wysunięcia karty) użytkownicy nawykli do pamiętania o karcie. Jednakże przybysze z Europy często zapominają o odbiorze, co z kolei wiąże się z problemami pojawiającymi się przy braku standaryzacji rozwiązań.
Istotą jest rozumienie potrzeb i możliwości użytkownika. Ludzie mogą więcej danych i słów rozpoznać, niż natychmiastowo wywołać z pamięci. Przykładowo, istnieje gra w której jednym z zadań jest wymyślenie przez parę osób 20 rzeczowników zaczynających się na ustaloną literę. Wbrew pozorom okazuje się to dość trudnym zadaniem, pomimo, że te same osoby rozpoznałyby tysiące takich słów, wertując słownik. Dlatego w wypadku interfejsów graficznych stosuje się raczej listy możliwości, niż opcje wprowadzania z pamięci. W wypadku interfejsu głosowego wiąże się to jednak z zagadnieniem opisanym w kolejnym paragrafie, z którym stoi niestety w sprzeczności, ponieważ syntezowanie wszystkich istniejących możliwości do wyboru byłoby męczące dla użytkownika.
c.d.n.
29 lis 2012
Robot IURO
"W ramach europejskiego projektu powstaje IURO - Interaktywny Robot Miejski. Zadaniem robota będzie np. poruszanie się po mieście. Na podstawie zdobytych od przechodniów informacji IURO będzie musiał np. zrobić zakupy. Na przykładzie IURO naukowcy uczą się, jak powinna przebiegać interakcja między człowiekiem a robotem - opowiada w czasie Dnia Robotów w Centum Nauki Kopernik dr inż. Batłomiej Stańczyk z Accrea Engineering, firmy, która uczestniczy w projekcie." - PAP, więcej.
23 lis 2012
Konferencje w 2013 dotyczące m.in. przetwarzania mowy
Oto konferencje w których warto wziąć udział w 2013 roku zajmując się przetwarzaniem mowy (pierwsza data to termin konferencji, a druga zgłaszania referatów).
- ICASSP 38th International Conference on Acoustics, Speech, and Signal Processing May 26-31 Vancouver 30 November
- NOSSDAV 2013 The 23rd ACM Workshop on Network and Operating Systems Support for Digital Audio and Video February 26 – 27 Oslo Dec 3
- 7th International Conference on COMMUNICATIONS and INFORMATION TECHNOLOGY (CIT '13) Jan 30-1Feb Cambridge, US Nov 30
- 5th International Conference on Future Computer and Communication (ICFCC 2013) 26-27 May Phuket, Tajlandia Dec 1
- IEEE International Conference on Multimedia and Expo (ICME 2013) July 15-19, 2013 San Jose, California December 10
- Cores 2012 27-29 May Miłków 15 December
- 9th International Conference on Machine Learning and Data Mining MLDM 2013 July 19-25 New York 18.12
- International Conference Language Processing and Intelligent Information Systems 17-18 June Warszawa January 17th
- AAAI Conference (AAAI-13) July 14–18 Bellevue, Washington January 19
- Interspeech 2013 25-29 August Lyon
- 36th Int Conf on Telecommunications & Signal Processing JULY 2-4 ROME February 11
- SIGMAP 2013 29-31 July Reyklavik February 22
- The 18th International Conference on Methods and Models in Automation and Control 26-29 August Międzyzdroje Feb 25
- Approaches to Phonology and Phonetics 21-23 June Lublin February 28
- EUSIPCO 2013 9-13 Sept Marrakech 3rd March
- ELMAR 2013 25-27 Sept Zadar March 13 May 20
22 lis 2012
Lingwistyczna baza danych AGH
Nasz artykuł "Special key-value store - Header Only Database for n-gram models" opisujący naszą własną bazę danych stosowaną w systemie rozpoznawania mowy SARMATA, został przyjęty do JOURNAL OF APPLIED COMPUTER SCIENCE. Baza danych jest bazą typu noSQL, ukierunkowaną na szybkie odpowiadanie na zapytania w modelu n-gramowym. Nasze testy pokazały dużo większą wydajność niż SQL oraz trochę lepszą w najbardziej kluczowym operacjach niż BerkeleyDB.
16 lis 2012
SPPRA 2013
Nasz artykuł "Vocal Tract Normalisation in Computer Games" został przyjęty na konferencję Signal Processing, Pattern Recognition and Applications ~SPPRA 2013~ w Innsbruku. Praca opisuje metody modyfikacji głosu ludzkiego na potrzeby tańszego realizowania ciekawszych nagrań do dialogów w grach komputerowych.
Subskrybuj:
Posty (Atom)