google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

10 gru 2012

Zasady udanej interakcji człowieka z maszyną


Fragment książki "Przetwarzanie mowy" B. Ziółko i M. Ziółko

Jest wiele zasad tworzenia interfejsów graficznych. Zasady przydatne przy opracowaniu interakcji głosowej nie zostały tak dokładnie przeanalizowane. Jest jednak kilka ogólnych i podstawowych, do których należy się stosować. Komunikacja powinna być szybka. Oznacza to, że użytkownik nie powinien być narażony na wykonywanie żadnych czynności, które nie są niezbędne w danej sytuacji. Przykładowo wymuszanie potwierdzania każdorazowo “tak, to miałem na myśli”, jest wbrew tej zasadzie.

Dobry interfejs powinien także zakładać, że użytkownik ma tendencję do zapominania ważnych rzeczy, jeśli nie są one jego celem. Standardowym przykładem jest to, że bankomaty (w Europie) najpierw oddają kartę, a potem wydają pieniądze. W założeniu (poniekąd słusznym), w odwrotnej sytuacji ludzie często zapominaliby zaczekać na kartę, po otrzymaniu pieniędzy, po które przyszli do bankomatu. W praktyce, w Stanach Zjednoczonych i Azji (gdzie zwykle kolejność jest odwrotna i wiąże się z komendą wysunięcia karty) użytkownicy nawykli do pamiętania o karcie. Jednakże przybysze z Europy często zapominają o odbiorze, co z kolei wiąże się z problemami pojawiającymi się przy braku standaryzacji rozwiązań.

Istotą jest rozumienie potrzeb i możliwości użytkownika. Ludzie mogą więcej danych i słów rozpoznać, niż natychmiastowo wywołać z pamięci. Przykładowo, istnieje gra w której jednym z zadań jest wymyślenie przez parę osób 20 rzeczowników zaczynających się na ustaloną literę. Wbrew pozorom okazuje się to dość trudnym zadaniem, pomimo, że te same osoby rozpoznałyby tysiące takich słów, wertując słownik. Dlatego w wypadku interfejsów graficznych stosuje się raczej listy możliwości, niż opcje wprowadzania z pamięci. W wypadku interfejsu głosowego wiąże się to jednak z zagadnieniem opisanym w kolejnym paragrafie, z którym stoi niestety w sprzeczności, ponieważ syntezowanie wszystkich istniejących możliwości do wyboru byłoby męczące dla użytkownika.

c.d.n.

29 lis 2012

Robot IURO

"W ramach europejskiego projektu powstaje IURO - Interaktywny Robot Miejski. Zadaniem robota będzie np. poruszanie się po mieście. Na podstawie zdobytych od przechodniów informacji IURO będzie musiał np. zrobić zakupy. Na przykładzie IURO naukowcy uczą się, jak powinna przebiegać interakcja między człowiekiem a robotem - opowiada w czasie Dnia Robotów w Centum Nauki Kopernik dr inż. Batłomiej Stańczyk z Accrea Engineering, firmy, która uczestniczy w projekcie." - PAP, więcej.

23 lis 2012

Konferencje w 2013 dotyczące m.in. przetwarzania mowy

Oto konferencje w których warto wziąć udział w 2013 roku zajmując się przetwarzaniem mowy (pierwsza data to termin konferencji, a druga zgłaszania referatów).





22 lis 2012

Lingwistyczna baza danych AGH

Nasz artykuł "Special key-value store - Header Only Database for n-gram models" opisujący naszą własną bazę danych stosowaną w systemie rozpoznawania mowy SARMATA, został przyjęty do JOURNAL OF APPLIED COMPUTER SCIENCE. Baza danych jest bazą typu noSQL, ukierunkowaną na szybkie odpowiadanie na zapytania w modelu n-gramowym. Nasze testy pokazały dużo większą wydajność niż SQL oraz trochę lepszą w najbardziej kluczowym operacjach niż BerkeleyDB.

16 lis 2012

SPPRA 2013

Nasz artykuł "Vocal Tract Normalisation in Computer Games" został przyjęty na konferencję Signal Processing, Pattern Recognition and Applications ~SPPRA 2013~ w Innsbruku. Praca opisuje metody modyfikacji głosu ludzkiego na potrzeby tańszego realizowania ciekawszych nagrań do dialogów w grach komputerowych.

15 lis 2012

Komunikacja człowieka z maszyną


Fragment książki "Przetwarzanie mowy" B. Ziółko i M. Ziółko

Maszyny i komputery coraz intensywniej wkraczają w nasze życie. Wykonują dla nas i za nas pracę. Czasami nas zabawiają, czasami ratują. Coraz częściej ograniczeniem nie jest możliwość wykonania określonej czynności przez maszynę lub komputer, ale problemem jest sformułowanie istniejącej potrzeby przez niewykwalifikowaną osobę. Zatem istotne są kolejne ułatwienia w dialogu człowieka z komputerem.


Stosowano różne metody komunikacji człowieka z maszyną, od prawie zapomnianych taśm papierowych i kart z dziurkami po klawiaturę. Na przestrzeni lat, komunikacja człowieka z maszyną ewoluowała w stronę upodabniania się do komunikacji międzyludzkiej. Najwygodniejszą dla nas metodą jest oczywiście rozmowa i dlatego technologie mowy można traktować jako docelowe sposoby komunikacji człowieka z maszynami, co pokazują liczne filmy gatunku science-fiction z Odyseją Kosmiczną i komputerem pokładowym HAL 9000 na czele. Są one najwygodniejsze i nie wymagają, od użytkownika przeszkolenia. Stworzenie interfejsu głosowego jest jednak sprawą trudną. Wymaga pokonania zarówno trudności koncepcyjnych jak i sprzętowych, bo komputery osobiste muszą być odpowiednio efektywne. Wspomniany HAL 9000 jest jednak realną rzeczywistością.