google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

8 paź 2012

Praat - doing phonetics by computer

Praat jest darmowym programem do przetwarzania mowy pod kątem fonetyki. Oferuje narzędzia do analizy i syntezy mowy, na bazie zaimplementowanych algorytmów przetwarzania czasowo-częstotliwościowego (w tym filtrowanie, segmentacja, parametryzacja, analiza intonacji, analiza spektralna). Zawiera również podstawowe narzędzia do anotacji mowy, modelowania traktu głosowego, uczenia maszynowego (klasyfikator kNN, sieci neuronowe) i analizy statystycznej (m.in. PCA, analiza dyskryminacyjna).

Program jest lekki (ok. 5 MB, nie wymaga instalacji), ma wyjątkowo prosty i przejrzysty interfejs. Dostępne są wersje na różne systemy operacyjne, jak również kod źródłowy programu. Posiada własny (bardzo przystępny) język skryptowy pozwalający na zautomatyzowanie wielu operacji.

Dzięki dość dużej społeczności użytkowników Praata, powstaje wiele darmowych manuali, tutoriali i toolboxów. Twórcy Praata, Paul Boersma i David Weenink (University of Amsterdam), regularnie aktualizują i wzbogacają program o kolejne funkcjonalności (ostatnia aktualizacja kilka dni temu - wersja 5.3.29).

7 paź 2012

Rozpoznawanie myśli

Naukowcy z UCLA i Technion zbadali aktywność mózgu podczas produkowania dźwięków poszczególnych samogłosek. Ustalenie, które rejony mózgu są odpowiedzialne za kodowanie wytwarzania dźwięków mowy ma być krokiem ku opracowaniu interfejsów umożliwiających komunikację osobom sparaliżowanym.

Źródła: http://www.sciencedaily.com/releases/2012/08/120821143612.htm
http://www.nature.com/ncomms/journal/v3/n8/full/ncomms1995.html#/affil-auth

5 paź 2012

Aktywowany głosem system w samochodach Chryslera

Chrysler wprowadza do oferty wyposażenia auta system UConnect Voice Command, wraz z wbudowanym systemem łączności UConnect Acess. Ma on umożliwiać m.in. sterowanie urządzeniami (np. radiem), korzystanie z nawigacji i wyszukiwarki, jak również dyktowanie wiadomości (będzie kompatybilny ze smartphone'ami posiadającymi Message Access Profile - MAP).

4 paź 2012

'Wyborcy wolą polityków o niższym głosie' - jak profil mowy wpływa na ocenę cech przywódczych


Preferencje wyborców dotyczące wysokości głosu polityków zbadali amerykańscy naukowcy. Okazuje się, że osobom o niższym tonie głosu (zarówno mężczyznom, jak i kobietom) ludzka percepcja podświadomie przypisuje takie cechy jak kompetencje, siła, czy zaufanie.

(C. A. Klofstad, R. C. Anderson, S. Peters. Sounds like a winner: voice pitch influences perception of leadership capacity in both men and women. 
Proceedings of the Royal Society B: Biological Sciences, 2012)


Z kolei jak mówią polscy politycy z punktu widzenia ekspertów mowy - możemy zobaczyć w prezentacji opracowanej przed Prof. Izdebskiego oraz dr Zei-Pollerman w materiale dla Tygodnika Powszechnego:

3 paź 2012

Natural Language Processing - kurs online na platformie Coursera

COURSERA jest internetową plaftormą edukacyjną, umożliwiającą każdemu uczestniczenie w bezpłatnych kursach on-line czołowych światowych uczelni. W COURSERA zaangażowane są m.in. Stanford University, Princeton University,  University of Pennsylvania czy University of Michigan (obecnie łącznie 33 uczelnie).
Kilkutygodniowe kursy mają formę sekwencji filmików edukacyjnych, połączonych z quizzami (i egzaminami online!), można też uzyskać certyfikat potwierdzający ukończenie kursu. W ofercie tematycznej kursów przybywa z miesiąca na miesiąc, powiększa się dynamicznie też społeczność uczestników COURSERA.
Niedawno zapowiedziano kurs Natural Language Processing
Czas trwania: 10 tygodni
Planowany start: 11 luty 2013

2 paź 2012

Między mową a muzyką - 'mówiące pianino'

Ciekawy efekt uzyskał austriacki kompozytor Peter Ablinger, przypisując spektra ludzkiego głosu do dźwięków sterowanego komputerowo mechanicznego pianina:

28 wrz 2012

SNUV.PL

Na stronie snuv.pl powstaje korpus mowy polskiej. Każdy może wziąć udział w nagraniach zarabiając 100 zł za godzinę nagrań.