Rozpoznawanie Mowy

6 paź 2009

Polecane konferencje w roku 2010

Osobom zainteresowanym rozpoznawaniem mowy i tematami pokrewnymi polecam już ogłoszone konferencje w roku 2010.

The 15th IEEE Mediterranean Electrotechnical Conference 26-28.IV Valletta, Malta zgłoszenia do 26.X
EUSIPCO 23-27.08 Aalborg, Dania zgłoszenia do 5.II /
Interspeech 26-30.09 Makuhari, Japonia zgłoszenia do 30.IV

Informacje na temat pozostałych wartościowych konferencji będę zamieszczał, gdy ukażą się szczegółowe informacje.

22 wrz 2009

Sterowanie grami komputerowymi poprzez ruch oczu

Na targach w Japonii zaprezentowano nowe urządzenie kontrolujące do gier komputerowych. Jest nim czujnik ruchów oka. Będzie więc można wykorzystać w grach ruch oka jako sposób interakcji ze światem gry.

7 wrz 2009

Testy Dragona 10

Otrzymaliśmy zamówione oprogramowanie do rozpoznawania mowy Dragon w wersji 10 firmy Nuance. Do programu dołączony jest bezprzewodowy mikrofon. Przeprowadziłem wstępne testy.

Przygotowanie modeli dla danego użytkownika trwa około 10 minut. Proces polega na czytaniu jednego z 5 tekstów. Program analizuje także dostępne na komputerze teksty. Tworzy na ich podstawie modele stylu wypowiedzi. Należy więc uważać, aby nie wykorzystał do tego zgromadzonych na komputerze plików napisanych przez kogoś innego niż użytkownik. Program działa dla kilku podstawowych dialektów angielskiego. Poprawność rozpoznania szacuję na 70%. Część błędów w wersji zaproponowanej przez Dragona jest niepoprawna gramatycznie, np: "this partners" zamiast "these partners". Należy jednak zwrócić uwagę na to, że mój angielski nie ma w pełni poprawnej wymowy wszystkich słów. Ponadto istnieje możliwość dalszego doszkalania programu, poprzez dyktowanie pozostałych 4 tekstów.

Planujemy przeprowadzić pokaz oprogramowania w ramach koła naukowego Spektrum w naszym nowym laboratorium.

4 wrz 2009

Praca badawcza w Yorku

RESEARCH ASSOCIATE POSITION FOR 3 YEARS (UNIVERSITY OF YORK)
---------------------------------------------------------------------------------------------------------------

Salary: £28,839 per annum.

Applications are invited for a research associate post as part of the EU FP7 funded INDECT Project. INDECT is a collaborative project between a large consortium of universities and organisations in Europe. York’s part of the programme focuses on natural language processing applied to analysis of web documents, blogs and social networks.

The successful applicant should, as a minimum, have a good general education in computer science preferably in computational linguistics. Knowledge and experience in the development and evaluation of natural language processing tools/algorithms will be highly desirable. Ideally, we are looking for someone with a strong background in Natural Language Processing/Machine Learning with at least a PhD and a good publication record.

The research will seek to develop methods for learning from web documents, blogs and social networks. The research is aimed at developing novel methods for relationship mining, social network analysis, detection of abnormal patterns and suspicious behaviour from blogs, emails and websites. The research will involve kernel methods, semi-supervised learning, use of ontological knowledge and reasoning using world knowledge.

Informal enquiries may be made to Dr Suresh Manandhar (suresh at cs.york.ac.uk).

Further information regarding the project

The post is available from 1 October 2009 for three years in the first instance, with the possibility of a further extension.

2 wrz 2009

Windows Mobile 6.5

"Najnowsza wersja mobilnego systemu operacyjnego Microsoftu (Windows Mobile 6.5) pojawi się na rynku 6 października - zapowiedział koncern z Redmond. Tego dnia w sprzedaży mają pojawić się pierwsze telefony, wyposażone w nowy OS.
[...]
Najważniejszą innowacją w nowej odsłonie mobilnego OS-u wydaje się znaczące przeprojektowanie interfejsu użytkownika - wygląda na to, że Microsoft zorientował się, że rysik nie jest optymalnym narzędziem do obsługi menu i wreszcie dostosował Windows Mobile do pełnej obsługi palcami (w nowym systemie mają pojawić się m.in. duże, czytelne ikony).
"
- gazeta.pl

25 sie 2009

Statystyczna długość głosek w języku polskim

Poniżej dane, które zebraliśmy korzystając z Corpory. Kolejne pozycje w każdej lini zawierają sposób zapisu głoski w Corporze, sposób zapisu w standardzie SAMPA, średni czas trwania w milisekundach, odchylenie standardowe, przykład w zapisie ortograficznym oraz fonetyczna transkrypcja tego przykładu. Obserwacje i cel naszych badań zostanie wkrótce opublikowany w postaci artykułu konferencyjnego.

CORPORA SAMPA av. duration [ms] standard dev example transcr.
e e j 174 58 gęś ges’
a o w 166 52 ciąża ts’owZa
sz S 152 59 szyk SIk
s s 132 46 syk sIk
si s’ 130 45 świt s‘vit
c ts 128 41 cyk tsIk
a a 127 48 pat pat
ci ts’ 125 42 ćma ts’ma
cz tS 124 40 czyn tSIn
f f 122 64 fan fan
zi z’ 115 33 źle z’le
e e 111 48 test test
z z 107 34 zbir zbir
rz Z 106 31 żyto ZIto
drz dz’ 103 36 dźwig dz’vik
o o 103 35 pot pot
h x 100 45 hymn xImn
dz dz 100 35 dzwoń dzvon’
u u 99 42 puk puk
t t 98 52 test test
dzi dZ 98 27 dżem dZem
k k 94 45 kit kitk
i i 93 38 PIT pit
p p 93 41 pik pik
n n 91 41 nasz naS
b b 88 27 bit bit
y I 88 43 typ tIp
m m 86 34 mysz mIS
d d 83 29 dym dIm
g g 83 28 gen gen
w v 82 32 wilk vilk
j j 81 34 jak jak
l w 79 33 łyk wIk
ni n’ 76 33 koń kon’
r r 73 30 ryk rIk
l l 72 31 luk luk
N N 72 25 pęk peNk
sp 68 28 cisza wewnątrz słów
sil 15 26 cisza na końcach i początkach nagrań.

25 cze 2009

Rosyjski i Finski

Na SPECOMie 09 bylo sporo artykulow na temat rozpoznawania mowy. W tym duzo rosyjskich, bardzo mnie to ucieszylo ze wzgledu na jego podobienstwo do polskiego, ale niestety po konferencji znajoma, ktora sie sie poklocila z miejscowym srodowiskiem zajmujacym sie ASR, powiedziala mi ze w rzeczywistosci one nie dzialaja i to sprawilo, ze musiala przerwac doktorat.

Nawiazalem tez kontakt z ludzmi z Helsinek, ktorzy chetnie przetestuja ich system dla polskiego, jesli dostarczymy dane. W tej chwili ich system pracuje dla finskiego, estonskiego i tureckiego na sprzyjajacych licencjach. Sa to jezyki jeszcze mocniej morfologiczne niz polski, wiec moze byc ciekawie.