google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

9 gru 2009

System rozpoznawania mowy AGH

W miniony wtorek prezentowaliśmy w Będlewie wstępną wersję prototypu naszego systemu. W spotkaniu uczestniczyło wiele znanych osób z polskiego resortu spraw wewnętrznych oraz dowodzący policją Irlandii Północnej i inni zaproszeni goście powiązani z PPBW.

Nasz system jest przystosowany do rozpoznawania pojedynczych słów z listy około 2000 możliwości. Program zawiera możliwość 5-10 minutowego dostosowania do mówcy, ale jest ogólnie niezależny od mówcy. W zakresie oferowanych słów rozpoznanie jest rzędu 80%.



W ciągu roku planujemy rozwinąć system do 10 000 słów z możliwością rozpoznawania mowy ciągłej z zachowaniem istniejącej stopy błędów 80%, będącej standardem w obecnych systemach rozpoznawania mowy dla innych języków.

27 lis 2009

Komunikacja okiem

"W Katedrze Systemów Multimedialnych Politechniki Gdańskiej powstało Cyber-Oko, system pozwalający na poruszanie kursorem komputera za pomocą wzroku, umożliwiający obserwację, na które fragmenty strony internetowej pada wzrok czytelnika, a także badanie koncentracji uwagi u dzieci. Cyber-Oko nagrodzono Medalem Innowacje 2009 na tegorocznych targach Technicon Innowacje, które odbyły się w Gdańsku.

Cyber-Oko to zarazem aplikacja, oprogramowania i nowy sprzęt. Można je własnoręcznie szybko zamontować na monitorze komputera PC, obsługującego system Microsoft XP, Vista lub Windows 7 i spełniającego kilka podstawowych wymagań, określanych w instrukcji obsługi Cyber-Oka.

Wystarczy przyczepić na rzepach w rogach monitora 4 zestawy diod emitujących światło podczerwone, elektroniczny opracowany sterownik diod, kamerę internetową i zainstalować oprogramowanie z płytki CD. Instrukcja montażu określa sposób, w jaki powinny być ułożone poszczególne diody i kamera, aby uzyskać oczekiwany efekt odbicia świateł podczerwonych na źrenicy oka. W odróżnieniu od innych systemów eksperymentalnych, opracowane w Politechnice Gdańskiej algorytmy śledzenia wzroku są na tyle skuteczne, że wykorzystujący je system uzyskuje pełne własności użytkowe - jego praca nie zależy od koloru tęczówki, czy od używania okularów korekcyjnych oraz jest w wysokim stopniu niezależna od ruchów głowy, mrugania powiekami itp.

Osoba korzystająca z systemu powinna siedzieć w odległości ok. 55 cm od monitora, wówczas obraz oka będzie ostry. Pomieszczenie powinno być przyciemnione. Należy unikać światła dziennego ze względu na zawartość w nim promieniowania podczerwonego, które nie pozwoliłoby na odpowiednią pracę diod IR
."

- PAP

23 lis 2009

The Tenth IASTED International Conference on Artificial Intelligence and Applications ~AIA 2010~

Nasz artykuł na temat statystyk n-gramowych słów w języku Polskim został przyjęty na konferencję The Tenth IASTED International Conference on Artificial Intelligence and Applications ~AIA 2010~. Artykuł opisuje statystki, opisane już wcześniej na blogu, i proces ich zbierania. Modelowanie języka Polskiego w oparciu o n-gramy jest w tej chwili jednym z najbardziej priorytetowych kierunków naszych działań. Już wkrótce będziemy mogli przedstawić pierwsze wyniki zastosowania zebranych statystyk do poprawy jakości rozpoznania mowy.

11 lis 2009

The Seventh IASTED International Conference on Signal Processing, Pattern Recognition and Applications

Przyjęto do druku nasz kolejny artykuł na temat ekstrakcji mowy z ze sztucznie zaszumionego sygnału przy pomocy dwóch oddalonych od siebie filtrów. Ten artykuł opisuje 2 nowe podejścia: analizę cross-correlation sygnałów z obu mikrofonów i zastosowanie filtrów adaptacyjnych.

R. Samborski, M. Ziolko, B. Ziolko, J. Galka "Speech Extraction From Jammed Signals In Dual-Microphone Systems", The Seventh IASTED International Conference on Signal Processing, Pattern Recognition and Applications , Innsbruck, 2010.

4th Language & Technology Conference

Kilka dni temu wróciliśmy z 4th Language & Technology Conference. Konferencja wydawała się trochę mniejsza niż jej 3 edycja 2 lata temu. Były 2 długie bloki tematyczne o systemach w zastosowaniach bezpieczeństwa publicznego i rzadkich językach. Była też dyskusja na temat standardów prowadzona przez szefa CLARIN. Otrzymaliśmy także wydaną przez SPRINGERA publikację wybranych i poprawionych artykułów z poprzedniej edycji.

21 paź 2009

Ogłoszenie o pracę w Zespole Przetwarzania Sygnałów AGH

Zespół Przetwarzania Sygnałów planuje zatrudnienie nowej osoby na stanowisku asystenta. Kandydaci proszeni są o przesyłanie CV i listy ocen ze studiów na adres ziolko na serwerze agh.edu.pl. Preferowani będą absolwenci kierunków Elektronika i Telekomunikacja oraz Informatyka mogących wykazać umiejętności i wiedzę w następujących dziedzinach (lub części z nich):
- przetwarzanie sygnałów,
- rozpoznawanie wzorców,
- programowanie (C/C++, Matlab),
- technologie mowy,
- przetwarzanie języka naturalnego,
- systemy uczące się.
Ponadto od kandydatów oczekuje się biegłego posługiwania się językiem angielskim.

9 paź 2009

Praca w Londynie w dziedzinie wielotrybowej analizy niegłosowych zachowań ludzkich

1 x ERC sponsored Postdoctoral (or PhD) Research Associate (Assistant)in Automatic Audiovisual Analysis of Deceptive Behaviour

Applications are invited for a full time Postdoctoral Research Associate OR a PhD Research Assistant to undertake research within the context of an ERC-funded project, ?Multimodal Analysis of Human Nonverbal Behaviour in Real-World Settings?, starting from January 2010.

The project builds on recent developments in Computer Vision, Pattern Recognition and Machine Learning in order to develop methods for recognition and localisation of human behaviours in naturalistic data. Specifically, the successful candidate will be working on development of technology that will be based on findings in cognitive sciences and it will represent a set of visual and audiovisual spatiotemporal methods for automatic analysis of human spontaneous (as opposed to posed and exaggerated) patterns of behavioural cues including continuous analysis of deceptive behaviour.

The successful candidate will be based at Imperial College London, Computing Department, and HCI2 Group, one of UK's leading research groups in vision-based and audiovisual analysis of human behaviour, working with Dr. Maja Pantic (http://www.doc.ic.ac.uk/~maja/).

The position is for 3 years (or maximum 42 months) starting from 1st of January 2010 or as soon as possible thereafter. Starting salary will be in the range £26,580 - £38,730 per annum inclusive of London Allowance.

Further details on this position and how to apply for this position can be found at

https://www4.ad.ic.ac.uk/OA_HTML/OA.jsp?OAFunc=IRC_VIS_VAC_DISPLAY&p_svid=11005&p_spid=570001


The closing date for the applications is Sunday 25th October 2009.