google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

18 lip 2012

Praca na University of Bedfordshire


University of Bedfordshire oferuje grant dla research fellow (12 months, salary + maintenance (accommodation)). It could be a research project for our any Research Institute in any area from here:  http://www.beds.ac.uk/research/institutes

In brief:
- preferably young researcher who has not spent much time in the UK and did not study here
- no more than 8y after obtaining PhD
- will stay for 9-12 months
- can bring a spouse

 CVs (and preferable a brief project idea (half-page)) należy wysyłać jak najszybcie do alexey.bochenkov na skrzynce beds.ac.uk

11 lip 2012

Inżynieria akustyczna ponownie ...

... jednym z najpopularniejszych kierunków studiów na AGH. Zgłosiło się 4,4 osób na miejsce co daje 7 miejsce w tym rankingu. W ważniejszych rankingach ułożonych wg. progu punktowego inżynieria akustyczna była zawsze wyżej. Szczegóły tegorocznej rekrutacji powinny być wkrótce upublicznione. Cieszy także fakt, że na AGH niżu demograficznego nie ma i ogólnie na całą uczelnię także było bardzo dużo zgłoszeń. Więcej w artykule krakow.gazeta.pl.

2 lip 2012

Problemy związane z technologiami mowy


Fragment książki "Przetwarzanie mowy" B. Ziółko i M. Ziółko

Istnieje kilka barier ograniczających rozwój technologii mowy. Pierwsza z nich jest powiązana z jedną z głównych barier rozwoju metod sztucznej inteligencji. Większość metod mniej lub bardziej opiera się na statystykach. Wiarygodność statystyki zależy od ilości danych użytych do ich wygenerowania. Z tego powodu ograniczeniem jakości metod technologii mowy są rozmiary dostępnych zbiorów mowy lub tekstu, zwanych korpusami. Teoretycznie, wiele z modeli działa perfekcyjnie jedynie przy nieskończenie wielkich zasobach szkoleniowych.

Drugim ograniczeniem jest to, że większość metod technologii mowy jest pewnego rodzaju symulacją procesów zachodzących w naszych zmysłach i mózgu. Szczególnie zrozumienie funkcjonowania mózgu jest jak na razie nieosiągalne. Potrafimy bowiem wytworzyć elektroniczne transplanty zastępujące ucho, syntezatory mowy są niemalże idealne. Jednak bardzo duża część przetwarzania informacji zachodzi w mózgu, w oparciu o połączenie danych otrzymywanych aktualnie z różnych zmysłów i porównanie z nabytym doświadczeniem. Proces słuchania jest dużo bliższy zgadywaniu i interpretacji, niż większość z nas podejrzewa. Przykładowo, gdy jesteśmy za granicą, często wydaje się nam, że słyszymy język polski, a po odwróceniu się widzimy osoby narodowości, które nigdy nie posługują się naszym językiem. Po uważniejszym przysłuchaniu, orientujemy się, że to zupełnie inny język.

Wyzwaniem jest również fakt, że użytkownicy nie będą korzystać z systemów, które nie spełniają wygórowanych oczekiwań. Powstrzymuje to rozwój technologii mowy, bo trudno rozwijać systemy bez użytkowników końcowych i ich komentarzy. Większość osób oczekuje od technologii mowy jakości co najmniej takiej, jak możliwości człowieka. Gdy takich nie ma, zniechęcają się do systemu.

30 cze 2012

Popularność Linuksa

Z zaciekawieniem i zdziwieniem zauważyłem w statystykach bloga, że "tylko" 57% wchodzących to użytkownicy Windowsa. Większość reszty wejść to linuksy. Hmm skąd takie odchylenie od statystyk ogółu użytkowników internetu? W sumie blog miał już ponad 20 000 odwiedzin, a najpopularniejszym postem jest ten o programie moich studentów do nauki ustalania częstotliwości na słuch.

25 cze 2012

Diagnozowanie choroby Parkinsona głosem

Ciekawy artykuł na temat zastosowania komputerowej analizy głosu w diagnozowaniu choroby Parkinsona przedstawia BBC. Prowadzone w Wielkiej Brytanii pracy polegają w dużej mierze na gromadzeniu dużej bazy nagrań. Autorzy proszą o zgłaszanie się do nagrań i testów. System wykazał się do tej pory 86% skuteczności. Więcej na BBC.

Wyzwania i możliwe korzyści technologii mowy



Fragment książki "Przetwarzanie Mowy" Bartosz Ziółko, Mariusz Ziółko, Wydawnictwa AGH

Istnieją ciekawe zależności pomiędzy światowym tempem rozwoju technologii mowy w ostatnich dziesięcioleciach a polityką. Najbardziej spektakularny rozwój w zakresie technologii mowy miał miejsce w Stanach Zjednoczonych w czasie zimnej wojny. Pokój skutecznie zwolnił udoskonalanie istniejących rozwiązań. Zagrożenie terrorystyczne spowodowało ponowne pojawienie się potrzeby rozwijania tych technologii, badania ruszyły więc z nowym impetem.

Większość artykułów naukowych ma charakterystyczne dopiski niewielkimi literami na temat źródeł finansowania badań. Zwykle ignoruje się je, ale w wypadku cenionych prac dotyczących rozpoznawania mowy przed latami osiemdziesiątymi, wyróżniają się swoją jednorodnością. Mówimy tu o efektach badań podstawowych dla pracujących systemów, których opisy zawierają niewinne, dość niepraktycznie wyglądające wzory matematyczne. Zawierają jednak także podpisy takie jak „Finansowane przez Siły Lotnicze Stanów Zjednoczonych” lub „Badania dla tej pracy były sponsorowane przez DARPA” (DARPA, czyli Defense Advanced Research Projects Agency). Przez pewien okres akronim skrócono do ARPA. Agencja podlega amerykańskiemu ministerstwu obrony. Została założona w 1958 roku w odpowiedzi na wystrzelenie Sputnika (satelity ZSRR). DARPA została powołana, aby zapobiegać w przyszłości takim niespodziankom, a w praktyce sama zaczęła je sprawiać rywalom Stanów Zjednoczonych.

Nie jest odkrywczym stwierdzenie, że rozwój wielu technologii opiera się na rozwoju techniki wojskowej. Przykładowo, współczesne systemy telekomunikacyjne są następstwem badań mających zaspokoić militarne potrzeby z czasów zimnej wojny. Systemy rozproszonego widma, będące obecnie popularnym sposobem jak najlepszego wykorzystania dostępnego pasma transmisji, mają swój początek w opracowanej wkrótce po drugiej wojnie światowej specjalnej technice radiowego naprowadzania torpedy. W układach transmisyjnych torpedy rozmywano widmo, aby chronić transmisję przed wykryciem częstotliwości sterującej. W zastosowaniach cywilnych rozmycie widma chroni przed zakłóceniami i umożliwia pełne wykorzystanie widma.

Podobnie, systemy telefonii komórkowej wywodzą się z potrzeby decentralizacji wojskowego systemu telekomunikacyjnego, co dobrze ilustruje rysunek z wykładu profesora Jajszczyka, przedstawiający chmurę po wybuchu nuklearnym na tle uproszczonej mapy sieci komórkowej. Nasze przenośne, kochane i tak często kradzione, miniaturowe telefony są więc efektem potrzeby systemu działającego bez niezastępowalnych węzłów komunikacyjnych. Te przykłady są jednak cywilnymi zastosowaniami będącymi następstwem prowadzonych badań na potrzeby wojskowe. Nie każdy zauważa, jak poszczególne ścieżki nauki były i są radykalnie przyspieszane przez polityków. Jeszcze mniej osób zauważa, jak gałęzie nauki są zapominane popadając w stagnację, gdy wielkie życzliwe oko zwróci się w inną stronę.

Dobrym przykładem jest tutaj podbój kosmosu. Pomijając, dość realne teorie wedle których Amerykanie nigdy nie wylądowali na Księżycu, szybkość rozwoju badań w zakresie podboju kosmosu była spektakularna. Pewna osoba zatrudniona swego czasu w NASA nie kryła, że koniec jej pracy w zakresie badań ułatwiających wyprawy pozaziemskie, spowodowany był tym, że sukcesy w kosmosie przestały być potrzebne, a w następstwie fundusze dla NASA stały się dużo niższe. [Z około 5% budżetu państwa do 2/3%]

Mamy tu więc do czynienia z tezą nie do przyjęcia dla wielu osób na gruncie moralnym. Z punktu widzenia rozwoju nauki i techniki, zimna wojna była błogosławieństwem, a jej ostateczny koniec zablokował wiele możliwości. Jak wyglądałoby nasze życie, gdyby nie było konfliktów? Ile spośród powszechnie ułatwiających życie wynalazków nie pojawiłoby się, gdyby na świecie panował pokój? Czy istniałby internet, dziś odbierany za swego rodzaju symbol świata bez granic, medium większości działaczy pokojowych, a spędzający sen z oczu władcom państw totalitarnych? Aby ułatwić odpowiedź na to pytanie, podpowiemy, że protokół TCP/IP został odtajniony przez ARPĘ w 1971, która zaczęła sukcesywnie dołączać kolejne uniwersytety do ARPANETu.

Wbrew pozorom, politycy nie dyktują trendów tylko i wyłącznie w technice i nauce. Ciekawym przykładem jest tutaj Grecja. Badania archeologiczne są potrzebne między innymi, aby udowodnić, że Aleksander Wielki był Grekiem. Oczywiście z podobnych względów, z punktu widzenia rządu niewielkiego, młodego kraju o historycznie słynnej nazwie, Macedonii, warto wydawać pieniądze na wykopaliska, aby pokazać, że Aleksander był jednym z pierwszych Słowian. Nie trzeba zresztą szukać przykładów zbyt daleko. Ustalanie na ile słowiańscy są Kaszubi i Słowianie Połabscy, przypominało wyścig historyków greckich i macedońskich.

Wyzwanie rzucone przez terrorystów otworzyło nową rzekę badań w zakresie technologii informacyjnych. Naukowcy-informatycy zajmują się teraz głównie automatycznymi metodami wspierania śledztwa, wykrywania zagrożeń, prewencją i wspomaganiem sądownictwa. Ponieważ terroryści podważyli przede wszystkim autorytet Stanów Zjednoczonych, to one zajmują się antyterroryzmem z bardzo dużym zaangażowaniem. Nie są to tylko czynności polityczne i militarne, czyli ataki na kraje podejrzewane o wspieranie terroryzmu. Jest to także rozwój metod analizy przesyłanych informacji i sygnałów oraz automatycznego wnioskowania.

Jednakże Europa, a w tym Polska, nie pozostają z tyłu. Co więcej, odnoszą spektakularne sukcesy. Jeden z największych spisków terrorystycznych, któremu udało się zapobiec, to planowany zamach na pokładach samolotów przy użyciu wybuchowych mieszanek płynów, udaremniony przez służby brytyjskie. Dlaczego Brytyjczykom udała się sztuka, z którą kompletnie nie poradzili sobie Amerykanie kilka lat wcześniej? Odpowiedź jest prosta – bo byli przygotowani, zarówno w sensie taktycznym jak i technicznym. Po zamachu na World Trade Centre, w krajach rozwiniętych popłynęły milionowe sumy na sprostanie takim wydarzeniom. Pieniądze te zostały dobrze wydane i dzięki temu terroryści zostali pochwyceni przed zamachem.

To dzięki aktywności terrorystów badania naukowe w wielu dziedzinach ruszyły ponownie z impetem. Powiedzenie, że potrzeba jest matką wynalazku jest niezwykle trafne. Metody dziś opracowywane dla służb śledczych i sądownictwa będą podstawami technologii, które w kolejnym dziesięcioleciu będą ułatwiać nam życie. Bez względu na to, jak się odnosimy do tego zjawiska, które powszechnie oceniamy jako zło, jest ono motywacją i motorem rozwoju, podczas gdy pokój i dobro przynoszą rozleniwienie i stagnację.

Technologie informacyjne nie są obce przestępcom. Tego faktu nie można ignorować. Rozwój niesie za sobą także ryzyko ich wykorzystania przez przestępców. Przykładowo, niedawno w Stanach Zjednoczonych odnotowano pierwsze użycie syntezatora mowy do zawiadomienia o podłożeniu bomby. Profesor Alan Black, jeden z twórców systemu, który został do tego wykorzystany, powiedział, że był bardzo szczęśliwy, że ten kto groził bombą, nie wybrał wersji syntezatora opartego na jego głosie do przekazania groźby.