google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

25 cze 2012

Wyzwania i możliwe korzyści technologii mowy



Fragment książki "Przetwarzanie Mowy" Bartosz Ziółko, Mariusz Ziółko, Wydawnictwa AGH

Istnieją ciekawe zależności pomiędzy światowym tempem rozwoju technologii mowy w ostatnich dziesięcioleciach a polityką. Najbardziej spektakularny rozwój w zakresie technologii mowy miał miejsce w Stanach Zjednoczonych w czasie zimnej wojny. Pokój skutecznie zwolnił udoskonalanie istniejących rozwiązań. Zagrożenie terrorystyczne spowodowało ponowne pojawienie się potrzeby rozwijania tych technologii, badania ruszyły więc z nowym impetem.

Większość artykułów naukowych ma charakterystyczne dopiski niewielkimi literami na temat źródeł finansowania badań. Zwykle ignoruje się je, ale w wypadku cenionych prac dotyczących rozpoznawania mowy przed latami osiemdziesiątymi, wyróżniają się swoją jednorodnością. Mówimy tu o efektach badań podstawowych dla pracujących systemów, których opisy zawierają niewinne, dość niepraktycznie wyglądające wzory matematyczne. Zawierają jednak także podpisy takie jak „Finansowane przez Siły Lotnicze Stanów Zjednoczonych” lub „Badania dla tej pracy były sponsorowane przez DARPA” (DARPA, czyli Defense Advanced Research Projects Agency). Przez pewien okres akronim skrócono do ARPA. Agencja podlega amerykańskiemu ministerstwu obrony. Została założona w 1958 roku w odpowiedzi na wystrzelenie Sputnika (satelity ZSRR). DARPA została powołana, aby zapobiegać w przyszłości takim niespodziankom, a w praktyce sama zaczęła je sprawiać rywalom Stanów Zjednoczonych.

Nie jest odkrywczym stwierdzenie, że rozwój wielu technologii opiera się na rozwoju techniki wojskowej. Przykładowo, współczesne systemy telekomunikacyjne są następstwem badań mających zaspokoić militarne potrzeby z czasów zimnej wojny. Systemy rozproszonego widma, będące obecnie popularnym sposobem jak najlepszego wykorzystania dostępnego pasma transmisji, mają swój początek w opracowanej wkrótce po drugiej wojnie światowej specjalnej technice radiowego naprowadzania torpedy. W układach transmisyjnych torpedy rozmywano widmo, aby chronić transmisję przed wykryciem częstotliwości sterującej. W zastosowaniach cywilnych rozmycie widma chroni przed zakłóceniami i umożliwia pełne wykorzystanie widma.

Podobnie, systemy telefonii komórkowej wywodzą się z potrzeby decentralizacji wojskowego systemu telekomunikacyjnego, co dobrze ilustruje rysunek z wykładu profesora Jajszczyka, przedstawiający chmurę po wybuchu nuklearnym na tle uproszczonej mapy sieci komórkowej. Nasze przenośne, kochane i tak często kradzione, miniaturowe telefony są więc efektem potrzeby systemu działającego bez niezastępowalnych węzłów komunikacyjnych. Te przykłady są jednak cywilnymi zastosowaniami będącymi następstwem prowadzonych badań na potrzeby wojskowe. Nie każdy zauważa, jak poszczególne ścieżki nauki były i są radykalnie przyspieszane przez polityków. Jeszcze mniej osób zauważa, jak gałęzie nauki są zapominane popadając w stagnację, gdy wielkie życzliwe oko zwróci się w inną stronę.

Dobrym przykładem jest tutaj podbój kosmosu. Pomijając, dość realne teorie wedle których Amerykanie nigdy nie wylądowali na Księżycu, szybkość rozwoju badań w zakresie podboju kosmosu była spektakularna. Pewna osoba zatrudniona swego czasu w NASA nie kryła, że koniec jej pracy w zakresie badań ułatwiających wyprawy pozaziemskie, spowodowany był tym, że sukcesy w kosmosie przestały być potrzebne, a w następstwie fundusze dla NASA stały się dużo niższe. [Z około 5% budżetu państwa do 2/3%]

Mamy tu więc do czynienia z tezą nie do przyjęcia dla wielu osób na gruncie moralnym. Z punktu widzenia rozwoju nauki i techniki, zimna wojna była błogosławieństwem, a jej ostateczny koniec zablokował wiele możliwości. Jak wyglądałoby nasze życie, gdyby nie było konfliktów? Ile spośród powszechnie ułatwiających życie wynalazków nie pojawiłoby się, gdyby na świecie panował pokój? Czy istniałby internet, dziś odbierany za swego rodzaju symbol świata bez granic, medium większości działaczy pokojowych, a spędzający sen z oczu władcom państw totalitarnych? Aby ułatwić odpowiedź na to pytanie, podpowiemy, że protokół TCP/IP został odtajniony przez ARPĘ w 1971, która zaczęła sukcesywnie dołączać kolejne uniwersytety do ARPANETu.

Wbrew pozorom, politycy nie dyktują trendów tylko i wyłącznie w technice i nauce. Ciekawym przykładem jest tutaj Grecja. Badania archeologiczne są potrzebne między innymi, aby udowodnić, że Aleksander Wielki był Grekiem. Oczywiście z podobnych względów, z punktu widzenia rządu niewielkiego, młodego kraju o historycznie słynnej nazwie, Macedonii, warto wydawać pieniądze na wykopaliska, aby pokazać, że Aleksander był jednym z pierwszych Słowian. Nie trzeba zresztą szukać przykładów zbyt daleko. Ustalanie na ile słowiańscy są Kaszubi i Słowianie Połabscy, przypominało wyścig historyków greckich i macedońskich.

Wyzwanie rzucone przez terrorystów otworzyło nową rzekę badań w zakresie technologii informacyjnych. Naukowcy-informatycy zajmują się teraz głównie automatycznymi metodami wspierania śledztwa, wykrywania zagrożeń, prewencją i wspomaganiem sądownictwa. Ponieważ terroryści podważyli przede wszystkim autorytet Stanów Zjednoczonych, to one zajmują się antyterroryzmem z bardzo dużym zaangażowaniem. Nie są to tylko czynności polityczne i militarne, czyli ataki na kraje podejrzewane o wspieranie terroryzmu. Jest to także rozwój metod analizy przesyłanych informacji i sygnałów oraz automatycznego wnioskowania.

Jednakże Europa, a w tym Polska, nie pozostają z tyłu. Co więcej, odnoszą spektakularne sukcesy. Jeden z największych spisków terrorystycznych, któremu udało się zapobiec, to planowany zamach na pokładach samolotów przy użyciu wybuchowych mieszanek płynów, udaremniony przez służby brytyjskie. Dlaczego Brytyjczykom udała się sztuka, z którą kompletnie nie poradzili sobie Amerykanie kilka lat wcześniej? Odpowiedź jest prosta – bo byli przygotowani, zarówno w sensie taktycznym jak i technicznym. Po zamachu na World Trade Centre, w krajach rozwiniętych popłynęły milionowe sumy na sprostanie takim wydarzeniom. Pieniądze te zostały dobrze wydane i dzięki temu terroryści zostali pochwyceni przed zamachem.

To dzięki aktywności terrorystów badania naukowe w wielu dziedzinach ruszyły ponownie z impetem. Powiedzenie, że potrzeba jest matką wynalazku jest niezwykle trafne. Metody dziś opracowywane dla służb śledczych i sądownictwa będą podstawami technologii, które w kolejnym dziesięcioleciu będą ułatwiać nam życie. Bez względu na to, jak się odnosimy do tego zjawiska, które powszechnie oceniamy jako zło, jest ono motywacją i motorem rozwoju, podczas gdy pokój i dobro przynoszą rozleniwienie i stagnację.

Technologie informacyjne nie są obce przestępcom. Tego faktu nie można ignorować. Rozwój niesie za sobą także ryzyko ich wykorzystania przez przestępców. Przykładowo, niedawno w Stanach Zjednoczonych odnotowano pierwsze użycie syntezatora mowy do zawiadomienia o podłożeniu bomby. Profesor Alan Black, jeden z twórców systemu, który został do tego wykorzystany, powiedział, że był bardzo szczęśliwy, że ten kto groził bombą, nie wybrał wersji syntezatora opartego na jego głosie do przekazania groźby.

Brak komentarzy: