Rozpoznawanie Mowy: lipca 2013

29 lip 2013

Oferta pracy Samsunga - transkrypcje fonetyczne języka polskiego

"Firma Samsung Polska poszukuje lingwistów specjalizujących się w polskiej fonetyce.

Wymagania:

- ukończone studia magisterskie;

- doświadczenie w sporządzaniu transkrypcji fonetycznych;

- nastawienie na jakość i przywiązywanie uwagi do szczegółów;

- płynna znajomość języka angielskiego.

Dodatkowym atutem będzie:

- stopień doktora;

- ogólna wiedza o lingwistyce komputerowej;

- podstawowa umiejętność programowania;

- wcześniejsze zaangażowanie w projekty związane z przetwarzaniem języka naturalnego.

Forma zatrudnienia: umowa zlecenie.

Czas pracy: koniec sierpnia – koniec października 2013 r., ok. 20-30 godzin tygodniowo.

CV w języku angielskim prosimy przesyłać na adres: a.wojcicka2@partner.samsung.com

CV powinno zawierać poniższą klauzulę:/Wyrażam zgodę na przetwarzanie moich danych osobowych dla potrzeb obecnych oraz przyszłych procesów rekrutacyjnych prowadzonych przez spółkę Samsung Electronics Polska Sp. z o.o. z siedzibą w Warszawie, zgodnie z przepisami ustawy z dnia 29.08.1997r. o ochronie danych osobowych (Dz.U. Nr 133, poz. 883 z późn. zm.)/"

26 lip 2013

Losy absolwentów AGH 2012

Zostały upublicznione ciekawe dane sondażowe o ubiegłorocznych absolwentach AGH. Przebadano prawie 80% osób, tak więc "próbka" jest bardzo reprezentacyjna. Pytania zadawano pół roku po zakończeniu studiów. 76,4% osób pracuje, a 10,7 % szuka pracy ale jej nie ma. Jest to jednak średnia na całej uczelni, a wydziały nas interesujące najbardziej są ścisłą czołówką: EAiIB 91,6% pracuje, 3,5% szuka pracy, IET 90,9% pracuje, 3,8 szuka pracy, IMIR 84,5% pracuje, 7,8% szuka pracy. Ponad połowa osób pracuje w Krakowie, 67,8% w województwie małopolskim. 4,3 % pracuje za granicą. Popularnymi miejscami zatrudnienia są także śląskie i podkarpackie. Z moich własnych obserwacji wynika, że bardzo duża liczba studentów AGH pochodzi z tych województw i sądzę, że zatrudnienie w nich i tak jest mniejsze, więc sporo osób zostaje w Krakowie.

Najwięcej osób z przebadanych zatrudnił Comarch, w dalszej kolejności Ericpol, samo AGH, Motorola, Sabre, Delphi, ABB i Nokia. Już chyba wiadomo dlaczego Wydziały dawnych samogłosek tak pozytywnie odstają od średniej. Około 5% jest samozatrudniona. Ponad połowa osób pracujących nie poszukiwała pracy lub poszukiwała jej poniżej miesiąca. 80-88 % osób pracuje zgodnie z wykształceniem. Najważniejszymi czynnikami przyjęcia do pracy były: ukończony kierunek studiów, umiejętności komputerowe i motywacja do pracy.

Nigdy więcej IBAI, nigdy więcej MLDM

Zachęciła nas informacja o tym, że materiały konferencyjne MLDM organizowanego przez IBAI ukażą się w ramach serii Lecture Notes Springera. Tak się też stało. Poza tym niestety wiele rzeczy, które się miały stać, stały się trochę inaczej. Wg strony internetowej, cena udziału z przedpłatą miała być 640 EURO. Dość dużo, ale pomyślałem, że napisane jest, że konferencja będzie od 19ego do 25ego, więc długa i w Nowym Jorku, to pewnie sale droższe itd. Później okazało się, ze do 640 Euro należy doliczyć podatek. Z taką praktyką się wcześniej nie spotkałem jeśli chodzi o płacenie za konferencje. Wyszło więc ponad 760 Euro. Pierwsze dwa dni były 3 godzinnymi tutorialami, za które trzeba było dodatkowo płacić, ostatni dzień konferencji został skasowany bo było mało zgłoszeń, a przedostatni skrócony do połowy bo nie wszyscy uczestnicy przyjechali. Tak więc z 7 dni zrobiły się de fact 2,5. Okazało się także, że konferencja nie jest w Nowym Jorku tylko w Newark, a bankiet nie w Empire State Building, tylko w Newark Club. Tak się robi pieniądze na konferencjach ... Nigdy więcej IBAI, nigdy więcej MLDM.

23 lip 2013

Definicje multimediów i sygnałów

Tradycyjnie przez multimedia definiuje się przekaz połączonych mediów, np. wideo i dźwięku, lub obrazu i tekstu itp. Zakończona niedawno IEEE International Conference on Multimedia and Expo, uświadomiła mi dobitnie, że powszechne odczucie jest inne. Około 90% prac dotyczyło wideo i to samego wideo. Tak więc, właściwie nie spełniało warunku definicji multimediów. Drugą w kolejności tematyką były "nowe media" - dotyk, media wynikające z powiązań społecznych itp. O dźwięku nie wiele było mowy, a jeśli już, to głównie w kontekście muzyki. Tak więc IEEE ICME jest niewątpliwie bardzo dobrą konferencją, ale niekoniecznie o multimediach ...

Podobnie dziwny trend zauważyłem odnośnie nazw typu "obrazy i sygnały", tak jakby obrazy nie były sygnałami. Takie może nieprzydatne teoretyzowanie, ale dość ciekawe, a może także jednak warto wiedzieć co ludzie myślą mówiąc multimedia.

www.dsp.agh.edu.pl

Sposoby gromadzenia danych

Fragment książki B. i M. Ziółko, "Przetwarzanie mowy".

Sposoby gromadzenia danych językowych można podzielić na trzy kategorie: nielegalne, tylko na własny użytek i z prawami autorskimi. W Polsce istnieje dość specyficzna sytuacja prawna, która powoduje, że pierwszej kategorii właściwie nie ma. Zgodnie z polskim prawem wolno ściągać z internetu na własny użytek dowolny materiał, nie będący oprogramowaniem, który jest chroniony prawem autorskim. Nielegalna jest jedynie ich dystrybucja. Należy jednak pamiętać, że większość programów peer-to-peer ściąga i rozprowadza równocześnie. Z drugiej strony, takie systemy wymiany plików, nie są najlepszym źródłem materiałów lingwistycznych.

Nasze doświadczenia w gromadzeniu danych językowych opierają się na kilku źródłach. Jedną z opcji są negocjacje z wydawnictwami, organizacjami, radiami itp. Instytucje te dysponują ogromną ilością danych, które byłyby bezcenne w badaniach dla technologii mowy. Jednakże często pojawiają się problemy natury prawnej z udostępnianiem takich materiałów. Nawet jeżeli przepisy prawne nie stoją na przeszkodzie, to często wewnętrzne ustalenia firm są barierą. Tak było na przykład z portalem Nasza-klasa, gdy pytaliśmy o statystyki polskich nazwisk. Niektóre firmy nie są też zainteresowane współpracą, gdyż sprawa z ich punktu widzenia nie przynosi profitów. Nie zajmują się inwestowaniem w rozwój IT, a środki lub promocja, którą mogą zaproponować w zamian zespoły badawcze, są zwykle zbyt małe.

Dużą część materiałów zebraliśmy bezpośrednio z zasobów różnych osób, głównie studentów. W akademikach można znaleźć niesamowite rzeczy, w niesamowitych ilościach. Studenci znali także adresy stron internetowych, z których można było ściągnąć całe biblioteki. Można również pobrać audiobooki, jako nagrania mowy, co więcej, są to zwykle wypowiedzi, do których można także znaleźć wersję tekstową, czyli właściwą książkę. W wypadku audiobooków należy jednak zwrócić uwagę, czy nie był on utworzony z wykorzystaniem syntezatora mowy i czy nie zawiera muzyki lub fragmentów śpiewanych. Nagrania mowy można również uzyskać z radia internetowego. Do tego celu najlepszą stacją jest TOK FM, nadająca wyłącznie wiadomości i wywiady. Trzeba jedynie uważać na drobne wstawki z efektami dźwiękowymi i używać programu, który nie zawiesi się przy długotrwałym odbieraniu strumienia dźwięku z internetu.

www.dsp.agh.edu.pl

21 lip 2013

MAVEBA 2013

Nasz artykuł "DIFFERENT TYPES OF PAUSES AS A SOURCE OF INFORMATION FOR LANGUAGE MODELING IN ASR" został przyjęty na 8th International Workshop on Models and Analysis of Vocal Emissions for Biomedical Applications, MAVEBA 2013 we Florencji. Nasza praca podsumowuje wstępnie statystyki zebrane w trakcie badań nad pauzami w mowie polskiej. Mogą one mieć zastosowanie zarówno do rozpoznawania mowy jak i charakteryzowania mówcy, a także w medycynie do analizy stanu pacjenta.

www.dsp.agh.edu.pl

18 lip 2013

Kierunki na AGH na które było najtrudniej się dostać

W rekrutacji na studia pierwszego stopnia na AGH w 2013 roku najtrudniej było się dostać na następujące kierunki:
1. Automatyka i Robotyka (EAIiIB) 942
2. Informatyka (IET) 932
3. Informatyka (EAIiIB) 920
4. Inżynieria Akustyczna 908
Teleinformatyka 908

Inżynieria akustyczna utrzymuje swoją wysoką pozycję. Warto także zwrócić uwagę, że po raz pierwszy w historii AGH trudniej się było dostać na kierunek prowadzony po angielsku niż po polsku. Chodzi o Elektronikę i Telekomunikację. Różnica była w prawdzie znikoma (751 i 750 punktów), ale zawsze było odwrotnie i zawsze różnica była zdecydowanie większa.

www.dsp.agh.edu.pl

Szukamy pracowników na stanowiska asystenta naukowego

Szczegóły na ogłoszeniu:
http://www.uci.agh.edu.pl/images/konkursy/dp/88_WIEiT_asystent%20naukowy%202%20stanow..pdf

www.dsp.agh.edu.pl

17 lip 2013

Pacific Voice Conference w Krakowie, 2014

Polska Sekcja IEEE i Instytut Fizjologii i Patologii Słuchu dołączyły do grupy instytucji organizujących XXII Annual Pacific Voice Conference w 2014 roku w Krakowie. Ta edycja konferencji będzie skupiać się na zastosowaniach technologii. Skład organizatorów zapewnia jej najwyższą jakość i popularność. Obecnie trwają rozmowy z firmami zainteresowanymi sponsorowaniem i(lub) prezentacją produktów na PVC.

15 lip 2013

Active Learning na ICME

W San Jose w Kalifornii rozpoczęła się International Conference on Multimedia and Expo i już na samym początku był ciekawy tutorial o active learning. Oczywiście mowa tu o automatycznym uczeniu ... AL zakłada (słusznie) dużą ilość dostępnych danych nie anotowanych. W wypadku mowy mamy na przykład audycje radiowe, nagrania youtube'a itd. W skrócie, metoda polega na znalezieniu danych będących na granicy różnych klas istniejącego modelu. Te dane poddaje się anotowaniu, a z tych które wydaje się łatwo sklasyfikować, rezygnuje się. Wątpliwe dane zostają poddane ręcznej anotacji i użyte do wyćwiczenia nowego modelu.

www.dsp.agh.edu.pl

Podpisanie umowy licencyjnej z ADESCOM Polska

AGH i ADESCOM Polska podpisały umowę licencyjną na korzystanie z systemu rozpoznawania mowy SARMATA. Wdrożeniem systemu do urządzeń ADESCOM zajmuje się spin-off Techmo sp. z o.o.

www.dsp.agh.edu.pl

13 lip 2013

6th Language and Technology Conference (LTC 2013)

Zapraszamy do zgłaszania do 4 sierpnia artykułów na 6th Language and Technology Conference (LTC 2013). Konferencja odbędzie się 7-9 grudnia w Poznaniu. Konferencja będzie poświęcona następującej tematyce:

electronic language resources and tools
formalization of natural languages
parsing and other forms of NL processing
computer modeling of language competence
NL user modeling
NL understanding by computers
knowledge representation
man-machine NL interfaces
Logic Programming in Natural Language Processing
speech processing
NL applications in robotics
text-based information retrieval and extraction
question answering
tools and methodologies for developing multilingual systems
translation enhancement tools
corpora-based methods in language engineering
WordNet-like ontologies
methodological issues in HLT
language-specific computational challenges for HLTs (especially for languages other than English)
validation in all areas of HLTs
HLT standards and best practices
HLTs as a support for foreign language teaching
HLTs as support for e-learning
communicative intelligence
NLP methods in cyber-criminality detection and prevention
legal issues connected with HLTs (problems and challenges)
contribution of HLTs to the Homeland Security problems (technology applications and legal aspects)
visionary papers in the field of HLT
HLT related policies
system prototype presentations

www.dsp.agh.edu.pl

10 lip 2013

Kaiser Hospital

Dzisiaj bylem na wizycie w Kaiser Hospital w Oakland w klinice Speech Pathology. Przygladalem sie zabiegom prowadzonym przez Prof. Izdebskiego, Dr Cruz'a i Dr Song. Polegaja one na czesciowym paralizowaniu miesni, ktore przeszkadzaja w poprawnej wymowie. Zabieg wymaga precyzyjnego pomiaru, ktory miesien i w ktorym miejscu ma byc podany dzialaniu botoksu. Krzysztof Izdebski i Raul Cruz przeprowadzili juz okolo 4000 takich zabiegow.

www.dsp.agh.edu.pl

6 lip 2013

Prawie pięciu kandydatów na miejsce na inżynierii akustycznej

W tym roku, statystycznie aż 4,5 osób ubiegało się o każde miejsce na studiach inżynieria akustyczna, co ustawia kierunek jako 4 najpopularniejszy na AGH.

www.dsp.agh.edu.pl

5 lip 2013

Zgłoszenie patentowe złożone

Nasz rzecznik patentowy potwierdził złożenie naszego międzynarodowego zgłoszenia patentowego w Europejskim Biurze Patentowym.

Data zgłoszenia: 26-06-2013

Numer zgłoszenia: PCT/EP2013/063330

Data pierwszeństwa: 01-05-2013

Tytuł: A SPEECH RECOGNITION SYSTEM AND A METHOD OF USING DYNAMIC BAYESIAN NETWORK MODELS

Zgłaszający: Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie

Twórcy: Bartosz Ziółko, Tomasz Jadczyk

www.dsp.agh.edu.pl

1 lip 2013

Cichsze, lecz równie zrozumiałe komunikaty

PAP opublikowało ciekawy artykuł o badaniach z pogranicza przetwarzania mowy i psychoakustyki. Dotyczą tego jak modulować sygnał mowy, aby mógł być cichszy, nie tracąc walorów komunikacyjnych.

"Naukowcom udało się obniżyć głośność komunikatu nawet o 5 decybeli przy zachowaniu wysokiego poziomu zrozumienia przekazu. Jest to różnica, którą można zobrazować poprzez porównanie hałasu produkowanego przez samochód osobowy do hałasu wytwarzanego przez silnik ciężarówki."

więcej na PAP

29 lip 2013

Oferta pracy Samsunga - transkrypcje fonetyczne języka polskiego

26 lip 2013

Losy absolwentów AGH 2012

Nigdy więcej IBAI, nigdy więcej MLDM

23 lip 2013

Definicje multimediów i sygnałów

Sposoby gromadzenia danych

21 lip 2013

MAVEBA 2013

18 lip 2013

Kierunki na AGH na które było najtrudniej się dostać

Szukamy pracowników na stanowiska asystenta naukowego

17 lip 2013

Pacific Voice Conference w Krakowie, 2014

15 lip 2013

Active Learning na ICME

Podpisanie umowy licencyjnej z ADESCOM Polska

13 lip 2013

6th Language and Technology Conference (LTC 2013)

10 lip 2013

Kaiser Hospital

6 lip 2013

Prawie pięciu kandydatów na miejsce na inżynierii akustycznej

5 lip 2013

Zgłoszenie patentowe złożone

1 lip 2013

Cichsze, lecz równie zrozumiałe komunikaty

Szukaj na tym blogu

Translate

Archiwum bloga

Obserwatorzy

Łączna liczba wyświetleń