google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

3 sie 2013

Polskie uczelnie w Webometrics

Ukazał się nowy ranking uczelni Webometrics. Polskie uczelnie niestety nadal wypadają słabo.

rankingWorld Ranksort descendingUniversityDet.Presence Rank*Impact Rank*Openness Rank*Excellence Rank*
1
271
University of Warsaw / Uniwersytet Warszawski
44
249
211
467
2
311
Jagiellonian University / Uniwersytet Jagielloński
90
333
333
441
3
320
Warsaw University of Technology / Politechnika Warszawska
641
206
465
676
4
513
Wroclaw University of Technology / Politechnika Wrocławska
1005
468
464
821
5
526
AGH University of Science & Technology / Akademia Górniczo-Hutnicza Stanisława Staszica w Krakowie
660
473
230
897
6
544
Adam Mickiewicz University Poznan / Uniwersytet Adama Mickiewicza w Poznaniu
554
421
486
1058
7
545
Wroclaw University / Uniwersytet Wrocławski
355
462
497
1001
8
654
Gdansk University of Technology / Politechnika Gdańska
234
591
564
1171
9
709
Nicolaus Copernicus University / Uniwersytet Mikołaja Kopernika w Toruniu
668
748
641
981
10
885
University of Lodz / Uniwersytet Łódzki
1089
1022
760
1205

29 lip 2013

Oferta pracy Samsunga - transkrypcje fonetyczne języka polskiego

"Firma Samsung Polska poszukuje lingwistów specjalizujących się w polskiej fonetyce.
Wymagania:
- ukończone studia magisterskie;
- doświadczenie w sporządzaniu transkrypcji fonetycznych;
- nastawienie na jakość i przywiązywanie uwagi do szczegółów;
- płynna znajomość języka angielskiego.
Dodatkowym atutem będzie:
- stopień doktora;
- ogólna wiedza o lingwistyce komputerowej;
- podstawowa umiejętność programowania;
- wcześniejsze zaangażowanie w projekty związane z przetwarzaniem języka naturalnego.
Forma zatrudnienia: umowa zlecenie.
Czas pracy: koniec sierpnia – koniec października 2013 r., ok. 20-30 godzin tygodniowo.

CV w języku angielskim prosimy przesyłać na adres: a.wojcicka2@partner.samsung.com

CV powinno zawierać poniższą klauzulę:/Wyrażam zgodę na przetwarzanie moich danych osobowych dla potrzeb obecnych oraz przyszłych procesów rekrutacyjnych prowadzonych przez spółkę Samsung Electronics Polska Sp. z o.o. z siedzibą w Warszawie, zgodnie z przepisami ustawy z dnia 29.08.1997r. o ochronie danych osobowych (Dz.U. Nr 133, poz. 883 z późn. zm.)/"

26 lip 2013

Losy absolwentów AGH 2012

Zostały upublicznione ciekawe dane sondażowe o ubiegłorocznych absolwentach AGH. Przebadano prawie 80% osób, tak więc "próbka" jest bardzo reprezentacyjna. Pytania zadawano pół roku po zakończeniu studiów. 76,4% osób pracuje, a 10,7 % szuka pracy ale jej nie ma. Jest to jednak średnia na całej uczelni, a wydziały nas interesujące najbardziej są ścisłą czołówką: EAiIB 91,6% pracuje, 3,5% szuka pracy, IET 90,9% pracuje, 3,8 szuka pracy, IMIR 84,5% pracuje, 7,8% szuka pracy. Ponad połowa osób pracuje w Krakowie, 67,8% w województwie małopolskim. 4,3 % pracuje za granicą. Popularnymi miejscami zatrudnienia są także śląskie i podkarpackie. Z moich własnych obserwacji wynika, że bardzo duża liczba studentów AGH pochodzi z tych województw i sądzę, że zatrudnienie w nich i tak jest mniejsze, więc sporo osób zostaje w Krakowie. 
Najwięcej osób z przebadanych zatrudnił Comarch, w dalszej kolejności Ericpol, samo AGH, Motorola, Sabre, Delphi, ABB i Nokia. Już chyba wiadomo dlaczego Wydziały dawnych samogłosek tak pozytywnie odstają od średniej. Około 5% jest samozatrudniona. Ponad połowa osób pracujących nie poszukiwała pracy lub poszukiwała jej poniżej miesiąca. 80-88 % osób pracuje zgodnie z wykształceniem. Najważniejszymi czynnikami przyjęcia do pracy były: ukończony kierunek studiów, umiejętności komputerowe i motywacja do pracy.

Nigdy więcej IBAI, nigdy więcej MLDM

Zachęciła nas informacja o tym, że materiały konferencyjne MLDM organizowanego przez IBAI ukażą się w ramach serii Lecture Notes Springera. Tak się też stało. Poza tym niestety wiele rzeczy, które się miały stać, stały się trochę inaczej. Wg strony internetowej, cena udziału z przedpłatą miała być 640 EURO. Dość dużo, ale pomyślałem, że napisane jest, że konferencja będzie od 19ego do 25ego, więc długa i w Nowym Jorku, to pewnie sale droższe itd. Później okazało się, ze do 640 Euro należy doliczyć podatek. Z taką praktyką się wcześniej nie spotkałem jeśli chodzi o płacenie za konferencje. Wyszło więc ponad 760 Euro. Pierwsze dwa dni były 3 godzinnymi tutorialami, za które trzeba było dodatkowo płacić, ostatni dzień konferencji został skasowany bo było mało zgłoszeń, a przedostatni skrócony do połowy bo nie wszyscy uczestnicy przyjechali. Tak więc z 7 dni zrobiły się de fact 2,5. Okazało się także, że konferencja nie jest w Nowym Jorku tylko w Newark, a bankiet nie w Empire State Building, tylko w Newark Club. Tak się robi pieniądze na konferencjach ... Nigdy więcej IBAI, nigdy więcej MLDM.

23 lip 2013

Definicje multimediów i sygnałów

Tradycyjnie przez multimedia definiuje się przekaz połączonych mediów, np. wideo i dźwięku, lub obrazu i tekstu itp. Zakończona niedawno IEEE International Conference on Multimedia and Expo, uświadomiła mi dobitnie, że powszechne odczucie jest inne. Około 90% prac dotyczyło wideo i to samego wideo. Tak więc, właściwie nie spełniało warunku definicji multimediów. Drugą w kolejności tematyką były "nowe media" - dotyk, media wynikające z powiązań społecznych itp. O dźwięku nie wiele było mowy, a jeśli już, to głównie w kontekście muzyki. Tak więc IEEE ICME jest niewątpliwie bardzo dobrą konferencją, ale niekoniecznie o multimediach ...

Podobnie dziwny trend zauważyłem odnośnie nazw typu "obrazy i sygnały", tak jakby obrazy nie były sygnałami. Takie może nieprzydatne teoretyzowanie, ale dość ciekawe, a może także jednak warto wiedzieć co ludzie myślą mówiąc multimedia.

www.dsp.agh.edu.pl

Sposoby gromadzenia danych

Fragment książki B. i M. Ziółko, "Przetwarzanie mowy".

Sposoby gromadzenia danych językowych można podzielić na trzy kategorie: nielegalne, tylko na własny użytek i z prawami autorskimi. W Polsce istnieje dość specyficzna sytuacja prawna, która powoduje, że pierwszej kategorii właściwie nie ma. Zgodnie z polskim prawem wolno ściągać z internetu na własny użytek dowolny materiał, nie będący oprogramowaniem, który jest chroniony prawem autorskim. Nielegalna jest jedynie ich dystrybucja. Należy jednak pamiętać, że większość programów peer-to-peer ściąga i rozprowadza równocześnie. Z drugiej strony, takie systemy wymiany plików, nie są najlepszym źródłem materiałów lingwistycznych.

Nasze doświadczenia w gromadzeniu danych językowych opierają się na kilku źródłach. Jedną z opcji są negocjacje z wydawnictwami, organizacjami, radiami itp. Instytucje te dysponują ogromną ilością danych, które byłyby bezcenne w badaniach dla technologii mowy. Jednakże często pojawiają się problemy natury prawnej z udostępnianiem takich materiałów. Nawet jeżeli przepisy prawne nie stoją na przeszkodzie, to często wewnętrzne ustalenia firm są barierą. Tak było na przykład z portalem Nasza-klasa, gdy pytaliśmy o statystyki polskich nazwisk. Niektóre firmy nie są też zainteresowane współpracą, gdyż sprawa z ich punktu widzenia nie przynosi profitów. Nie zajmują się inwestowaniem w rozwój IT, a środki lub promocja, którą mogą zaproponować w zamian zespoły badawcze, są zwykle zbyt małe.

Dużą część materiałów zebraliśmy bezpośrednio z zasobów różnych osób, głównie studentów. W akademikach można znaleźć niesamowite rzeczy, w niesamowitych ilościach. Studenci znali także adresy stron internetowych, z których można było ściągnąć całe biblioteki. Można również pobrać audiobooki, jako nagrania mowy, co więcej, są to zwykle wypowiedzi, do których można także znaleźć wersję tekstową, czyli właściwą książkę. W wypadku audiobooków należy jednak zwrócić uwagę, czy nie był on utworzony z wykorzystaniem syntezatora mowy i czy nie zawiera muzyki lub fragmentów śpiewanych. Nagrania mowy można również uzyskać z radia internetowego. Do tego celu najlepszą stacją jest TOK FM, nadająca wyłącznie wiadomości i wywiady. Trzeba jedynie uważać na drobne wstawki z efektami dźwiękowymi i używać programu, który nie zawiesi się przy długotrwałym odbieraniu strumienia dźwięku z internetu.

www.dsp.agh.edu.pl