22 gru 2011

O nas na stronie głównej AGH

"Dynamiczny rozwój branży IT już od wielu lat kreśli kierunek rozwoju instytucji, przedsiębiorstw, a nawet całych gałęzi przemysłu. W tej dziedzinie to, co jeszcze wczoraj nie było możliwe, jutro stanie się faktem. Bogactwo pomysłów i rozwiązań jest wprost niewyobrażalne. Dowodem na to, a zarazem kolejną cegiełką w rozwoju technologii informatycznych, jest urządzenie opracowane przez naukowców z Akademii Górniczo-Hutniczej, które możemy określić jako słuchającego wirtualnego doradcę. Nowatorstwo pomysłu polega na opracowaniu programu umożliwiającego rozmowę z komputerem w języku polskim. [...]"
- Ilona Trębacz, Biuletyn AGH

2 gru 2011

Przetwarzanie mowy

Właśnie odebraliśmy pierwsze egzemplarze naszej monografii "Przetwarzanie mowy" opublikowanej przez Wydawnictwa AGH.

Monografia poświęcona jest technologiom mowy ze szczególnym uwzględnieniem języka polskiego. Opisuje historię badań i rozwoju w dziedzinie przetwarzania mowy. Przedstawia liczne aspekty teorii sygnałów jednowymiarowych, zarówno analogowych jak i cyfrowych. Prezentuje zagadnienia filtracji, analizy częstotliwościowej i teorii falek. Opisano również metody parametryzacji, segmentacji i odszumiania sygnału mowy. Zobrazowano sposoby kompresji i standardowe techniki kodowania sygnału mowy w telekomunikacji. Przedstawiono metody klasyfikacji i modele stosowane w rozpoznawaniu mowy i mówców, w tym modele językowe. Omówione zostały zarówno standardowe rozwiązania, takie jak niejawne modele Markowa czy n-gramy, jak i te mniej znane, zwłaszcza powiązane z badaniami prowadzonymi przez autorów i ich współpracowników. Krótko scharakteryzowano inne technologie mowy, takie jak synteza mowy, systemy dialogowe czy rozpoznawanie emocji w sygnale mowy. Dokonano podsumowania osiągnięć i dostępnych zasobów akademickich i komercyjnych, szczególnie dla technologii mowy polskiej.

Streszczenie, spis treści i pierwszy rozdział są dostępne w pdfie.

28 lis 2011

I miejsce AGH w rankingu „Kuźnia prezesów”!

AGH odniosło wielki sukces wyprzedzając Politechnikę Warszawską i zajmując pierwsze miejsce w kluczowym i najbardziej przejrzystym rankingu oceniającym losy absolwentów "Kuźnia prezesów" Rzeczpospolitej.

21 lis 2011

Audiowizualny korpus mowy

Wykonaliśmy audiowizualny korpus mowy polskiej. Wszelkie znaki na niebie i w internecie pokazują, ze jest to pierwszy taki korpus, w sensie pierwszy dla naszego języka. Szczegóły na stronie Zespołu.

17 paź 2011

LTC 2011 w Poznaniu

Nasz artykuł "Impact of choice of training data and patterns reduction in speaker dependent speech recognition" został przyjęty na 5th Language & Technology Conference w Poznaniu. Praca prezentuje wyniku eksperymentów wykorzystania różnych baz wzorców akustycznych w rozpoznawaniu mowy.

20 wrz 2011

Praca dla fonetyka, lingwisty

Company Profile:

Lionbridge is the leading provider of translation, development, language and testing solutions that enable clients to create, release, manage and maintain their technology applications and Web content globally. A key differentiator for Lionbridge is our global footprint, which enables us to deliver superior service to customers through local contacts and resources.

We employ more than 4,200 specialists, including linguists, project managers, engineers, subject matter experts, content developers, application developers and quality assurance professionals, in 26 countries. We also work with a network of 85,000 independent multilingual workers including translators, interpreters, web raters and subject matter experts across more than 100 countries.
For more information on our company and services, please see our Web site at http://www.lionbridge.com.





Position Description



We are looking for native Polish Phoneticians and Linguists



Required Skills/Background

v For Phoneticians: Master’s in Linguistics with strong background on Phonetics or Master’s in Phonetics. For Linguists: Education: Master’s in Polish Linguistics or Computational Linguistics.

v Native language Polish

v Experience in reviewing/annotating texts

v Experience in Language Technology, particularly in Speech Processing - either educational or work experience

v Experience in corpus/dictionary/terminology work

v Great attention to detail while working efficiently

v Good organizational and analytical skills, ability to work in a logical and methodical way

v Good communication skills

v Excellent English skills, other language skills are a plus

v Possibility to work part-time or fulltime form home on freelancer basis starting ASAP

Please send your application, CV and your hourly rate request to jobs.tampere na serwerze lionbridge.com ASAP.

15 wrz 2011

Zostań twarzą Wirtualnego Doradcy jednej z największych polskich instytucji

Stanusch Technologies jeden z największych na świecie dostawców tzw. Wirtualny Doradców - poszukuje dla swojego klienta – jednej z największych polskich organizacji, osób które staną się twarzą (wizerunkiem) tzw. Wirtualnego Doradcy. Wirtualny Doradca to postać umieszczana na stronie internetowej z którą można prowadzić rozmowę w języku naturalnym. Przykład Wirtualnego Doradcy można zobaczyć na firmowej witrynie naszej firmy pod adresem www.stanusch.com

Z osobami (kobieta i mężczyzna), które zostaną wybrane, zostanie nagranych kilkadziesiąt mikro-scen (kilkusekundowych ujęć), które zostaną następnie wykorzystane w Wirtualnym Doradcy. Sceny są nagrywane bez nagrania głosu. Przewidywany czas nagrania to jeden dzień roboczy. Planowany termin nagrania: przełom września/października.

Oferujemy atrakcyjne wynagrodzenie za dzień zdjęciowy oraz wynagrodzenie za prawa do wykorzystania wizerunku.
Zapewniamy zwrot kosztów dojazdu do miejsca wykonywania zdjęć oraz pokrycie kosztów hotelu i wyżywienia. W trakcie realizacji zdjęć dostępny będzie profesjonalny stylista i makijażystka.

Wymagania:
· Wiek 35-45 lat (ze wskazaniem na osoby młodsze) lub osoby wyglądające na wskazany wiek. Osoba powinna być zadbana, sprawiać wrażenie sympatycznej, bez wyraźnych znamion na twarzy. Mężczyzna powinien być ogolony - bez brody i wąsów.
· Umiejętność naturalnego zachowania się przed kamerą.
· Wyrażenie zgody na wyłączne wykorzystanie wizerunku przez klienta Stanusch Technologies.

Osoby zainteresowane współpracą proszone są o przesłanie swoich danych kontaktowych oraz swojego zdjęcia (lub zdjęć) na adres email izabela.oszek@stanusch.com Zdjęcie - najlepiej przedstawiające osobę w planie amerykańskim (od kolan w górę), zrealizowane na jednolitym tle - powinno przedstawiać osobę ubraną w „stylu biurowym”:
W przypadku kobiety – garsonka, koszula, ew. apaszka., upięte włosy.
W przypadku mężczyzny – garnitur, koszula, krawat

13 wrz 2011

Współpraca ze Stanusch Technologies

AGH podpisało umowę licencyjną na komercjalizację systemu rozpoznawania mowy AGH przez spółkę giełdową Stanusch Technologies. Umowa zapewnia długotrwałą współpracę między partnerami. Systemy zostały już zintegrowane, trwają zaawansowane prace nad pierwszymi wdrożeniami.

8 wrz 2011

Zlecenie programistyczne

Poszukujemy firmy do realizacji niewielkiego zlecenia programistycznego według poniższej specyfikacji. Prosimy o wysyłanie skan podpisanej ręcznie oferty z proponowaną ceną i okresem realizacji na konto bziolko na serwerze agh.

Specyfikacja Analizatora Algorytmów Segmentacji ASR AGH

System operacyjny: Windows 7
Program ma sprawdzać skuteczność metody dzielenia na fonemy opracowanej na AGH poprzez porównanie z ręcznie anotowanymi danymi w standardzie MLF.

Opis działania:
Program wczytuje 2 grupy plików MLF - pliki z danymi wzorcowymi i pliki analizowane. Następnie porównuje czasy tych samych fonemów w obu wersjach.
Program prezentuje statystyczną ocenę tego porównania: ilość segmentów zgodnych i niezgodnych, średnie odchylenie, maksymalne i minimalne, zarówno dla pojedynczych typów fonemów indywidualnie, jak i wspólnie dla całości alfabetu fonetycznego.

Dodatkowo program umożliwia wyświetlenie dla każdego typu fonemów listy miejsc i podglądu plików MLF dla których wystąpiły różnice w czasie trwania fonemu wraz z informacją o tej różnicy.

Program generuje także statystyki kontekstowe – umożliwia wybór informacji o różnicach w czasach trwania segmentów w zależności od lewego i prawego kontekstu występowania fonemu (domyślne ustawienie dla prezentacji: wszystkie konteksty).

Uwagi: Zlecenie zakłada przekazanie kodu źródłowego, który może podlegać dalszej pracy zespołu DSP AGH. Zlecenie zakłada także możliwość dalszej sprzedaży przez AGH wykonanego oprogramowania. W wykonaniu zlecenia nie mogą brać udziału pracownicy AGH.

2 wrz 2011

Nagroda

Otrzymaliśmy nagrodę za najlepszy artykuł w technikach modelowania matematycznego na konferencji Emerging Security Technologies w Preston za artykuł "Hybrid Wavelet-Fourrier-HMM Speaker Recognition" opisujący nasz dwugałęziowy system rozpoznawania mówców.

1 wrz 2011

Rozpoznawanie twarzy

Dzisiaj wyjątkowo nie o dźwiękach, a o obrazach. Wczoraj przechodziłem odprawę paszportową w na lotnisku w Londynie. Była to całkowicie zautomatyzowana odprawa, bez udziału oficera. Przykłada się paszport do skanera, który pobiera dane biometryczne z niego. System wpuszcza petenta do komory w której jest się na chwilę zamykanym. Fotografuje nas kamera i na tej podstawie, podejmowana jest decyzja o wpuszczeniu do kraju.

Jest to fascynujące nie tylko ze względu na możliwości techniczne, ale także prawo które zezwala komputerom podejmować takie decyzje! Warto zaznaczyć, że opcja takiego przekroczenia granicy dotyczy jedynie nowych paszportów europejskich (tych z symbolem przypominającym trochę aparat fotograficzny).

21 lip 2011

Zlecenie zewnętrzne dla programisty

Zlecę wykonanie niewielkiego interfejsu wykorzystującego gotową bibliotekę (konieczne wystawienie faktury, a więc jest to praca dla programisty z własną firmą). Szczegóły przez email (bziolko na serwerze agh).

20 lip 2011

Wyniki rekrutacji na studia

Inżynieria Akustyczna była czwartym z kierunków studiów AGH na które było się najtrudniej dostać.

Automatyka i Robotyka 917 pkt
Informatyka 887 pkt
Informatyka Stosowana 884 pkt
Inżynieria Akustyczna 882 pkt
Budownictwo 860 pkt
Geodezja i Kartografia 833 pkt

Pozostałe progi punktowe.

18 cze 2011

XVII Krajowej Konferencji Zastosowań Matematyki w Biologii i Medycynie

Nasz artykuł poświęcony zastosowaniu analizy falkowo-Fourierowskiej w rozpoznawaniu mówców został przyjęty na XVII Krajowej Konferencji Zastosowań Matematyki w Biologii i Medycynie. Późniejsze eksperymenty pokazały, że metoda ta jest bardzo obiecującym uzupełnieniem klasycznych metod opartych na MFCC i HMM.

29 maj 2011

Interspeech 2011

Demonstracja naszego systemu rozpoznawania mowy będzie prezentowana na Interspeech 2011 jako artykuł "Automatic Speech Recognition System Dedicated for Polish".

28 maj 2011

Wirtualna Mysz

Rozpoczynamy pilotowe wdrożenie głosowego interfejsu wirtualnej myszy jako projekt Młodych Naukowców będący częścią działalności statutowej WEAiE AGH. Realizacja zaplanowana jest we współpracy z Fundacją Mimo Wszystko Anny Dymnej.

23 maj 2011

Licencja dla SnapKeys

Firma SnapKeys kupiła licencję na nasz słownik frekwencyjny, w celu wykonania ich wirtualnej klawiatury dla naszego języka. Ciekawie kiedy pojawi się na dostępnym w sklepach sprzęcie.

14 kwi 2011

Archives of Acoustics

Nasz artykuł B. Zi ółko, S. Manandhar , R. C. Wilson , M. Zi ółko, „Phoneme Segmentation Based on Wavelet Spectra Analysis” ukazał się w Archives of Acoustics, 2011, vol. 36, No. 1 znajdującej się na Liście Filadelfijskiej.

13 kwi 2011

Google coraz bliżej opracowania idealnego systemu rozpoznawania mowy

"Serwis Slate przyjrzał się dokładnie technologii rozpoznawania mowy, nad którą pracuje Google. Okazuje się, że do tej pory właściwie nie można było mówić o skutecznym rozpoznawaniu ludzkiego głosu, jednak gigant z Mountain View skompletował już niemal wszystko, co jest do tego niezbędne. [...]"
- di.com.pl

2 kwi 2011

Oferta pracy na AGH dla programisty

Zespół Przetwarzania Sygnałów w Katedrze Elektroniki poszukuje kandydata do pracy na stanowisku programisty w wymiarze około 10 godzin tygodniowo, rozliczanej w formie umów o dzieło. Preferowani będą studenci ostatnich lat kierunku Informatyka lub pokrewnych, mogący wykazać się umiejętnościami i wiedzą w następujących dziedzinach (lub części z nich):
• programowanie: C++, .NET(Visual C++, C#),
• programowanie w językach skryptowych (np: Python, Ruby),
• znajomość baz danych SQL (szczególnie MySQL, MS SQL),
• programowanie interfejsów użytkownika w środowisku Windows (np: Windows Presentation Foundation, Windows Forms, Qt)

ZAKRES OBOWIĄZKÓW:
Pomoc w programowaniu systemu w dziedzinie rozpoznawania zarówno mowy polskiej jak i mówców, ze szczególnym uwzględnieniem integracji z istniejącymi systemami zarządzania danymi i przygotowywania aplikacji dla użytkowników końcowych korzystając z gotowych rozwiązań, zrealizowanych głównie w języku .NET.

Praca dostępna od zaraz.
Istnieje możliwość potraktowania wspomnianych realizacji jako projektu inżynierskiego lub pracy magisterskiej.

Kandydaci proszeni są o przesyłanie CV i listy ocen ze studiów na adres bziolko na serwerze agh.edu.pl.

3 mar 2011

Anotator

Nasz artykuł "Semisupervised production of speech corpora using existing recordings" opisujący niedawno powstałe narzędzie programistyczne do szybkiego robienia profesjonalnych korpusów mowy, wraz z pierwszym utworzonym przy jego wykorzystaniu korpusem, został przyjęty do prezentacji na konferencji International Seminar on Speech Production (ISSP'11) .

12 lut 2011

Sztuczna ręka sterowana myślami

"[...] Mechaniczna ręka powstała na zlecenie amerykańskiej Agencji Zaawansowanych Obronnych Projektów Badawczych - DARPA. [...] Mechaniczna kończyna potrafi się obracać, zginać i skręcać na 27 różnych sposobów. Posiada ona zdolności chwytne i nie powinna uszkodzić nawet kruchych przedmiotów. Kieruje się nią po wszczepieniu do mózgu mikroczipu monitorującego aktywność neuronów i przetwarzającego ją na sygnały rozumiane przez protezę. [...]"
- Krzysztof Pielesiek, gazeta.pl

24 sty 2011

Oferta pracy w Portugalii

2 EARLY STAGE RESEARCHER POSITIONS - Marie Curie Initial Training Network -
“An Early Stage Training Network in Enabling Technologies for GREEN Radio"
(GREENET)

**********************************************************
ref:
GREENET/IT_1
GREENET/IT_2

**********************************************************

DESCRIPTION

Two Early Stage Researcher (ESR) positions are available at the 4TELL Team
of the Aveiro Pole of the Instituto de Telecomunicações, Portugal. These
Positions are funded by the European Commission under the Marie Curie
Initial Training Network Programme (project GREENET).
We address (pre-PhD) researchers with an MSc aiming at significantly
improving their career perspectives from both the PUBLIC and PRIVATE sector.
The duration of the appointment is 3 years with a possibility of extension
funded from other sources. Applicants may also request to be considered as
candidates for PhD programs.
Research Topic:

IT_1 Profile
ESR candidates are expected to have good knowledge in the following areas:

* Modelling/simulation tools: such as NS-2, NS-3, OMNET, Matlab,
Mathematica;
* Trafic modelling: Markov Chains, Game Theory, Queuing Theory,
Information Theory, and Probability Theory.

Not mandatory, but preference will be given to ESR candidates with:

* Strong mathematical background;
* Knowledge in network coding paradigm;
* Knowledge/experience in the design of short-range cooperative MAC
protocols for wireless networks (including relay selection algorithms and
relaying strategies e.g., amplify and forward, decode and forward, and
compress and forward).

IT_2 Profile
ESR candidates are expected to have good knowledge in the following areas:

* Network security: Authentication protocols and methods, cryptography
algorithms, key management solutions

Not mandatory, but preference will be given to ESR candidates with:

* Good mathematical background;
* Knowledge/experience in 802.21 protocol;
* Knowledge/experience with green (power efficient) technologies;

ESR candidates (IT1 and IT2) must also be capable of:

* Co-supervision Master students;
* Conduct top-notch research and to pursue research excellence at the
national, European, and international levels;
* Perform cooperative research in collaboration with other researchers
from industry and academia in a well established Network.Junior or
experienced researchers from both the PUBLIC and PRIVATE sector, with an MSc
in the areas of Computer Science, Mathematics in Computer Science,
Electronics & Electrical Engineering or related areas, are highly encouraged
to apply for these positions.

The recruited ESR will work in close collaboration with the other academic
partners of the project:

* Universidad Polytecnica de Catalunya (Spain)
* The University of Edinburg (United Kingdom)
* University of Trento (Italy)
* NCSR Demokritos (Greece)
* Telecommunications Technological Centre of Catalonia (Spain)

and with the possibility of collaboration with researchers from the
industry:

* WEST Aquila (Italy)
* Acticom (Germany)
* EADS (France)
* Innoroute (Germany)

**********************************************************

ELIGIBILITY

* The recruited researchers should be, at the time of selection, in the
first four years of their research careers (measured from the date when they
obtained the degree which would formally entitle them to embark on a
doctorate).
* Also: ESR should not already have a PhD and they should have the
qualifications to embark on a PhD program.
* ESR should be nationals of a country other than Portugal or, in case
they are Portuguese nationals, they should have legally resided and have had
their principal activities (work, studies, etc.) in a third country for at
least 3 out of the last 4 years,.
* ESR (regardless of their nationalities) must not have resided or
carried out their main activities (work, studies, etc.) in Portugal for more
than 12 months in the last 3 years.

**********************************************************
FINANCIAL PROVISIONS

Marie Curie ITNs provide competitive financial support to the ESR including:

* a competitive monthly living and mobility allowance,
* a yearly travel allowance (i.e., a fixed amount of money based upon
the direct distance between the location of origin of the researcher and
Aveiro, Portugal),
* a career exploratory allowance (i.e., a single payment for attending
job interviews, additional courses, job fairs, etc.), and
* coverage of the expenses related to the participation of the ESR in
research and training activities (contribution to research-related costs,
meetings, conference attendance, training actions, etc.).

**********************************************************

INFORMAL ENQUIRIES

Informal email enquiries can be made to Dr. Jonathan Rodriguez:
jonathan@av.it.pt. For further information on the Instituto de
Telecomunicações and the 4 TELL team, please visit the following sites:
http://www.it.pt/ and http://www.av.it.pt/4tell.


***********************************************************

APPLICATIONS

To apply, please send by email: a cover letter detailing your suitability
for the position in question; detailed CV; and the name and address of two
referees to support your application. All applications should be sent to:
greenet@cttc.es and cbarbosa@av.it.pt.

The closing date for applications is 15th March 2011.

___________________________________________________________
Cláudia Barbosa

Instituto de Telecomunicações – Aveiro
Campus Universitário de Santiago
3810-193 Aveiro
PORTUGAL

22 sty 2011

Scarlett Mansion dostępny w Internecie

Wersja 0.1 gry Scarlett Mansion zaprojektowanej i koordynowanej przez mnie, a wykonanej przez studentów jest już ogólnie dostępna. Dokumentacji i opis po angielsku.
Komentarze i sugestie na przyszłość mile widziane.

15 sty 2011

Konkurs na rozpoznawanie dźwięków



Rusza międzynarodowy konkurs informatyczny, organizowany przez TunedIT - polską internetową platformę badawczą, we współpracy z naukowcami z Politechniki Warszawskiej i Politechniki Gdańskiej. Szacuje się, iż w konkursie weźmie udział kilkuset pasjonatów sztucznej inteligencji, z całego świata. Konkurs, który patronatem honorowym objął Wojewoda Mazowiecki Pan Jacek Kozłowski, organizowany jest przy międzynarodowej konferencji ISMIS 2011, która w tym roku odbędzie się w Warszawie. W konkursie wziąć udział może każdy. Wystarczy zalogować się na stronie www.tunedit.org. A warto, bo suma nagród dla zwycięzców to aż 2000 dolarów.
Uczestnicy zmierzą się z dwoma bardzo ciekawymi zadaniami:
1. Automatyczne rozpoznawanie gatunku muzyki - zadanie będzie polegało na stworzeniu programu automatycznie klasyfikującego muzykę jako np. rock, pop, jazz.
2. Automatyczne rozpoznawanie instrumentów - zadaniem jest stworzenie programu wyróżniającego współgrające w utworze instrumenty.
Dalsze badania w tej dziedzinie mogą w przyszłości ułatwić poruszanie się po ogromnych multimedialnych bazach danych, które powstają lawinowo w Internecie, jak np. YouTube. Dodatkowo pomogą stworzyć program zapisujący nutowo wykonywane na żywo utwory oraz narzędzie służące automatycznemu rozpoznawaniu autora oraz tytułu utworu. Zastosowania tych technologii są olbrzymie.


Strona główna konkursu



O TunedIT. TunedIT to pierwsza na świecie multimedialna platforma badawcza wykorzystująca ideę crowdsourcingu dla badań nad technologiami data mining i sztucznej inteligencji. Polega ona na wykorzystaniu wiedzy i umiejętności rzeszy światowej klasy naukowców, dla celów badawczych - tworzenia inteligentnych algorytmów. Metoda crowdsourcingu została umieszczona przez firmę Gartner - lidera rynku konsultingowego na świecie- na pozycji 3. na liście najważniejszych technologii w 2011. TunedIT.org oferuje organizację konkursów studenckich oraz naukowych. Ostatnio poszerzyła również swoje usługi o ofertę dla biznesu.

11 sty 2011

Scarlett Mansion

Scarlett Mansion to komputerowa gra fabularna utworzona przez studentów AGH pod moim kierownictwem w ramach przedmiotu Artificial Intelligence in Games. Innowacyjność gry polega na wykorzystaniu systemów dialogowych z technologią AIML zamiast kodowanych na sztywno wypowiedzi. Wstępna wersja jest gotowa do użytku, ale na razie tylko z komputerów w sieci AGH i z wykorzystaniem przeglądarki innej niż Chrome.

Zapraszam do testowania