Nasz artykuł "CONFIDENCE MEASURE BY SUBSTRING COMPARISON FOR AUTOMATIC SPEECH RECOGNITION" został przyjęty na konferencji ICALIP 2012. Artykuł opisuje eksperymentalną ocenę hipotez rozpoznań na podstawie analizy podobnych ciągów fonemów w najbardziej prawdopodobnych hipotezach i porównaniu ich prawdopodobieństw.
google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0
10 maj 2012
26 kwi 2012
Z AGH na Stanford
Trwają ostatnie przygotowania do naszego wyjazdu na Stanford University w rmaach programu TOP 500 Innovators. Wydarzenia związane z tym wyjazdem będę dla odmiany opisywać na Facebooku. Zapraszam do polubienia strony i jej częstego odwiedzania.
2 kwi 2012
AUDIOWIZUALNA BAZA NAGRAŃ MOWY POLSKIEJ
Nasza prezentacja "AUDIOWIZUALNA BAZA NAGRAŃ MOWY POLSKIEJ" została przyjęta na konferencji BDAS 2012 a artykuł o tej samej nazwie do czasopisma Studia Informatica. Artykuł opisuje wykonaną przez nas bazę zasobów audiowizualnych mowy polskiej. Jest ona największą tego typu bazą dla języka polskiego, a zarazem jedyną zrealizowaną w technologii HD. Artykuł przedstawia także krótki opis podobnych baz dla innych języków oraz opis techniczny wykonanej bazy. Omówiono także napotkane wyzwania w trakcie realizacji bazy danych i jej planowane zastosowania.
20 mar 2012
Postdoc w Helsinkach
"The Department of Information and Computer Science at Aalto University in Espoo/Helsinki, Finland, pursues research on advanced computational methods for modelling, analysing, and solving complex tasks in technology and science. The research aims at the development of fundamental computer science methods for the analysis of large and high-dimensional data sets, and for the modelling and design of complex software, networking and other computational systems.
To promote its ambitious research agenda, the Department is seeking postdoctoral researchers. While the present call focuses on the topics listed below, outstanding candidates in other areas of information and computer science compatible with the Department’s mission are also welcome. Applications should be received at latest on 2 April 2012 for full consideration. The Department may decide to make offers to exceptional candidates already before the end of the call."
Jednym z tematów jest "Speech and language processing" w zespole Dr Mikko Kurimo, mikko.kurimo na serwerze aalto.fi
Więcej na stronie Aalto university
13 mar 2012
RAYAV
Otrzymaliśmy finansowanie nowego projektu w ramach programu Innotech, którego będę kierownikiem. Budżet całego projektu to 1 940 891 zł. Będzie realizowany przez konsorcjum AGH i Teyon, gdzie AGH będzie zajmować się zadaniami związanymi z soundtracingiem i realizacją bazy nagrań, a Teyon raytracingiem grafiki.
Projekt badawczy RAYAV (Raytracer Audio i Video) tworzony w ramach konsorcjum firmy Teyon i Akademii Górniczo-Hutniczej ma na celu zrobienie hybrydowego renderera obrazu poprzez użycie ray-tracing’u oraz zbliżonego soundtracera. Rezultaty projektu zostaną użyte w komercyjnych projektach z branży gier video.
Ray-tracing jest techniką generowania fotorealistycznych obrazów scen trójwymiarowych, umożliwiająca odwzorowanie odbić od obiektów, generowanie cieni oraz realistyczne liczenie oświetlenia. Ze względu na złożoność obliczeniową, przez wiele lat jej wykorzystanie ograniczało się do branży filmowej.
Soundtracing pozwoli na precyzyjną i wydajną obróbkę dźwięku na architekturach wielordzeniowych uwzględniającą rzeczywiste odbicia od ścian, tłumienia na przeszkodach, obliczanie precyzyjnego echa i generowanie wielu źródeł dźwięku w sposób automatyczny.
Projekt badawczy RAYAV (Raytracer Audio i Video) tworzony w ramach konsorcjum firmy Teyon i Akademii Górniczo-Hutniczej ma na celu zrobienie hybrydowego renderera obrazu poprzez użycie ray-tracing’u oraz zbliżonego soundtracera. Rezultaty projektu zostaną użyte w komercyjnych projektach z branży gier video.
Ray-tracing jest techniką generowania fotorealistycznych obrazów scen trójwymiarowych, umożliwiająca odwzorowanie odbić od obiektów, generowanie cieni oraz realistyczne liczenie oświetlenia. Ze względu na złożoność obliczeniową, przez wiele lat jej wykorzystanie ograniczało się do branży filmowej.
Soundtracing pozwoli na precyzyjną i wydajną obróbkę dźwięku na architekturach wielordzeniowych uwzględniającą rzeczywiste odbicia od ścian, tłumienia na przeszkodach, obliczanie precyzyjnego echa i generowanie wielu źródeł dźwięku w sposób automatyczny.
12 mar 2012
TOP 500 Innovators
Zostałem zakwalifikowany do programu TOP 500 Innovators -
Informacje na stronie AGH.
" [...] dwumiesięcznym programie stażowo-szkoleniowym na najlepszych uczelniach świata z rankingu szanghajskiego (Academic Ranking of World Universities) takich jak Stanford University.
Program ma na celu podniesienie kwalifikacji naukowców i pracowników centrów transferu technologii w zakresie współpracy z gospodarką, zarządzania badaniami naukowymi oraz komercjalizacji ich wyników. Realizacja projektu powinna przyczynić się do jak najlepszego wykorzystania krajowych i europejskich środków przeznaczonych na badania tak, aby zapewnić transfer wyników prac B+R do gospodarki. Uczestnik programu w ciągu miesiąca po powrocie do Polski sporządza założenia planu komercjalizacji badań lub założenia planu poprawy efektywności działań centrum transferu technologii z wykorzystaniem wiedzy i umiejętności zdobytych podczas trwania programu."
Informacje na stronie AGH.
8 mar 2012
BDAS
Nasz artykuł "COMPERATIVE STUDY OF SQLITE AND BERKELEY DB IMPLEMENTATIONS OF N-GRAM MODEL OF POLISH LANGUAGE" został przyjęty na konferencję BDAS'12 i do czasopisma Studia Informatica. Przedstawiono zagadnienia dotyczące stosowania baz danych w lingwistyce komputerowej. Omówiono także przykład słownika i modelu n-gramowego systemu rozpoznawania mowy AGH. Pokazano na tym przykładzie znaczącą przewagę implementacji wykonanej w Berkeley DB nad implementacją SQLite w sensie wydajności czasowej.
Subskrybuj:
Posty (Atom)