google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

22 lis 2012

Lingwistyczna baza danych AGH

Nasz artykuł "Special key-value store - Header Only Database for n-gram models" opisujący naszą własną bazę danych stosowaną w systemie rozpoznawania mowy SARMATA, został przyjęty do JOURNAL OF APPLIED COMPUTER SCIENCE. Baza danych jest bazą typu noSQL, ukierunkowaną na szybkie odpowiadanie na zapytania w modelu n-gramowym. Nasze testy pokazały dużo większą wydajność niż SQL oraz trochę lepszą w najbardziej kluczowym operacjach niż BerkeleyDB.

16 lis 2012

SPPRA 2013

Nasz artykuł "Vocal Tract Normalisation in Computer Games" został przyjęty na konferencję Signal Processing, Pattern Recognition and Applications ~SPPRA 2013~ w Innsbruku. Praca opisuje metody modyfikacji głosu ludzkiego na potrzeby tańszego realizowania ciekawszych nagrań do dialogów w grach komputerowych.

15 lis 2012

Komunikacja człowieka z maszyną


Fragment książki "Przetwarzanie mowy" B. Ziółko i M. Ziółko

Maszyny i komputery coraz intensywniej wkraczają w nasze życie. Wykonują dla nas i za nas pracę. Czasami nas zabawiają, czasami ratują. Coraz częściej ograniczeniem nie jest możliwość wykonania określonej czynności przez maszynę lub komputer, ale problemem jest sformułowanie istniejącej potrzeby przez niewykwalifikowaną osobę. Zatem istotne są kolejne ułatwienia w dialogu człowieka z komputerem.


Stosowano różne metody komunikacji człowieka z maszyną, od prawie zapomnianych taśm papierowych i kart z dziurkami po klawiaturę. Na przestrzeni lat, komunikacja człowieka z maszyną ewoluowała w stronę upodabniania się do komunikacji międzyludzkiej. Najwygodniejszą dla nas metodą jest oczywiście rozmowa i dlatego technologie mowy można traktować jako docelowe sposoby komunikacji człowieka z maszynami, co pokazują liczne filmy gatunku science-fiction z Odyseją Kosmiczną i komputerem pokładowym HAL 9000 na czele. Są one najwygodniejsze i nie wymagają, od użytkownika przeszkolenia. Stworzenie interfejsu głosowego jest jednak sprawą trudną. Wymaga pokonania zarówno trudności koncepcyjnych jak i sprzętowych, bo komputery osobiste muszą być odpowiednio efektywne. Wspomniany HAL 9000 jest jednak realną rzeczywistością.

17 paź 2012

Wywiad z mgr inż. Stanisławem Kacprzakiem


Do naszego zespołu dołączył nowy doktorant Stanisław Kacprzak. Jest on nie tylko obiecującym młodym naukowcem, ale także ciekawym przykładem nowoczesności rekrutacji w naszym zespole. Po pierwsze Stanisław jest absolwentem Politechniki Łódzkiej na Wydziale Fizyki Technicznej, Informatyki i Matematyki Stosowanej. Studiował kierunek Informatyka, ze specjalizacją Sztuczna Inteligencja i Inżynieria Oprogramowania. Nie dość, że mamy tu więc do czynienia z pełną mobilnością to jeszcze sama rekrutacja do jego pracy w naszym projekcie odbywała się wyłącznie poprzez elektroniczną wymianę korespondencji, i to nie z Łodzi do Krakowa, a z Łodzi do Kalifornii, gdzie wówczas przebywałem. Co więcej, Stanisław nie przybył do nas świeżo po zakończeniu studiów magisterskich. Przez rok pracował w komercyjnej firmie jako programista. Tak więc obalił swoim przykładem trzy wielkie stereotypy polskiej nauki: o braku mobilności i kumoterstwie, wszechogarniającej biurokracji i braku łączności między nauką a przemysłem.

Jak przeprowadzka z Łodzi do Krakowa?
Dziękuję, dobrze. Podczas dwóch kursów udało mi się przetransportować większość najpotrzebniejszych rzeczy. Na razie mieszkam w akademiku, ale pewnie niedługo rozejrzę się za mieszkaniem.

Skąd dowiedziałeś się o naszym zespole?
Moja praca magisterska dotyczyła zagadnień rozpoznawania mowy w języku polskim. Pisząc ją natrafiłem na publikacje i prace doktorskie związane z tą tematyką autorstwa członków zespołu.

Dlaczego zainteresował Cię nasz zespół?
Od czasu do czasu zaglądałem na tego bloga i z dużym uznaniem obserwowałem ciągłe postępy w pracy naukowej zespołu jak publikacje, udziały w konferencjach czy wydanie książki "Przetwarzanie Mowy".

Skąd Twoje zainteresowanie technologiami mowy?
Miałem okazję odbywać trzymiesięczne praktyki w ramach programu IAESTE w dziale R&D firmy INDRA Software Labs w Madrycie. Podczas tych praktyk zajmowałem się między innymi tworzeniem programu do nagrywania i katalogowania danych treningowych oraz implementacją algorytmu wyznaczania parametrów MFCC. Wiedza i doświadczenie jakie tam zdobyłem zachęciły mnie do kontynuowania zajmowania się tematyką rozpoznawania
mowy w ramach pracy magisterskiej.

Co wcześniej Cię łączyło z AGH?
Chyba tylko książki profesora Tadeusiewicza.

Jak oceniałeś swoje szanse na pracę na AGH, gdy pierwszy raz przyszedł Ci taki pomysł do głowy?
Wydawało mi się, że na pewno jakieś są, bo tematyka mojej pracy magisterskiej pokrywa się z zainteresowaniami zespołu, ale spodziewałem się, że zgłosi się dużo studentów AGH.

Co najbardziej Cię zaskoczyło na AGH?
Ilość studentów. Naprawdę są ich tłumy, a to przecież jeszcze nie Juwenalia.

Co Cię skłoniło na zmianę kierunku kariery, od przemysłu do akademii?
Możliwość skupienia się na tym co naprawdę mnie interesuje, perspektywa ciągłego poszerzania wiedzy, co w przypadku "zwykłej" pracy nie zawsze jest możliwe.

Jakie atuty dostrzegasz w pracy na uczelni?
Możliwość rozwijania własnych zainteresowań, dostęp do zasobów naukowych uczelni oraz ułatwiony kontakt z ekspertami z danej dziedziny. Większa niezależność w organizowaniu swojego czasu pracy.

Co radzisz studentom 5 roku, którzy myślą o przyszłej pracy na uczelni?
Jeśli rozważają taką możliwość, to już jakiś znak. Na pewno warto napisać jakąś publikację, może dotyczącą pracy magisterskiej czy inżynierskiej. Taką radę ja otrzymałem, ale poniewczasie.

Dziękuję za wywiad i powodzenia!

11 paź 2012

Procesor do rozpoznawania mowy


Diotex połączyło siły z Conexant i stworzyło nowoczesny i zaawansowany układ do rozpoznawania mowy. Zastosowaniem ma być elektronika konsumencka i zabawki edukacyjne. Zapewniać ma wysoką wydajność przy niskich kosztach. Więcej na evertiq.pl