Roboty niczym z filmu "Cherry 2000" szykowane są do sprzedaży. Firma iRobot zademonstrowała robota kobietę z silikonową nibyskórą i imitacją oddechu.
google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0
26 paź 2012
17 paź 2012
Wywiad z mgr inż. Stanisławem Kacprzakiem
Do naszego zespołu dołączył nowy
doktorant Stanisław Kacprzak. Jest on nie tylko obiecującym młodym naukowcem,
ale także ciekawym przykładem nowoczesności rekrutacji w naszym zespole. Po
pierwsze Stanisław jest absolwentem Politechniki Łódzkiej na Wydziale Fizyki
Technicznej, Informatyki i Matematyki Stosowanej. Studiował kierunek
Informatyka, ze specjalizacją Sztuczna Inteligencja i Inżynieria
Oprogramowania. Nie dość, że mamy tu więc do czynienia z pełną mobilnością to
jeszcze sama rekrutacja do jego pracy w naszym projekcie odbywała się wyłącznie
poprzez elektroniczną wymianę korespondencji, i to nie z Łodzi do Krakowa, a z
Łodzi do Kalifornii, gdzie wówczas przebywałem. Co więcej, Stanisław nie
przybył do nas świeżo po zakończeniu studiów magisterskich. Przez rok pracował
w komercyjnej firmie jako programista. Tak więc obalił swoim przykładem trzy
wielkie stereotypy polskiej nauki: o braku mobilności i kumoterstwie,
wszechogarniającej biurokracji i braku łączności między
nauką a przemysłem.
Jak przeprowadzka z Łodzi do
Krakowa?
Dziękuję, dobrze. Podczas dwóch
kursów udało mi się przetransportować większość najpotrzebniejszych rzeczy. Na
razie mieszkam w akademiku, ale pewnie niedługo rozejrzę się za mieszkaniem.
Skąd dowiedziałeś się o naszym
zespole?
Moja praca magisterska dotyczyła
zagadnień rozpoznawania mowy w języku polskim. Pisząc ją natrafiłem na
publikacje i prace doktorskie związane z tą tematyką autorstwa członków
zespołu.
Dlaczego zainteresował Cię nasz
zespół?
Od czasu do czasu zaglądałem na
tego bloga i z dużym uznaniem obserwowałem ciągłe postępy w pracy naukowej
zespołu jak publikacje, udziały w konferencjach czy wydanie książki
"Przetwarzanie Mowy".
Skąd Twoje zainteresowanie
technologiami mowy?
Miałem okazję odbywać
trzymiesięczne praktyki w ramach programu IAESTE w dziale R&D firmy INDRA
Software Labs w Madrycie. Podczas tych praktyk zajmowałem się między innymi
tworzeniem programu do nagrywania i katalogowania danych treningowych oraz
implementacją algorytmu wyznaczania parametrów MFCC. Wiedza i doświadczenie
jakie tam zdobyłem zachęciły mnie do kontynuowania zajmowania się tematyką
rozpoznawania
mowy w ramach pracy magisterskiej.
mowy w ramach pracy magisterskiej.
Co wcześniej Cię łączyło z AGH?
Chyba tylko książki profesora
Tadeusiewicza.
Jak oceniałeś swoje szanse na
pracę na AGH, gdy pierwszy raz przyszedł Ci taki pomysł do głowy?
Wydawało mi się, że na pewno
jakieś są, bo tematyka mojej pracy magisterskiej pokrywa się z
zainteresowaniami zespołu, ale spodziewałem się, że zgłosi się dużo studentów
AGH.
Co najbardziej Cię zaskoczyło na
AGH?
Ilość studentów. Naprawdę są ich
tłumy, a to przecież jeszcze nie Juwenalia.
Co Cię skłoniło na zmianę
kierunku kariery, od przemysłu do akademii?
Możliwość skupienia się na tym
co naprawdę mnie interesuje, perspektywa ciągłego poszerzania wiedzy, co w
przypadku "zwykłej" pracy nie zawsze jest możliwe.
Jakie atuty dostrzegasz w pracy
na uczelni?
Możliwość rozwijania własnych
zainteresowań, dostęp do zasobów naukowych uczelni oraz ułatwiony kontakt z
ekspertami z danej dziedziny. Większa niezależność w organizowaniu swojego
czasu pracy.
Co radzisz studentom 5 roku,
którzy myślą o przyszłej pracy na uczelni?
Jeśli rozważają taką możliwość,
to już jakiś znak. Na pewno warto napisać jakąś publikację, może dotyczącą pracy magisterskiej
czy inżynierskiej. Taką radę ja otrzymałem, ale poniewczasie.
Dziękuję za wywiad i powodzenia!
11 paź 2012
Procesor do rozpoznawania mowy
Diotex połączyło siły z Conexant i stworzyło nowoczesny i zaawansowany układ do rozpoznawania mowy. Zastosowaniem ma być elektronika konsumencka i zabawki edukacyjne. Zapewniać ma wysoką wydajność przy niskich kosztach. Więcej na evertiq.pl
8 paź 2012
Praat - doing phonetics by computer
Praat jest darmowym programem do przetwarzania mowy pod kątem fonetyki. Oferuje narzędzia do analizy i syntezy mowy, na bazie zaimplementowanych algorytmów przetwarzania czasowo-częstotliwościowego (w tym filtrowanie, segmentacja, parametryzacja, analiza intonacji, analiza spektralna). Zawiera również podstawowe narzędzia do anotacji mowy, modelowania traktu głosowego, uczenia maszynowego (klasyfikator kNN, sieci neuronowe) i analizy statystycznej (m.in. PCA, analiza dyskryminacyjna).
Program jest lekki (ok. 5 MB, nie wymaga instalacji), ma wyjątkowo prosty i przejrzysty interfejs. Dostępne są wersje na różne systemy operacyjne, jak również kod źródłowy programu. Posiada własny (bardzo przystępny) język skryptowy pozwalający na zautomatyzowanie wielu operacji.
Dzięki dość dużej społeczności użytkowników Praata, powstaje wiele darmowych manuali, tutoriali i toolboxów. Twórcy Praata, Paul Boersma i David Weenink (University of Amsterdam), regularnie aktualizują i wzbogacają program o kolejne funkcjonalności (ostatnia aktualizacja kilka dni temu - wersja 5.3.29).
Źródło: http://www.fon.hum.uva.nl/praat/
7 paź 2012
Rozpoznawanie myśli
Naukowcy z UCLA i Technion zbadali aktywność mózgu podczas produkowania dźwięków poszczególnych samogłosek. Ustalenie, które rejony mózgu są odpowiedzialne za kodowanie wytwarzania dźwięków mowy ma być krokiem ku opracowaniu interfejsów umożliwiających komunikację osobom sparaliżowanym.
Źródła: http://www.sciencedaily.com/releases/2012/08/120821143612.htm
http://www.nature.com/ncomms/journal/v3/n8/full/ncomms1995.html#/affil-auth
5 paź 2012
Aktywowany głosem system w samochodach Chryslera
Chrysler wprowadza do oferty wyposażenia auta system UConnect Voice Command, wraz z wbudowanym systemem łączności UConnect Acess. Ma on umożliwiać m.in. sterowanie urządzeniami (np. radiem), korzystanie z nawigacji i wyszukiwarki, jak również dyktowanie wiadomości (będzie kompatybilny ze smartphone'ami posiadającymi Message Access Profile - MAP).
4 paź 2012
'Wyborcy wolą polityków o niższym głosie' - jak profil mowy wpływa na ocenę cech przywódczych
Preferencje wyborców dotyczące wysokości głosu polityków zbadali amerykańscy naukowcy. Okazuje się, że osobom o niższym tonie głosu (zarówno mężczyznom, jak i kobietom) ludzka percepcja podświadomie przypisuje takie cechy jak kompetencje, siła, czy zaufanie.
(C. A. Klofstad, R. C. Anderson, S. Peters. Sounds like a winner: voice pitch influences perception of leadership capacity in both men and women.
Proceedings of the Royal Society B: Biological Sciences, 2012)
Z kolei jak mówią polscy politycy z punktu widzenia ekspertów mowy - możemy zobaczyć w prezentacji opracowanej przed Prof. Izdebskiego oraz dr Zei-Pollerman w materiale dla Tygodnika Powszechnego:
3 paź 2012
Natural Language Processing - kurs online na platformie Coursera
COURSERA jest internetową plaftormą edukacyjną, umożliwiającą każdemu uczestniczenie w bezpłatnych kursach on-line czołowych światowych uczelni. W COURSERA zaangażowane są m.in. Stanford University, Princeton University, University of Pennsylvania czy University of Michigan (obecnie łącznie 33 uczelnie).
Kilkutygodniowe kursy mają formę sekwencji filmików edukacyjnych, połączonych z quizzami (i egzaminami online!), można też uzyskać certyfikat potwierdzający ukończenie kursu. W ofercie tematycznej kursów przybywa z miesiąca na miesiąc, powiększa się dynamicznie też społeczność uczestników COURSERA.
Niedawno zapowiedziano kurs Natural Language Processing.
Czas trwania: 10 tygodni
Planowany start: 11 luty 2013
2 paź 2012
Między mową a muzyką - 'mówiące pianino'
Ciekawy efekt uzyskał austriacki kompozytor Peter Ablinger, przypisując spektra ludzkiego głosu do dźwięków sterowanego komputerowo mechanicznego pianina:
Subskrybuj:
Posty (Atom)