google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

24 cze 2014

SIGMAP

Nasz artykuł o modelowaniu ciszy, oddechów itp. w rozpoznawaniu mowy "HMM-based breath and Filled Pauses Elimination in ASR" został przyjęty na konferencji SIGMAP 2014. Jest to bardzo ambitna konferencja, w niektórych latach indeksowana przez Thomson Reuters w Web of Knowledge oraz w Scopusie. Cieszymy się szczególnie, ponieważ głównym autorem tak dojrzałej publikacji i samego toku badań jest student przed obroną pracy magisterskiej - Piotr Żelasko. Gratulujemy!

www.dsp.agh.edu.pl

20 cze 2014

Siri sprzedana?


Podczas gdy Apple i Samsung walczą o dominację na rynku telefonów, Carl Icahn liczy że te tarcia wywindują cenę jednego z należących do niego holdingów.

Mowa tu o Nuance Communications, firmie, która stoi za słynną Siri Apple'a, a która rozważa... wystawienie się na sprzedaż. W miniony poniedziałek Wall Street Journal donosił o wstępnych rozmowach prowadzonych na ten temat z Samsungiem.

Ta właśnie informacja z pewnością skłoni Apple'a do włączenia się do gry i przeznaczenia części swoich środków (szacowanych na 150 miliardów dolarów) na stawkę w tej swoistej licytacji.

O ile sama Siri jest produktem SRI international, która odpowiada za jej funkcjonalności osobistego asystenta, o tyle kluczowy moduł rozpoznawania mowy jest dziełem Nuance - co jednak było tajemnicą aż do czasu, kiedy Apple zakupił Siri.

Jeśli więc Nuance szykuje się na przejęcie, Apple jest w kropce. Choć może z łatwością przelicytować Samsunga, to jednak musi liczyć się z kosztami rzędu 4,8 miliarda dolarów (na tyle szacowana jest wartość rynkowa firmy). Ewentualna wygrana Apple'a oznaczałaby też konieczność zaangażowania się w inne obszary, w jakich działa obecnie Nuance (np. opieka zdrowotna i technologie medyczne), a które, jak na razie, leżą poza zasięgiem zainteresowań giganta z Cupertino.

Utrata Siri byłaby jednak przede wszystkim kryzysem wizerunkowym, który z pewnością zostałby skrzętnie rozdmuchany przez Samsunga już w chwilę po przejęciu Nuance - podgryzanie pozycji i wizerunku Apple to dla koreańskiego koncernu ważny element strategii walki o rynek.


www.dsp.agh.edu.pl

17 cze 2014

Samsung kupi Nuance?

Taka właśnie plotka krąży. Pisze o tym Wall Street Journal. Czy to by oznaczało że Siri przestanie działać, bo licencja dla Apple zostanie wycofana? W efekcie tej wiadomości akcje Nuance podrożały prawie o 10%. Więcej

dsp.agh.edu.pl

4 cze 2014

31 maj 2014

Prozodia a semantyka

Kiedy pauza jest wypowiedzią? Jak ton wypowiedzenia słowa może zmienić jego sens, a nawet znaczenie artykułu Konstytucji? Czy prozodia istnieje w języku migowym? Jaki sposób wypowiedzi jest odbierany jako niepewny?
O tym i innych zagadnieniach można było usłyszeć w minionych dniach (29-30 maja) w Warszawie na konferencji 'Prozodia w semantyce - semantyka w prozodii', w której mieliśmy przyjemność uczestniczyć.
Konferencja była wspólnym projektem UKSW i UW. Była to doskonała okazja do spotkania i wymiany doświadczeń badawczych dla lingwistów, fonetyków, filologów, logopedów i ... inżynierów. Interdyscyplinarność konferencji zaowocowała wieloma cennymi burzami mózgów i na pewno owocować będzie w przyszłości, również współpracą na tym bardzo ciekawym polu badawczym.

Organizatorom serdecznie dziękujemy za zaproszenie, gratulujemy przedsięwzięcia i życzymy kolejnych tak udanych inicjatyw!

www.dsp.agh.edu.pl

27 maj 2014

Skype będzie tłumaczył rozmowy w czasie rzeczywistym.

Skype, już od dawna ułatwia ludziom komunikację na odległość za pomocą wideo, głosu i czatu. Teraz Microsoft pragnie zwiększyć możliwości Skype'a, testując nową funkcjonalność, umożliwiającą ludziom, którzy nie posługują się wspólnym językiem, prowadzenie ze sobą rozmów.

W dniu dzisiejszym, na pierwszej edycji CODE Conference, Microsoft zaprezentował nową technologię tłumaczeń speech-to-speech (mowa-mowa), którą ma zamiar zaimplementować w przyszłych wersjach Skype'a, co ma pozwolić na przekład mowy z jednego języka na drugi niemal w czasie rzeczywistym.

W ramach prezentacji pokazano m.in., tłumaczenie z angielskiego na niemiecki w postaci zarówno pisemnej transkrypcji jak i audio - oraz w drugą stronę, z niemieckiego na angielski.

Przesłaniem płynącym od twórców tej technologii  jest "Zbliżanie ze sobą ludzi i niwelowanie dzielących ich różnic". Wszystko zaczęło się od przełamania monopolu tradycyjnych sieci telekomunikacyjnych na rozmowy międzynarodowe i wprowadzenie obsługi wideo. Teraz czas na przełamanie bariery językowej.

Opisywana funkcjonalnośc jest rezultatem ścisłej współpracy pomiędzy działami odpowiedzialnymi za Skype, Bing i Microsoft Research Lab (laboratorium badań Microsoftu), które już od dawna pracują nad zagadnieniami przetwarzania ludzkiej mowy i uczenia maszynowego. Nowe rozwiązania z podobnych technologii, co Cortana - osobisty asystent posiadaczy urządzeń z systemem Windows 8.1.

www.dsp.agh.edu.pl