google.com, pub-0177550132004975, DIRECT, f08c47fec0942fa0

2 lut 2015

Inż. Robert Dyjas

W miniony czwartek Robert Dyjas obronił bardzo dobrą pracę inżynierską polegającą na znaczącym rozwinięciu naszego korpusu mowy (o 111 mówców). Dane są dla nas tym istotniejsze, że są realnymi nagraniami telefonicznymi ukierunkowanymi tematycznie na treść najistotniejsza z punktu widzenia wdrożeń Sarmaty. Gratulujemy i dziękujemy za współpracę!!!

www.dsp.agh.edu.pl

29 sty 2015

Inż. Jakub Antoniuk

Kolejną ciekawą pracą dyplomową zrealizowaną w naszym zespole była "Aplikacja do wydobywania mowy z nagrania słabej jakości" wykonana i obroniona przez Jakuba Antoniuka. Serdecznie Gratulujemy!!!

"Celem tej pracy inzynierskiej była implementacja metod do wydobywania mowy z nagrania słabej jakości w środowisku MATLAB. Wybrano metodę odejmowania widmowego oraz wybielania. W poniższej pracy zarówno metody, jak i ich implementacja w użytym środowisku programistycznym zostały dokładnie opisane. Opisano również˙ wpływ doboru parametrów użytych funkcji na wynik działania programu. Końcowa aplikacja korzysta z obu metod, wykorzystując je z różnymi parametrami. Wyniki działania ˙ programu zostały przedstawione na dwóch rodzajach nagrań: sztucznie zaszumionych nagrań mowy, oraz rzeczywistych nagrań mowy z głośnym otoczeniem."

www.dsp.agh.edu.pl

19 sty 2015

inż. Błażej Chwiećko

Tej zimy przewidujemy bardzo wiele prac inżynierskich realizowanych w naszym zespole. Tak wiele że aż trudno się nam doliczyć. Listę otworzył dzisiaj Błażej Chwiećko broniąc pracę "Aplikacja do wykrywania reklam w radiu". Praca opisuje analizę możliwości wykonania aplikacji która przełączałaby stacje radiowe podczas reklam. Dyplomant zliczył statystyki stosunku mowy do muzyki w 12 stacjach radiowych i wykonał prototyp na iOS. Gratulujemy dyplomu !!!

"Pierwszym z poruszanych w tej pracy inżynierskiej zagadnień jest stworzenie aplikacji na system iOS, w którym zaprezentowano historię mobilnego oprogramowania firmy Apple, architekturę oraz zintegrowane środowisko deweloperskie - Xcode wraz z oferowanymi przez nie możliwościami. Drugim przedstawionym w pracy tematem jest klasyfikacja sygnału dźwiękowego na mowę lub muzykę. Zaprezentowano najważniejsze problemy dyskryminacji treści, a także, stosowane w XX wieku, sposoby klasyfikacji sygnału. Szczegółowo opisano również algorytm Minimum Energy Density bazujący na analizie lokalnej energii sygnału oraz etapy tworzenie prototypu aplikacji oferującej możliwość odtwarzania radia z pre-definiowanych źródeł internetowych, jak i dodawania streamów użytkownika. W aplikacji zaimplementowano możliwość wyświetlania informacji dotyczących procentowego udziału muzyki na danym kanale, które otrzymano analizując fragmenty nagrań stacji radiowych opisywanym algorytmem klasyfikującym. "

www.dsp.agh.edu.pl

7 sty 2015

Ciekawostki branży głosowej

Nuance dodaje biometrię głosu do swojego systemu przeznaczonego dla samochodów.

http://www.businesswire.com/news/home/20150106005385/en/Nuance%E2%80%99s-Dragon-Drive-Adds-Voice-Biometrics-Virtual#.VK1JviuG-qk

http://finance.yahoo.com/news/nuance-dragon-drive-adds-voice-130000994.html

http://findbiometrics.com/nuance-announces-dragon-id-voice-biometrics-for-mobile/

VocaONE uruchamia darmową usługę sieciową do biometrycznego głosowego logowania:

http://www.finextra.com/news/announcement.aspx?pressreleaseid=58154 (za darmo !)

https://www.vocaone.com/vocapass.html

Lattice Semiconductor  wprowadza na rynek niskoenergetyczny układ elektroniczny ( iCE40 na bazie FPGA) do nasłuchiwania i rozpoznawania komend głosowych, do zastosowań np. w sprzęcie AGD, smart home itd.

14 lis 2014

Praca w Durham, UK


Background

Complex networks are fundamental to transport and communication in biological systems, but little is known about their architecture and dynamics due to the fact that the size and complexity of modern imaging datasets exceeds human analysis ability. In this project we will overcome these limitations through the development of novel intensity-independent image informatics approaches exploring low-contrast features to provide a key methodology for the quantitative understanding of the role of complex biological networks in life systems.

Aims:

    develop intensity-independent image analysis and processing solutions to extract and characterise the architecture of structural biological networks from 2D/3D/3D time-series images;

    validate the proposed approaches using images of fungal, leaf vein and cytoskeletal networks with 10^6 of links across a range of physical scales;

    build a unique benchmarking repository of complex biological networks with their topological characteristics.

The approaches developed here will enable robust extraction and quantitative characterisation of the architecture of 2D/3D/3D time-series biological networks. These quantitative measures will allow researchers to understand in which way topology and functions of the biological networks are related. This will then open new avenues, especially for researchers exploring the importance of fungal networks in causing diseases in crops, and of leaf veins and cytoskeletal networks in plant growth. Most importantly, adaptation of the proposed approaches need not be limited to biological images but can be applied to any images that contain curvilinear features. Specifically, the approach for a low-contrast feature extraction will be extremely beneficial to both the academic and industrial computing and bioimaging communities, as it will allow the confident use of low-contrast features in a wide range of different domains, such as biomedical imaging, robotics, astronomy, security and art, where image processing methods also play an essential role.

The applicant should have:

    BSc/MSc in Computer Science, Engineering, Physics or Mathematics
    BSc/MSc thesis within Image Processing, Computer Vision, Visualisation, Bioinformatics, …
    Excellent programming skills, experience in MATLAB and Java/C++
    A solid background in mathematics and statistics
    Knowledge on depth image data analysis and processing
    Excellent communication skills in English, both spoken and written
    UK citizenship or EU citizenship

For further information please contact Dr Boguslaw Obara (boguslaw [dot] obara [AT] durham [dot] ac [dot] uk)

28 paź 2014

Robot obsługujący klientów w Dolinie Krzemowej

"Klient może przyjść do sklepu z jakąś śrubką i powiedzieć: "Panie robocie, potrzebuję tego więcej". Jeśli takie śruby są dostępne, robot poinformuje o tym, a następnie zaprowadzi klienta do właściwej półki - mówi Kyle Nel, dyrektor laboratorium innowacji firmy Lowe's Companies Inc., do której należą sklepy Orchard Supply Hardware. Roboty rozpoznają język angielski i hiszpański."
Więcej na TVN24bis