"Ponad 300 godzin nagrań i 200 tys. opisanych znaków języka migowego znajduje się w opracowywanym od trzech lat, na Uniwersytecie Warszawskim korpusie polskiego języka migowego (PJM). Już teraz jest on największym zbiorem danych o języku migowym na świecie.
Korpus językowy to zbiór danych tekstowych dostępnych w formie elektronicznej, stanowiący materiał do badań nad językiem. Naukowcy pracujący nad korpusem PJM najpierw nagrywają zamigane rozmowy i wypowiedzi osób głuchych, a potem te nagrania analizują i opisują użyte znaki i konstrukcje gramatyczne.
„Obecnie mamy nagranych prawie 80 głuchych użytkowników PJM. W sumie to ponad 300 godzin nagrań. Zbiór wyodrębnionych i sklasyfikowanych elementów liczy już około 200 tys. Pod tym względem mamy teraz największy korpus języka migowego na świecie” – powiedział PAP kierujący pracami dr Paweł Rutkowski z Pracowni Lingwistyki Migowej Uniwersytetu Warszawskiego."