25 sie 2009

Statystyczna długość głosek w języku polskim

Poniżej dane, które zebraliśmy korzystając z Corpory. Kolejne pozycje w każdej lini zawierają sposób zapisu głoski w Corporze, sposób zapisu w standardzie SAMPA, średni czas trwania w milisekundach, odchylenie standardowe, przykład w zapisie ortograficznym oraz fonetyczna transkrypcja tego przykładu. Obserwacje i cel naszych badań zostanie wkrótce opublikowany w postaci artykułu konferencyjnego.

CORPORA SAMPA av. duration [ms] standard dev example transcr.
e e j 174 58 gęś ges’
a o w 166 52 ciąża ts’owZa
sz S 152 59 szyk SIk
s s 132 46 syk sIk
si s’ 130 45 świt s‘vit
c ts 128 41 cyk tsIk
a a 127 48 pat pat
ci ts’ 125 42 ćma ts’ma
cz tS 124 40 czyn tSIn
f f 122 64 fan fan
zi z’ 115 33 źle z’le
e e 111 48 test test
z z 107 34 zbir zbir
rz Z 106 31 żyto ZIto
drz dz’ 103 36 dźwig dz’vik
o o 103 35 pot pot
h x 100 45 hymn xImn
dz dz 100 35 dzwoń dzvon’
u u 99 42 puk puk
t t 98 52 test test
dzi dZ 98 27 dżem dZem
k k 94 45 kit kitk
i i 93 38 PIT pit
p p 93 41 pik pik
n n 91 41 nasz naS
b b 88 27 bit bit
y I 88 43 typ tIp
m m 86 34 mysz mIS
d d 83 29 dym dIm
g g 83 28 gen gen
w v 82 32 wilk vilk
j j 81 34 jak jak
l w 79 33 łyk wIk
ni n’ 76 33 koń kon’
r r 73 30 ryk rIk
l l 72 31 luk luk
N N 72 25 pęk peNk
sp 68 28 cisza wewnątrz słów
sil 15 26 cisza na końcach i początkach nagrań.