Analyse des fréquences en allemand

Chapitre: V. Caractéristiques des langues Prérequis: -


Fréquence des lettres - fréquences des bigrammes - fréquences des trigrammes

Fréquences d'apparition des lettres
Lettre Fréquence Lettre Fréquence
A 6.28 % N 10.20 %
B 1.99 % O 2.87 %
C 2.98 % P 0.77 %
D 5.04 % Q 0.02 %
E 16.92 % R 7.44 %
F 1.62 % S 6.62 %
G 3.12 % T 5.95 %
H 4.51 % U 4.39 %
I 7.42 % V 1.07 %
J 0.30 % W 1.52 %
K 1.46 % X 0.03 %
L 3.56 % Y 0.10 %
M 2.54 % Z 1.24 %

Tous les tableaux de cette page ont été construits en comptant les fréquences dans un texte allemand de 100'000 lettres composé d'un texte de Franz Kafka (28'188 lettres), d'un texte historique consacré à Gilberte de Courgenay (17'845) et de trois articles trouvés sur le web, le premier consacré à la découverte de la planète Pluton (24'165), le deuxième à Yvan le Terrible (24'560) et le dernier aux éléphants d'Afrique (5'242). Le symbole "ß" a été remplacé systématiquement par "ss". On a utilisé le programme Mathematica ci-dessous:

stat.nb (12 Ko)

Histogramme par ordre alphabétique

Histogramme par ordre décroissant des fréquences

Fréquences des bigrammes
_A _B _C _D _E _F _G _H _I _J _K _L _M _N _O _P _Q _R _S _T _U _V _W _X _Y _Z
A_ 53 316 320 150 17 129 282 297 28 16 40 571 244 1217 4 32 0 658 552 416 878 20 7 2 2 31
B_ 181 3 2 22 1101 4 17 11 157 10 3 81 3 23 69 2 0 107 77 33 57 6 17 0 2 3
C_ 23 2 2 2 18 0 2 2647 30 0 200 5 10 14 15 1 0 4 2 3 0 2 0 0 0 0
D_ 508 44 9 160 2386 27 32 25 959 11 30 105 47 39 102 13 1 79 116 37 181 55 47 0 0 23
E_ 319 337 151 561 336 235 400 388 1935 27 220 652 540 3956 69 110 9 3818 1443 547 317 170 218 15 7 143
F_ 219 9 0 83 277 102 31 18 57 2 16 69 7 29 126 2 0 166 23 118 234 5 18 0 0 13
G_ 195 26 3 156 1521 21 28 21 109 4 41 116 18 43 17 3 0 194 136 229 143 31 39 0 1 29
H_ 529 38 1 181 954 21 40 37 293 6 52 275 123 304 195 11 1 447 124 529 131 45 136 0 4 33
I_ 35 52 1038 117 1702 42 470 201 21 32 99 242 207 1579 77 19 1 153 488 684 23 98 7 0 1 36
J_ 121 2 0 3 78 8 1 0 4 0 1 1 1 1 27 0 0 1 7 0 45 0 1 0 0 0
K_ 190 14 3 17 277 2 20 13 88 1 11 95 21 17 221 3 0 108 46 157 116 11 27 0 0 5
L_ 492 73 27 150 622 52 72 17 616 1 26 406 33 28 194 9 0 10 240 283 136 22 17 1 12 25
M_ 432 62 6 90 524 40 49 33 323 20 23 52 222 42 106 49 0 16 157 90 109 19 48 0 6 26
N_ 636 235 42 1990 1317 216 971 179 594 55 284 125 188 459 218 94 2 83 729 559 453 195 284 3 2 292
O_ 6 166 158 87 10 71 75 99 18 26 28 239 190 613 5 87 1 479 277 101 20 46 50 2 4 17
P_ 70 1 0 1 114 67 1 41 45 0 2 117 0 0 56 52 0 114 5 56 25 1 0 0 0 0
Q_ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 20 0 0 0 0 0
R_ 739 248 113 607 1098 171 247 173 531 44 189 170 235 321 282 67 3 128 607 460 459 151 206 1 32 162
S_ 361 88 834 205 1045 64 131 86 675 21 133 66 84 82 268 130 1 45 778 1075 152 71 116 0 18 91
T_ 504 59 14 333 2167 59 105 108 424 14 39 104 73 64 198 18 0 281 299 234 306 78 177 4 4 281
U_ 29 190 256 82 154 285 139 110 21 6 23 53 284 1360 4 55 1 548 470 252 15 24 16 0 1 19
V_ 85 8 0 5 403 4 6 0 80 1 0 6 2 3 439 2 0 2 11 0 8 0 1 0 2 1
W_ 452 0 2 0 501 0 0 0 318 2 0 1 0 0 134 1 0 0 0 5 103 0 0 0 0 0
X_ 4 0 0 0 4 1 0 0 10 0 0 0 0 0 1 0 0 0 0 1 0 2 2 0 0 3
Y_ 8 2 1 5 3 0 2 0 4 2 1 1 8 9 3 4 0 2 24 6 5 3 3 0 0 2
Z_ 91 16 0 29 294 3 3 6 84 1 1 13 4 2 45 4 0 1 9 72 461 14 82 0 0 5

 
Les 20 bigrammes les plus fréquents
Bigrammes EN ER CH DE TE ND EI IE IN GE ES UN NE AN BE RE ST SE IC NG
Nombres 3956 3818 2647 2386 2167 1990 1935 1702 1579 1521 1443 1360 1317 1217 1101 1098 1075 1045 1038 971

Les 20 trigrammes les plus fréquents
Trigrammes DER ICH EIN NDE SCH DIE TEN END CHE UND DEN GEN INE CHT UNG ERS NGE ENS ERE TER
Nombres 1025 959 939 812 812 804 662 611 607 586 580 523 509 499 478 445 433 408 380 378

On reconnaît les articles "der", "die", "ein". Il est à noter que "das" ne vient qu'en 43ème position avec 255 occurrences seulement.


Didier Müller, 13.7.02