Analyse des fréquences en anglais

Fréquences d'apparition des lettres
Lettre Fréquence Lettre Fréquence
A 8.08 % N 7.38 %
B 1.67 % O 7.47 %
C 3.18 % P 1.91 %
D 3.99 % Q 0.09 %
E 12.56 % R 6.42 %
F 2.17 % S 6.59 %
G 1.80 % T 9.15 %
H 5.27 % U 2.79 %
I 7.24 % V 1.00 %
J 0.14 % W 1.89 %
K 0.63 % X 0.21 %
L 4.04 % Y 1.65 %
M 2.60 % Z 0.07 %

Tous les tableaux de cette page ont été construits en comptant les fréquences dans un texte anglais de 100'000 lettres composé de textes d'Edgar Allan Poe (24'541 lettres), d'Arthur Conan Doyle (14'153) et de quatre articles de l'Encyclopédie Encarta 95, le premier consacré à New York (13'100), le deuxième à la Bible (19'405), le troisième aux baleines (9'083) et le dernier au transport ferroviaire (19'718).

Histogramme par ordre alphabétique

Histogramme par ordre décroissant des fréquences

Fréquences des bigrammes
_A _B _C _D _E _F _G _H _I _J _K _L _M _N _O _P _Q _R _S _T _U _V _W _X _Y _Z
A_ 16 185 364 380 15 87 132 41 401 24 69 833 262 1676 5 160 4 948 778 1131 134 195 77 9 145 10
B_ 99 7 9 2 468 0 1 0 107 6 0 238 2 0 235 1 0 144 29 16 139 2 2 0 168 0
C_ 494 6 72 5 513 3 4 440 217 2 139 113 10 0 638 5 3 100 17 268 108 2 5 0 19 0
D_ 335 178 96 81 642 88 51 122 581 10 9 76 95 74 298 73 5 112 291 433 164 28 127 0 26 0
E_ 922 293 621 1187 501 254 140 187 453 15 26 525 421 1243 351 304 38 1821 1345 845 140 243 412 155 114 2
F_ 176 26 45 20 177 114 13 47 198 23 4 54 52 24 350 39 2 202 54 445 48 5 41 0 9 0
G_ 183 25 33 12 286 19 19 225 158 3 3 57 43 46 135 23 1 146 74 170 92 4 24 0 15 0
H_ 948 31 48 15 2496 15 4 32 657 3 2 25 30 16 411 14 0 108 67 216 65 3 40 0 28 0
I_ 179 123 494 237 273 126 211 38 6 0 15 344 273 2078 501 63 7 275 856 834 13 210 21 11 0 51
J_ 10 0 0 0 47 1 0 0 1 0 0 0 0 0 46 0 0 2 0 0 32 0 0 0 0 0
K_ 36 9 27 6 148 4 12 8 85 0 2 35 10 53 24 12 0 4 99 29 1 0 19 0 4 0
L_ 490 41 44 239 720 52 12 25 448 1 14 466 65 16 312 52 0 61 198 153 135 36 36 0 422 1
M_ 485 84 10 6 618 35 1 17 246 2 0 7 112 12 357 165 0 29 99 83 108 1 34 0 91 0
N_ 502 99 387 1160 630 96 838 104 410 15 45 104 93 103 473 75 12 65 536 1267 106 34 106 14 101 0
O_ 199 95 158 187 57 945 58 51 91 7 121 291 505 1318 269 214 1 1023 301 427 697 124 293 22 21 0
P_ 266 4 3 4 408 8 4 62 92 0 0 135 9 2 316 78 0 302 42 82 82 0 9 0 4 0
Q_ 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 0 0 0 91 0 0 0 0 0
R_ 765 80 173 169 1467 54 75 72 658 6 122 119 169 132 773 89 1 111 471 471 86 78 94 0 184 1
S_ 611 151 210 82 776 110 38 328 618 8 27 141 180 80 629 260 15 79 408 1290 262 15 237 0 33 0
T_ 627 94 104 39 1062 60 22 3020 1115 8 10 155 81 37 870 46 3 400 331 405 257 8 204 0 194 0
U_ 109 62 172 103 98 32 134 3 73 0 8 272 131 335 10 119 0 379 414 322 0 2 6 3 2 0
V_ 83 0 0 0 672 0 0 1 185 0 0 0 0 0 51 0 0 0 0 0 1 0 0 0 9 0
W_ 360 9 16 5 336 8 6 382 269 4 0 10 8 83 185 12 1 45 39 37 5 2 10 0 53 0
X_ 19 3 26 2 10 1 0 14 24 0 0 3 1 1 10 48 0 0 1 39 4 0 4 0 3 1
Y_ 154 70 71 54 99 56 21 55 140 2 10 35 49 46 219 60 1 64 139 188 19 10 84 0 4 0
Z_ 13 0 0 0 39 0 0 0 5 0 0 1 0 0 7 0 0 0 0 0 0 0 0 0 1 1

Les 20 bigrammes les plus fréquents
Bigrammes TH HE IN ER AN RE ES ON ST NT EN ED ND AT TI TE OR AR HA OF
Nombres 3020 2496 2078 1821 1676 1467 1345 1318 1290 1267 1243 1187 1160 1131 1115 1062 1023 948 948 945

Remarquons aussi que les 52 (sur 676) bigrammes les plus fréquents (en rouges), totalisant 50'160 occurrences, représentent plus de la moitié de toutes les occurrences. Remarquons enfin des bigrammes fréquents inversés: ER, ER; ES, SE; ED, DE.

Les 20 trigrammes les plus fréquents
Trigrammes THE AND ING ENT ION NTH TER INT OFT THA ERE TIO HER FTH ETH ATI HAT ATE STH EST
Nombres 2069 819 607 487 428 381 367 357 355 355 352 335 327 321 315 307 295 286 281 277


Si les espaces entre les mots ont été conservés (ce qui n'est généralement pas le cas) on peut aussi utiliser les informations suivantes:


Références


Licence Creative Commons Didier Müller, 31.1.21