La fréquence des lettres en français

Il y a de cela quelques jours, je vous présentais les claviers de machines à écrire ou d’ordinateurs, mis au point en fonction de leur ergonomie et de la fréquence de distribution des lettres en français.

AZERTY, ZHJAY, Dvorak.fr et Bépo ou la bataille de clavier 

Mais comment peut-on déterminer la fréquence des lettres ?

Bien évidemment grâce à la toute puissance de l’outil informatique !

  • Pour cela, on fait ingurgiter à un ordinateur (toujours affamé !), une grosse quantité de textes et on le laisse faire ses calculs ! Simple non ?
  • Presque simple en réalité.  Car il faut prendre un soin particulier pour sélectionner le corpus de texte qui fera le menu de votre ordinateur. Pour que l’analyse soit des plus justes, les textes doivent tenir compte de tous les modes d’expression.
  • Si l’on met trop d’écrits rédigés à la première personne du singulier, on risque obligatoirement de voir se répéter excessivement la lettre « J ».

Le bon corpus

  • Il devra comprendre entre 100 000 et 1 million de lettres.
  • Les textes doivent être variés.

Quelle est la gagnante dans ce jeu sur la fréquence des lettres ?

Facile à deviner. Vous en avez un exemple dans le titre ci-dessus. C’est le « e » évidemment ! Mais qui sont les suivantes ?

Les 6 lettres les plus utilisées sont : E, S, A, I, T, N.


Les amateurs de scrabble remarqueront que les lettres qui rapportent le plus de points (au jeu) sont bien celles qui se trouvent en bas de classement dans les statistiques d’analyse fréquentielle.

L’analyse de la fréquence des lettres et la cryptologie

Pour information, ce classement des lettres en fonction de leur fréquence est aussi utile en cryptologie. Il constitue un indice précieux pour décoder les messages cryptés. Mais mettons fin au secret ! Vous l’attendez avec impatience, voici le hit parade des lettres selon leur fréquence dans la langue française.

EAISTNRULODMPCVQGBFJHZXYKW

Et comme nous vous savons curieux.  Pour preuve, vous êtes abonnés à notre site,  voici le classement en  % :

Français 9,42 1,02 2,64 3,39 15,87 0,95 1,04 0,77 8,41 0,89 0,00 5,34 3,24 7,15 5,14 2,86 1,06 6,46 7,90 7,26 6,24 2,15 0,00 0,30 0,24 0,32

 

A propos de l'auteur

Axelle Rousse_Redacxelle
Axelle Rousse_Redacxelle

Femme fatale aux courbes si parfaites qu’indicibles, je reste au foyer pour éviter les paparazzi et mener une vie tranquille loin des projecteurs. J’en profite pour cultiver mes neurones et m’intéresser à tout et n’importe quoi. Mes madeleines préférées sont la grammaire française, la littérature, la musique savante et la pédagogie.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser les tags HTML suivants : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Culture-generale.fr est un blog collaboratif créé en décembre 2007. Tous les articles et les contenus sont sous licence Creative Commons 2.0 , ce qui veut dire que vous pouvez les utiliser dans un cadre non commercial et que vous avez l'obligation de citer la source (un lien vers la home du site suffira). Visitez aussi la page regroupant d'autres sites intéressants.