indice de coïncidence

CALCUL
PROBABILITES

L’indice de coïncidence est une notion de cryptanalyse, due au cryptologue américain William Friedman, publiée en 1920 dans The Index of Coincidence and its Applications in Cryptography.
C’est la probabilité que deux lettres prises au hasard dans un texte soient identiques.
Pour une langue dont l’alphabet a n caractères, la formule permettant de le calculer est la somme pour i entier, variant de 1 à n, des :
[ni(ni-1)]/[n(n-1)]
où n est le nombre de lettres, n1 le nombre de A (la première lettre), etc.

Pour un texte standard, l’indice dépend de la langue.
Dans le cas d’un chiffrement par substitution ou d’un chiffrement par transposition l’indice est inchangé.
On peut savoir si on a utilisé plusieurs alphabets, si le chiffrement est polyalphabétique. Par exemple, en français l’IC est environ 0,075. Si on trouve pour le message un indice de 0,05 on peut supposer qu’il s’agit d’un chiffrement polyalphabétique.
C’est une des méthodes pour déchiffrer le code de Vigenère (mais pas historiquement le premier).