Mesurer si une partition est "pertinente"

Georges Abitbol
Modifié (December 2022) dans Sciences des données
Bonjour,
soient $X,I$ deux ensembles, soit $(X_i)_{i \in I}$ une partition de $X$, soit $E$ un espace euclidien et soit $(v_x)_{x \in X}$ une famille de vecteurs de norme $1$.
Je voudrais une quantité qui formalise l'idée intuitive que la partition est d'autant meilleure que la matrice $(\langle v_x, v_y\rangle)_{x,y \in X}$, si on l'écrit par blocs correspondant à la partition, a des termes proches de $1$ dans les blocs diagonaux et petits hors des blocs diagonaux.
Par exemple, on pourrait calculer $\frac{2}{\vert X \vert (\vert X \vert - 1)} \sum_{x,y} (\langle v_x,v_y\rangle - \textbf{1}_{x \sim y})^2$ où $\sim$ désigne la relation d'équivalence dont les membres de la partition sont les classes ; ce nombre est petit si et seulement si la partition est bonne. Mais bon, c'est peut-être une quantité idiote.
Il y a peut-être aussi des choses que l'on peut définir à partir d'entropie (par exemple, est-ce que si on "connaît" déjà la matrice de Gram de la famille, on en "apprend beaucoup" en connaissant en plus la partition ?).
Merci par avance !
Connectez-vous ou Inscrivez-vous pour répondre.