Lien entre ACP et AFC

Bonjour
J'essaie de comprendre comment fonctionne les AFC et j'ai une difficulté.

Je lis qu'il s'agit d'appliquer une ACP aux profils ligne avec la distance du khi-deux. J'ai appris ce qu'est une ACP ainsi que les résultats élémentaires avec la distance euclidienne, et pas une distance quelconque, par ailleurs dans les démonstrations, la distance euclidienne semble jouer un rôle important.
J'ai lu dans plusieurs cours que l'on peut ramener l'ACP avec distance du khi-deux à une ACP avec distance euclidienne quitte à diviser les profils par la racine du profil moyen (coordonnée par coordonnée) ce qui me semblait clair, mais en pratique cela coince.

J'ai pris cet exemple :
$$
T = \left( \begin{array}{ccc}
13 & 142 & 106 \\
30 & 408 & 117 \\
241 & 573 & 94
\end{array} \right)

$$ J'obtiens le profil ligne :
$$
\left( \begin{array}{ccc}
0.0498084 & 0.5440613 & 0.4061303 \\
0.0540541 & 0.7351351 & 0.2108108 \\
0.2654185 & 0.6310573 & 0.1035242
\end{array} \right)

$$ Après division par la racine du profil moyen (coordonnée par coordonnée) :
$$
\left( \begin{array}{ccc}
0.1227191 & 0.6741035 & 0.9471186 \\
0.1331796 & 0.910848 & 0.4916226 \\
0.6539441 & 0.7818934 & 0.2414243
\end{array} \right)

$$ D'où la matrice de variance covariance (j'ai pensé à pondérer) :
$$
\left( \begin{array}{ccc}
0.2160773 & 0.0031106 & -0.210376 \\
0.0031106 & 0.0290859 & -0.0576889 \\
-0.210376 & -0.0576889 & 0.3077056
\end{array} \right)

$$ Mais quand je compare la trace de cette matrice et $1/n \times \chi_2$ je n'ai pas la même chose. Les valeurs propres ne sont pas les bonnes non plus (j'ai repris un exemple non détaillé utilisé simplement pour s’entraîner à interpréter les graphiques). Mais en revanche, la trace de V est bien égale à l'inertie (avec distance du khi-deux).

J'ai revérifié mon fichier scinote plusieurs fois, je ne pense pas que l'erreur vienne de là.
Quelqu'un saurait-il me dire si j'ai bien compris le lien entre ACP et AFC ? Sinon, à quelle matrice faut-il appliquer l'ACP classique (si une telle matrice existe) ? Si vous avez une ressource en ligne qui traite de la partie mathématique cela m’intéresse.
Merci d'avance,
Eurk

Réponses

  • Bon j'ai honte, mais après avoir relu mon fichier scinote une quinzième fois, il y avait bien une erreur, tout semble finalement fonctionner, mais j'ai tout de même une question, comment savoir comment superposer les acp des profils lignes et profils colonnes dans le bon sens, sachant que pour chaque valeur propre dans mes acp j'ai deux vecteurs propres normés associés ?

    Merci,
    Eurk
  • Bonsoir,

    L'analyse d'un tableau de contingence n'est pas un cas particulier de l'analyse en composantes principales à moins de faire des changements de variables en traitant les deux espaces de manière distincte. L'analyse en composantes principales peut utiliser n'importe quelle métrique mais cela ne veut pas dire que l'AFC est une ACP munie de la distance du $\chi^{2}$.
    En ce qui concerne la première phrase de ce post, si tu y tiens, je pourrais faire un petit "topo" sur le traitement d'un tableau croisé par l'analyse en composantes principales.

    Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.