variance d'un coefficient de corrélation
Bonjour,
J'ai besoin de calculer la variance d'un coefficient de corrélation. Je n'ai pas trouvé de formule toute faite, donc j'ai essayé la chose suivante:
Soient X et Y, 2 séries aléatoires, distribuées par exemple comme des lois normales, je sais que, si r est leur coefficient de correlation de Pearson,
$\frac{r\sqrt{n-2}}{1-r^2}$
est une student. J'en conclus que r se distribue comme
$\frac{t}{\sqrt{N-2+t^2}},$
où t est une Student...
Je prends alors la formule que j'ai prise ici: http://www.les-mathematiques.net/phorum/read.php?12,359583 :
$var(U/V)=\frac{var(U)}{E(V)^2}+var(V)\frac{E(U)^2}{E(V)^4}-2*cov(U,V)*\frac{E(U)}{E(V)^3}+...$
Comme t est d'espérance nulle, les termes en E(U) tombent et j'ai uniquement
$var(U/V)=\frac{var(U)}{E(V)^2}$
Soit, dans mon cas
$var(r)=\frac{var(t)}{E(\sqrt{N-2+t^2})^2}$
Je sais que t^2 est distribué comme une Fisher avec 1,N-2 degrés de libertés, et a donc une moyenne de (N-2)/(N-4).
Ensuite, comme je suis un peu gonflé, je dis que
$E(\sqrt{N-2+t^2})=\sqrt{N-2+(N-2)/(N-4)}=\sqrt{(N-2)(N-3)/(N-4)}...$ C'est peut-être un peu osé, mais comme ce qu'il y a sous la racine est positif par construction, je ne vois pas de raison de ne pas le faire, et les simulations numériques que j'ai faites semblent être d'accord.
Donc, j'arrive à
var(r)= (N-2)/(N-4)/((N-2)(N-3)/(N-4))=1/(N-3)
C'est une solution assez élégante à mon problème, mais pas tout à fait juste... En réalité, il semblerait que
var(r)= (N-4)/((N-2)(N-3)) est plus près de la réalité, dans mes simulations. Est-ce que quelqu'un peut me dire où j'ai planté?
S'il existe une référence avec le résultat de var(r) tout pondu, je suis également prenneur.
Merci
J'ai besoin de calculer la variance d'un coefficient de corrélation. Je n'ai pas trouvé de formule toute faite, donc j'ai essayé la chose suivante:
Soient X et Y, 2 séries aléatoires, distribuées par exemple comme des lois normales, je sais que, si r est leur coefficient de correlation de Pearson,
$\frac{r\sqrt{n-2}}{1-r^2}$
est une student. J'en conclus que r se distribue comme
$\frac{t}{\sqrt{N-2+t^2}},$
où t est une Student...
Je prends alors la formule que j'ai prise ici: http://www.les-mathematiques.net/phorum/read.php?12,359583 :
$var(U/V)=\frac{var(U)}{E(V)^2}+var(V)\frac{E(U)^2}{E(V)^4}-2*cov(U,V)*\frac{E(U)}{E(V)^3}+...$
Comme t est d'espérance nulle, les termes en E(U) tombent et j'ai uniquement
$var(U/V)=\frac{var(U)}{E(V)^2}$
Soit, dans mon cas
$var(r)=\frac{var(t)}{E(\sqrt{N-2+t^2})^2}$
Je sais que t^2 est distribué comme une Fisher avec 1,N-2 degrés de libertés, et a donc une moyenne de (N-2)/(N-4).
Ensuite, comme je suis un peu gonflé, je dis que
$E(\sqrt{N-2+t^2})=\sqrt{N-2+(N-2)/(N-4)}=\sqrt{(N-2)(N-3)/(N-4)}...$ C'est peut-être un peu osé, mais comme ce qu'il y a sous la racine est positif par construction, je ne vois pas de raison de ne pas le faire, et les simulations numériques que j'ai faites semblent être d'accord.
Donc, j'arrive à
var(r)= (N-2)/(N-4)/((N-2)(N-3)/(N-4))=1/(N-3)
C'est une solution assez élégante à mon problème, mais pas tout à fait juste... En réalité, il semblerait que
var(r)= (N-4)/((N-2)(N-3)) est plus près de la réalité, dans mes simulations. Est-ce que quelqu'un peut me dire où j'ai planté?
S'il existe une référence avec le résultat de var(r) tout pondu, je suis également prenneur.
Merci
Réponses
-
Soient X et Y, 2 séries aléatoires, distribuées par exemple comme des lois normales, je sais que, si r est leur coefficient de correlation de Pearson, $\frac{r\sqrt{n-2}}{1-r^2}$ est une student.
Mais je ne crois pas du tout à ton affirmation. Je veux bien croire que peut-être que $\frac{r\sqrt{n-2}}{1-r^2}$ est "une student" quand $X$ et $Y$ sont des gaussiennes indépendantes, mais certainement pas dans un cas plus général. -
Exact, n'etant pas mathematicien, j'ai un peu perdu l'habitude d'ecrire toutes mes hypotheses... Desolé.
Donc, oui, mes variables sont independantes. En outre, meme si elles ne sont pas exactement Gaussienne, elles
le sont assez pour que l'hypothese si dessus soient justifiee dans les faits. -
Ok donc je dirais que $R^2$ suit une loi Bêta et que $R$ a autant de chance d'être $\sqrt{R^2}$ que $-\sqrt{R^2}$. À vérifier mais ça doit être à peu près ça.
-
OK, merci... Une sorte d'idée d'où cela viendrait?
Merci encore,
odv -
- Si $T$ suit une loi de Student avec $d$ degrés de liberté alors $T^2$ suit une loi de Fisher $F(1,d)$.
- Si $U$ suit une loi Bêta $B(c,d)$ alors $\frac{U}{1-U}$ suit une loi Bêta prime $B'(c,d)$.
- Si $X$ suit une loi de Fisher $F(2c,2d)$ alors $\frac{c}{d} X$ suit une loi Bêta prime $B'(c,d)$.
Reste à justifier que $E[R]=0$ et cela donne la variance en connaissant la variance d'une loi Bêta. -
-
Merci de votre aide.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 165.1K Toutes les catégories
- 60 Collège/Lycée
- 22.1K Algèbre
- 37.5K Analyse
- 6.3K Arithmétique
- 58 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 20 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.7K Géométrie
- 83 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 79 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 337 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 801 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres