Distribution bivariée

Bonjour

J'ai découvert qu'on pouvait modéliser de façon interessante certains phénomènes en ayant recours à une loi normale dite bivariée.
Après un petit coup de Google, j'en ai trouvé la fonction de répartition, mais assez peu d'explications, je ne suis pas très avancé. Elle dépend de trois paramètres dont le 3eme semble etre le coefficient de corrélation des 2 premiers (étrange...).

Si quelqu'un ici (et je n'en doute pas ;) ) a deja manipulé cette loi, pourrait-il m'en toucher 2 mots (à quoi correspondent les paramètres, en quoi diffère t-elle d'une loi normale standard?? ) afin que je fasse plus ample connaissance avec cet animal qui m'est a priori assez mystérieux.

Merci beaucoup

Réponses

  • A priori, tu n'a besoin que de deux paramètres (memes si dans ce cas ils sont multidimensionnels : l'espereance de ta loi M (vecteur avec les deux esperances des lois unidimensionnelles) et la matrice de variance covariance S qui te renseigne sur les variances des deux lois unidim et leur covariance (et donc leur corrélation...)

    Avec ces deux éléments, tu peux ecrire la densité de ta loi, qui doit etre du genre

    {1/racine(2Pi det(S))}*exp{-1/2*(X-M)*S(-1)*(X-M)'} ou X est un parametre de Rn (ici R2)...

    je sais, ça n'est pas clair et pas très complet, mais c'est un premier pas...
  • ps : la définition d'une loi normale multidimensionnelle est que n'importe quelle combinaison linéaire entre les différentes compostantes est une loi normale. ie le vecteur X est Gaussien si pour toute matrice A (avec des dimensions adaptés au vecteur...), AX suis une loi normale unidimensionnelle.
    c'est juste une définition mais il n'est pas inutile de s'en rappeler...
  • Lorsque l'on doit faire appel à des couples de gaussiennes, on introduit leur fonction de répartition $P(X \leq s,Y \leq t)$ qui caractérise entièrement le couple. Autrement dit, dès que l'on connait cette fonction, on sait tout ce qu'il y a à savoir sur le couple de variable aléatoire $(X,Y)$.

    Or on montre aisément que cette grandeur ne dépend que de trois réels: $s$ et $t$ évidemment, et surtout $\rho=Corr(X,Y)$. C'est pourquoi on l'écrit souvent sous la forme d'une fonction de trois variables $M(s,t,\rho)$. Cette fonction caractérise donc le couple.

    @+
  • Merci à vous 2.
    Qd on parle de loi multinormale, et de loi normale multivariée, on parle de choses absolument differentes , n est ce pas ?
  • Oui,
    la loi multinomiale est une généralisation d'une binomiale, mais je pourrai pas t'en dire plus parcque j'ai toujours essayé de la fuire...
  • Pas multinomiale !! MultinoRmale, celle avec un vecteur de moyennes.
    Je suis dans les processus stochatiques continus.


    Je pense qu'une loi normale multivariée, c'est tout autre chose. Si qqn le sait, ça pourrait pas mal m'éclairer...

    Merci d'avance
  • oups, désolé... Des fois le cerveau va plus vite que les yeux...
  • sinon je pense que une loi normale multivarié c'est juste un vecteur Gaussien (cf la définition que j'ai donnée plus haut), comme pour ta distibution bivariée mais en plus général...
    A part ça je suis pas trop calé en processus stochastiques continus...
  • Je ne crois pas qu'il s'agisse de ça mm si je peux me tromper....
    La définition de Sigma est bcp plus proche de ce que je cherche.

    J'aurais souhaité qu'il me précise ce que sont ses parametres s et t, puisque considérant une loi normale bivariée, il ne s'agit pas ici de la moyenne et de l'écart type
  • Non en fait Sigma, ça va aller.
    J'ai mis ton message plus haut dans le compilateur Latex... et les inégalités sont apparues... et la lumière fut !!!
  • Une loi multinormale et une loi normale multivariée désigne exactement la même chose.
    Une loi normale multivariée est entièrement définie par la donnée de son espérance et de sa matrice de variance-covariance, cette dernière étant composée sur la diagonale des variances de chaque composante et de termes extra-diagonaux représentant les covariances (c'est à dire les corrélations à une facteur multiplicatif près) des composantes les une vis à vis des autres. Cette matrice est diagonale.
    Dans le cas particulier bivarié, une loi normale bidimensionnelle est donc définie totalement par la donnée des espérances de chaque composante (2), de la variance de chaque composante (2) et de la corrélation entre les deux (1) ce qui fait 5 paramètres.
    Je suis donc désolé de contredire tout le monde, mais sans hypothèse supplémentaire vous ne pourrez absolument pas caractériser une loi binormale avec seulement 3 paramètres.
  • Ce que tu dis m'évoque des souvenirs d'économétrie. En effet on utilise un modèle de regression multiple dont le cas particulier est la regression simple. C-a-d l'estimation de a et b de l'équation $y = a + bx$. On ajoute conventionnellement un bruit $\mu$ additivement à l'équation. Qd on passe du modèle simple au modèle généralisé, la loi de ce bruit est multinormale.

    Cependant Kuja, bien que ce que tu dis me semble très cohérent, si on note comme le disait sigma la loi Normale bivariée
    $\M(s,t,\rho)$ (ce qui est sûr), comment expliques-tu que la fonction de répartition qui définit bien totalement la loi ne dépende que de ces 3 paramètres ??
    Cela signifie que lorsqu'on dépasse l'ordre 2, $\rho$ désigne en fait la matrice symétrique des variances-covariances ?
  • Okay,

    ce qui est sûr, c'est qu'on {\bf ne note pas} une loi normale bivariée $(s,t,\rho)$. Il y a dans cette notation un énorme mélange de notations diverses et variées. Pour être rigoureux, il y a trois manières de noter une loi normale bivariée $(X,Y)$ :

    1) la formule condensée $\mathcal{N}(\mu, \Sigma)$ où $\mu=[E(X) E(Y)]'$ est le vecteur ligne de dimension $2$ des espérances et où $\Sigma=\begin{array}{cc} \textrm{Var}(X) & \textrm{Cov}(X,Y)\\ \textrm{Cov}(X,Y) & \textrm{Var}(Y)\\ \end{array}$$ est la matrice de variance-covariance.

    2) en donnant la densité du couple $(X,Y)$ :

    $$f_{X,Y}(x,y)=\frac{1}{2\pi \textrm{det}(\Sigma} \exp(-\frac{1}{2}([x y] \Sigma^{-1} [x y]'))$$

    3) en donnant la fonction de répartition du couple $(X,Y)$ :

    $$F_{X,Y}(t,s)=P(X\leq t,Y \leq s)=\int_{-\infty}^t \int_{-\infty}^s f_{X,Y}(x,y) dxdy$$

    Je pense que ta faute est de considérer $t$ et $s$ comme des paramètres de la loi normale. Ce sont juste les variables (muettes) intervenant dans la définition de la fonction de répartition. En revanche le coefficient de corrélation est bien un paramètre, mais il t'en manque 4 autres (les deux espérances et les deux variances).
  • Okay,\\
    \\
    ce qui est sûr, c'est qu'on {\bf ne note pas} une loi normale bivariée $(s,t,\rho)$. Il y a dans cette notation un énorme mélange de notations diverses et variées. Pour être rigoureux, il y a trois manières de noter une loi normale bivariée $(X,Y)$ :\\
    \\
    1) la formule condensée $\mathcal{N}(\mu, \Sigma)$ où $\mu=[E(X) E(Y)]'$ est le vecteur ligne de dimension $2$ des espérances et où $$\Sigma=\begin{array}{cc} \textrm{Var}(X) & \textrm{Cov}(X,Y)\\ \textrm{Cov}(X,Y) & \textrm{Var}(Y)\\ \end{array}$$ est la matrice de variance-covariance.\\
    \\
    2) en donnant la densité du couple $(X,Y)$ :\\
    \\
    $$f_{X,Y}(x,y)=\frac{1}{2\pi \textrm{det}(\Sigma} \exp(-\frac{1}{2}([x y] \Sigma^{-1} [x y]'))$$\\
    \\
    3) en donnant la fonction de répartition du couple $(X,Y)$ :\\
    \\
    $$F_{X,Y}(t,s)=P(X\leq t,Y \leq s)=\int_{-\infty}^t \int_{-\infty}^s f_{X,Y}(x,y) dxdy$$\\
    \\
    Je pense que ta faute est de considérer $t$ et $s$ comme des paramètres de la loi normale. Ce sont juste les variables (muettes) intervenant dans la définition de la fonction de répartition. En revanche le coefficient de corrélation est bien un paramètre, mais il t'en manque 4 autres (les deux espérances et les deux variances).
  • Okay,\\\\
    \\\\
    ce qui est sûr, c'est qu'on {\bf ne note pas} une loi normale bivariée $(s,t,\rho)$. Il y a dans cette notation un énorme mélange de notations diverses et variées. Pour être rigoureux, il y a trois manières de noter une loi normale bivariée $(X,Y)$ :\\\\
    \\\\
    1) la formule condensée $\mathcal{N}(\mu, \Sigma)$ où $\mu=[E(X) E(Y)]'$ est le vecteur ligne de dimension $2$ des espérances et où $$\Sigma=\left[\begin{array}{cc} \textrm{Var}(X) & \textrm{Cov}(X,Y)\\ \textrm{Cov}(X,Y) & \textrm{Var}(Y)\\ \end{array}\right]$$ est la matrice de variance-covariance.\\\\
    \\\\
    2) en donnant la densité du couple $(X,Y)$ :\\\\
    \\\\
    $$f_{X,Y}(x,y)=\frac{1}{2\pi \textrm{det}(\Sigma} \exp(-\frac{1}{2}([x y] \Sigma^{-1} [x y]'))$$\\\\
    \\\\
    3) en donnant la fonction de répartition du couple $(X,Y)$ :\\\\
    \\\\
    $$F_{X,Y}(t,s)=P(X\leq t,Y \leq s)=\int_{-\infty}^t \int_{-\infty}^s f_{X,Y}(x,y) dxdy$$\\\\
    \\\\
    Je pense que ta faute est de considérer $t$ et $s$ comme des paramètres de la loi normale. Ce sont juste les variables (muettes) intervenant dans la définition de la fonction de répartition. En revanche le coefficient de corrélation est bien un paramètre, mais il t'en manque 4 autres (les deux espérances et les deux variances).
  • Okay,

    ce qui est sûr, c'est qu'on {\bf ne note pas} une loi normale bivariée $(s,t,\rho)$. Il y a dans cette notation un énorme mélange de notations diverses et variées. Pour être rigoureux, il y a trois manières de noter une loi normale bivariée $(X,Y)$ :

    1) la formule condensée $\mathcal{N}(\mu, \Sigma)$ où $\mu=[E(X) E(Y)]'$ est le vecteur ligne de dimension $2$ des espérances et où $$\Sigma=\left[\begin{array}{cc} \textrm{Var}(X) & \textrm{Cov}(X,Y)\\ \textrm{Cov}(X,Y) & \textrm{Var}(Y)\\ \end{array}\right]$$ est la matrice de variance-covariance.

    2) en donnant la densité du couple $(X,Y)$ :
    $$f_{X,Y}(x,y)=\frac{1}{2\pi \textrm{det}(\Sigma} \exp(-\frac{1}{2}([x y] \Sigma^{-1} [x y]'))$$

    3) en donnant la fonction de répartition du couple $(X,Y)$ :
    $$F_{X,Y}(t,s)=P(X\leq t,Y \leq s)=\int_{-\infty}^t \int_{-\infty}^s f_{X,Y}(x,y) dxdy$$
    Je pense que ta faute est de considérer $t$ et $s$ comme des paramètres de la loi normale. Ce sont juste les variables (muettes) intervenant dans la définition de la fonction de répartition. En revanche le coefficient de corrélation est bien un paramètre, mais il t'en manque 4 autres (les deux espérances et les deux variances).
  • Okay,

    ce qui est sûr, c'est qu'on {\bf ne note pas} une loi normale bivariée $(s,t,\rho)$. Il y a dans cette notation un énorme mélange de notations diverses et variées. Pour être rigoureux, il y a trois manières de noter une loi normale bivariée $(X,Y)$ :

    1) la formule condensée $\mathcal{N}(\mu, \Sigma)$ où $\mu=[E(X) E(Y)]'$ est le vecteur ligne de dimension $2$ des espérances et où $$\Sigma=\left[\begin{array}{cc} \textrm{Var}(X) & \textrm{Cov}(X,Y)\\ \textrm{Cov}(X,Y) & \textrm{Var}(Y)\\ \end{array}\right]$$ est la matrice de variance-covariance.

    2) en donnant la densité du couple $(X,Y)$ :
    $$f_{X,Y}(x,y)=\frac{1}{2\pi \textrm{det}(\Sigma)} \exp(-\frac{1}{2}([x \ \ y] \Sigma^{-1} [x \ \ y]'))$$
    3) en donnant la fonction de répartition du couple $(X,Y)$ :
    $$F_{X,Y}(t,s)=P(X\leq t,Y \leq s)=\int_{-\infty}^t \int_{-\infty}^s f_{X,Y}(x,y) dxdy$$
    Je pense que ta faute est de considérer $t$ et $s$ comme des paramètres de la loi normale. Ce sont juste les variables (muettes) intervenant dans la définition de la fonction de répartition. En revanche le coefficient de corrélation est bien un paramètre, mais il t'en manque 4 autres (les deux espérances et les deux variances).
  • Merci beaucoup ceci est tres clair.
    Non je n'ai pas confondu s et t avec les parametres de la loi normale, puisque lorsque la loi est bivariée cela correspond a la probilité que la première variable $X$ soit inférieure ou égale à $t$ et et que la seconde soit inférieure ou égale à $s$, comme le disait Sigma plus haut.
    Par contre, que tu aies raison ou tort, j'ai un bouquin sous les yeux (certes ce n'est pas un bouquin de maths ou de probas, ce qui ne plaide pas pour lui...) où cette loi est effectivement notée $ M (s,t,\rho)$, comme le disait aussi Sigma.

    Je te suis dans le sens où le coefficient de corrélation ne permet pas de donner les variances et les covariances, il ne fait que les "résumer" sans les expliciter si je peux dire.
  • Je vais être désolé d'insister (désolé d'être lourd :-)) mais la seule donnée de la corrélation ne suffit absolument pas, à moins qu'on se trouve dans le cas particulier (c'est peut être ça dans ton bouquin) où les deux espérances sont nulles et les deux variances égales à 1. Alors là, oui, celà ne dépend que de la corrélation. Dans tous les autres cas, ça ne peut pas se produire.
  • Tu as raison Kuja. Je m'étais auto-restreint à des centrées réduites, ce qui n'avait pas raison d'être.

    @+
  • Non non pas la peine d'insister !! J'ai bien marqué au dessus que je comprenais parfaitement bien pourquoi le coefficient de corrélation n'était pas suffisant pour caractériser la loi.
    <BR>
    <BR>Tu as répondu entièrement à mes interrogations, ne t'en fais pas, je ne reste pas avec des idées fausses en tête, all is crystal clear !
    <BR>
    <BR>Je confirme que le cas traité par mon bouquin se réduit a des centrées réduites car les variables de Gauss du cas en question sont issues d'un mouvement brownien <I>standard</I>, je savais bien qu'il était fiable mon bouquin !!
    <BR>
    <BR>Décidemment je ne regrette pas d'avoir recemment découvert ce forum où les débats sont toujours très constructifs.<BR>
  • Le principal, c'est que les choses soient claires, et je n'en étais pas sûr.
    Du coup je suis encore une fois désolé d'avoir insisté à ce point et d'avoir été (peut être) en apparence agressif. Je reviens à peine de vacances encore plus fatigué que quand je suis parti, ceci explique peut être celà :-)
  • Il n'y a aucun problème! c'est moi qui te remercie d'avoir fait le ménage parmi ces notions et d'avoir été disponible ;)
Connectez-vous ou Inscrivez-vous pour répondre.