Régression linéaire
Bonsoir à tous,
lorsque on effectue une régression linéaire simple de $Y$ en $X$, on obtient deux coefficients $a$ et $b$ de sorte que la v.a. $aX+b$ est la projection orthogonale de $Y$ sur $Vect(1,X)$ pour le produit scalaire "usuel". Le calcul de $a$ et $b$ nécessite de connaître les lois de $X$ et $Y$. Jusque ici tout va bien.
Lorsque on ne connait pas ces lois, on utilise des estimateurs. On connait des réalisations $(X_1,\dots,X_n)$ et $(Y_1,\dots,Y_n)$ de ces variables, on est alors en mesure d'estimer moyenne, écart-type, coefficient de corrélation...
Pour étudier la "validité" de l'ajustement affine, on est amené à calculer l'écart résiduel entre les résultats de $Y$ et les valeurs prises par les réalisations, cet écart est : $$\sum_{i=1}^n (Y_i-aX_i-b)^2$$
Cet écart fournit entre autre une estimation de la variance de $U=Y-aX-b$ non biaisée :
$$\frac{1}{n-2} \sum_{i=1}^n (Y_i-aX_i-b)^2$$
La question est : d'où vient ce satané $n-2$ ?
Bonne soirée
F.
F.
PS. N'étant pas familier des statistiques, il n'est pas totalement improbable que j'utilise parfois un vocabulaire inapproprié ;-)
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Mais je ne m’y suis pas plongé…
édit : ici, théorème 5, c’est bien $n-2$, j’ai confondu avec autre chose.
je vais jeter un oeil sur le poly de M. Chabano.
Bonne journée
F.
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
Comme tant d’autres choses, je note ça dans un coin de ma tête, dans le dossier « à faire ». Mais ces dossiers demandent certainement au moins une seconde vie 🤣
F.
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
***rien que de démarrer, déjà…
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
F.
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
Une bonne soirée à tous
F.
Pour comprendre la vidéo, il faut voir les précédentes pour comprendre le model surtout ce qui est déterministe et ce qui aléatoire. Je tente d'expliquer . On note que $\beta_0 $ et $\beta_1$ sont des paramètres et que leurs estimateurs $\hat \beta_0 $ et $\hat \beta_1$ qui sont des v.a sans biais.. Il faut savoir les propriétés de ces estimateurs . On note que les $\epsilon_i$ sont dans ce model des id.d. qui suivant la loi normale centré $E(\epsilon_i)=0$ il faut noter le caractère déterministe de $x_i$, donc on comprend bien que $E(\beta_0 +\beta_1 x_i+\epsilon_i)= \beta_0 +\beta_1 x_i$. On note le caractère aléatoire des $Y_i$ et que la moyenne $\bar Y$ est aussi une v.a, donc à ne pas croire que $E(\bar Y)$ est $\bar Y$ ( c'est la moyenne des moyenne).
Normalement dans mes archives, j'ai un cours niveau master qui explique bien ce model avec ce qu'il faut savoir et qui explique le conditionnement soulevé par Malavita , je vais le chercher dans la journée)
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
A+
F.
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique