Répartition du terme d'erreur
dans Statistiques
Bonjour a tous,
Je vais tenter d'expliquer mon probleme de maniere assez schematique (et j'espere assez claire!) :
Supposons que j'estime trois quantites differentes $A$, $B$ et $C$ (on notera les estimateurs $a$, $b$ et $c$ respectivement).
Je dispose d'une identite comptable entre mes trois quantites, par exemple $A=B+C$. Evidement, la probabilite que mes estimateurs satisfassent cette identite est nulle.
On ecrira donc $a = b + c + \varepsilon$, ou $\varepsilon$ est un residu.
Je souhaiterai ensuite affecter la valeur de $\varepsilon$ a mes differents estimateurs, c'est a dire construire des estimateurs modifies $\hat{a}$, $\hat{b}$ et $\hat{c}$ tels que $\hat{a}=\hat{b}+\hat{c}$. Une facon de faire est de distribuer $\varepsilon$ a chaque estimateur en fonction de sa variance relative :
$\hat{a} = a-\frac{Var(a)}{Var(a)+Var(b)+Var(c)}\varepsilon $
\\
$\hat{b} = b+\frac{Var(b)}{Var(a)+Var(b)+Var(c)}\varepsilon $
\\
$\hat{c} = c+\frac{Var(c)}{Var(a)+Var(b)+Var(c)}\varepsilon $
\\
Ainsi on aura bien l'egalite $\hat{a}=\hat{b}+\hat{c}$.
Je voulais savoir si quelqu'un avait deja rencontre des articles discutant de ce genre de problematique.Toutes les references sont les bienvenues!
Merci d'avance.
Yves
Je vais tenter d'expliquer mon probleme de maniere assez schematique (et j'espere assez claire!) :
Supposons que j'estime trois quantites differentes $A$, $B$ et $C$ (on notera les estimateurs $a$, $b$ et $c$ respectivement).
Je dispose d'une identite comptable entre mes trois quantites, par exemple $A=B+C$. Evidement, la probabilite que mes estimateurs satisfassent cette identite est nulle.
On ecrira donc $a = b + c + \varepsilon$, ou $\varepsilon$ est un residu.
Je souhaiterai ensuite affecter la valeur de $\varepsilon$ a mes differents estimateurs, c'est a dire construire des estimateurs modifies $\hat{a}$, $\hat{b}$ et $\hat{c}$ tels que $\hat{a}=\hat{b}+\hat{c}$. Une facon de faire est de distribuer $\varepsilon$ a chaque estimateur en fonction de sa variance relative :
$\hat{a} = a-\frac{Var(a)}{Var(a)+Var(b)+Var(c)}\varepsilon $
\\
$\hat{b} = b+\frac{Var(b)}{Var(a)+Var(b)+Var(c)}\varepsilon $
\\
$\hat{c} = c+\frac{Var(c)}{Var(a)+Var(b)+Var(c)}\varepsilon $
\\
Ainsi on aura bien l'egalite $\hat{a}=\hat{b}+\hat{c}$.
Je voulais savoir si quelqu'un avait deja rencontre des articles discutant de ce genre de problematique.Toutes les references sont les bienvenues!
Merci d'avance.
Yves
Réponses
-
Desole, j'ai oublie de remettre le theme Statistique apres avoir fait l'appercu Latex.
Cordialement,
Yves -
Bonjour.
Je ne connaissais pas la méthode. Mais il est assez facile de voir qu'elle est biaisée : On diminue toujours a au profit d'une augmentation de b et c. Donc si a, b et c sont sans biais, les nouveaux estimateurs sont biaisés.
Mais je ne vois pas de méthode pour y remédier.
Cordialement -
Bonjour Gerard,
Merci beaucoup pour votre participation!
Supposons que nos estimateurs soient sans biais et que leurs lois de propabilite soient symetriques autour de la vraie valeur (et tant qu'a faire qu'ils soient independants entre eux).
Alors si je ne m'abuse le residu suit une loi symetrique centree sur 0. Dans ce cas la cette technique n'entrainerai pas forcement un biais systematique. Qu'en pensez vous?
Une autre precision : on applique cette technique de repartition de l'erreur seulement lorsque cette derniere est inferieure a 5% de A. Autrement on invite seulement les personnes concernee a revoir leurs estimations. Que penser de ce seuil de 5%?
Enfin, je tiens a preciser que ce probleme est assez concret et ne proviens pas de la theorie, donc la methode que je propose n'a peut etre aucune justification scientifique..
Cordialement,
Yves -
En fait il est aise de voir que les estimateur $\hat{a}$, $\hat{b}$ et $\hat{c}$ sont des estimateurs sans biais de $A$, $B$ et $C$. Les poids utilises (variances relatives) permettent de minimiser la variance de ces nouveaux estimateurs.
Cordialement,
Yves -
Bonsoir Yves
As-tu pensé à utiliser la méthode dite "du couteau" mise au point par Newton?
Cordialement
Jimmy -
Bonjour.
Effectivement, les nouveaux estimateurs sont sans biais (si a, b et c le sont); J'avais oublié le $\varespilon$ dont on peut supposer la moyenne nulle.
Quant au seuil de 5 pour cent, il n'a sans doute pas de justification théorique. Mais c'est le seuil le plus classique en estimation, et il en faut un.
Par contre, je reviens sur la question du début. Tu dis " Evidement, la probabilité que mes estimateurs satisfassent cette identité est nulle." et ça me paraît loin d'être vrai. Tout dépend de la construction des estimateurs. Si on estime A par b+c, on aura bien a=b+c. Ce qui m'amène à m'interroger sur ce que tu dis dans ton avant dernier message :"on applique cette technique de repartition de l'erreur seulement lorsque cette derniere est inferieure a pour cent de A". Sur quoi porte l'erreur ? Sur les estimateurs ? Ou sur les estimations ? Car je ne saisis pas bien ce que peut être la situation ou un estimateur sans biais se trompe systématiquement de pour cent. Et si on modifie les réponses suivant qu'elles se coordonnent ou pas, on prend le risque de créer un biais.
Cordialement -
Bonjour,
\\
Je vais preciser un peu la situation :
\\
Bien qu'on dispose de l'identite $A = B+C$, $A$, $B$ et $C$ sont tout trois estimes independamment. On n'utilise donc pas la relation comptable pour notre premiere estimation. Si on suppose que les variables aleatoires sont continues, alors en effet la probabilite d'avoir $a = b +c$ est nulle.
\\
Le probleme est qu'il faut ensuite presenter un systeme balance. Ainsi, la methode proposee consiste a repartir l'erreur $\varepsilon = a - b - c$ afin de construire de nouveaux estimateurs sans biais tels que $\hat{a} = \hat{b} +\hat{c}$.
\\
Mais on se propose de n'utiliser cette methode que lorsque $\varepsilon \leq 5\%a$. Autrement, on suppose qu'il y a un autre element dans notre relation (en l'occurence des fuites), et le residu $\varepsilon$ n'est plus considere comme un residu mais comme des fuites.
\\
Je m'interoge donc sur ce seuil de 5\%, qui, comme tu le soulignes, est arbitraire. Peut-on avoir une approche plus scientifique?
\\
J'ai pense a une approche plus statistique : tout simplement tester la relation $a-b-c=0$. Si on accepte cette egalite, on accepte que le residu soit juste un simple residu, et on peut le repartir entre $a$, $b$ et $c$. Sinon, c'est qu'on a oublie quelque chose dans le modele (les fuites), et $\varepsilon$ representerait ces fuites.
\\
Le probleme de cette methode, je pense, est qu'il sera difficile de rejeter l'hypothese nulle si, au lieu de trois estimations ($A=B+C$), on doit effectuer dix estimations ($A=B+C+D+E+F+...$).
Qu'en pensez vous?
Je suis toujours preneur de toute litterature qui pourrait relever de la repartition d'erreur pour des systemes balances.
Cordialement,
Yves -
Salut Yves.
Je vois mieux sur quoi tu travailles. Par contre, je ne saisis pas comment tu peux savoir que l'estimateur $\varepsilon$ dépasse 5% de a. Je comprends comment on peut trouver que l'erreur estimée dépasse 5% de la valeur estimée de a, mais c'est sur des estimations. Et changer de modèle (d'estimateur) en fonction des résultats me semble assez malsain.
Une nouvelle question : Tu utilises dans ta correction les variances de a, b et c. C'est donc que tu les connais ?
A relire ton dernier message, je pense que tu es sur un autre problème que celui que tu as présenté au début (ou en tout cas une explication plus claire) : Tu as trois variables qui, s'il n'y a pas de fuites, vérifient la condition A = B + C. Par une méthode quelconque, on peut calculer indépendamment les valeurs de A, B et C par les estimateurs a, b et c. Et on appelle $\varepsilon$ l'estimateur a - b - c. Alors il est possible de tester l'hypothèse "il n'y a pas de fuites" à l'aide des estimateurs proposés. Ensuite, l'idée de pondérer les fuites sur les trois variables est une idée mathématique qui n'a peut-être aucun intérêt physique. Je ne saisis pas pourquoi une variable plus dispersée aurait plus de fuites (mais il y a peut-être une vraie raison).
Cordialement
NB : Je passe un message aux spécialistes de stats qui ont peut-être raté ce fil. -
Salut Gerard, \\\
On connait la quantite $\varepsilon$, puisque $\varepsilon = a-b-c$ par definition, et puisque $a$, $b$ et $c$ sont des quantites connues. Donc iol est aise de savoir si $\varepsilon$ est inferieur (en valeur absolue) a $5\%$ de $a$.
J'espere que je suis suffisament clair (ce qui n'est pas toujours le cas!)
Cordialement,
yves -
Non Yves, tu n'es pas parfaitement clair. Car tu sembles confondre les notions d'estimateur et d'estimation. Je m'explique : On fait un sondage d'opinion, en demandant une réponse par oui ou par non.
* La variable aléatoire q = (nombre de réponses oui) / (taille de l'échantillon) est un estimateur de la proportion réelle p de la population qui pense que oui.
* Suite au sondage, j'obtiens 120 oui sur les 500 sondés. r = 0,24 (120/500) est une estimation de la proportion réelle p de la population qui pense que oui.
L'estimation est une réalisation de l'estimateur, mais il est sain de bien faire la différence entre les deux. Quand tu dis que a, b et c sont des quantités connues, tu parles donc des estimations ? Mais que sont les estimateurs ?
Cordialement -
C'est vrai Gerard, tu fais bien de rappeler cette distinction fondamentale entre un estimateur (qui est une variable aleatoire) est une realisation de cet estimateur.\\\
Dans mes messages precedent, je faisais a la fois reference a un estimateur et a sa realisation. $a$, $b$ et $c$ sont des estimateurs, de meme que $\varepsilon$, qui est une combinaison lineaire de mes estimateurs. \\\
La ou la realisation des estimateurs intervient, c'est quand on decrit cette "regle des 5\%", car la on a besoin de nombres reels et non plus de variables aleatoires. En gros on se demande : "la realisation de mon estimateur $\varepsilon$, que j'observe, est elle significative (ment differente de 0)?". Si oui, ma relation de depart doit etre fausse.\\\
Dans ce que j'etudie, ils ont choisi de definir la significativite par $\varepsilon >5\%\cdot a$ (de maniere plus ou moins arbitraire).\\\
J'ai alors pense a effectuer le test $a-b-c=0$, et c'est la ou je me suis emmelle, car ce test ne veut pas dire grand chose puisque $a$, $b$ et $c$ sont des estimateurs. En fait le test devrait etre $H_0$ : $A-B-C=0$. On a suppose que c'etait vrai, mais une trop grande valeur du residu pourrait nous indiquer le contraire (et le vrai modele serait alors $A=B+C+F$, ou $F$ representerai les "fuites").
En ce qui concerne la provenance des estimateurs $a$, $b$ et $c$, je t'avoue que pour l'instant je ne m'en soucie pas trop du moment que j'en connais la variance. Mais si je veux pouvoir faire des tests, alors en effet il faut que je sache comment ces estimateurs ont ete obtenus.
Cordialement\\\
Yves\\\
ps : merci aux moderateurs qui passent apres moi et rajoutent des accents partout (et ameliorent aussi la mise en page)! -
Bonjour,
Je sais que le sujet n'a pas passionné les foules, mais j'ai trouve de la littérature intéressante du côté de l'estimation des comptes nationaux.
A partir de la page 33, le document dresse une méthodologie assez complète pour réajuster des estimations afin de satisfaire plusieurs équations comptables, et propose aussi des indicateurs de la qualité du modèle.
Yves
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 165.4K Toutes les catégories
- 63 Collège/Lycée
- 22.2K Algèbre
- 37.6K Analyse
- 6.3K Arithmétique
- 61 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 23 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.8K Géométrie
- 84 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 79 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 26 Mathématiques et finance
- 342 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 804 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres