plan D-optimal
Bonjour,
Qu'est-ce qu'un plan D-optimal ? Je ne trouve que des romans à ce propos sur le ouebbe mais guère de définition mathématique (comme souvent, et malheureusement, en stats)
J'ai l'impression, d'après ce que j'ai vu, que dans le cas du modèle linéaire, choisir un plan D-optimal revient à choisir la matrice de 'design' (des prédicteurs) en sorte que la variance des estimateurs soit minimale. Mais cette matrice est plutôt imposée par le problème en question et le bon sens, je ne comprends pas quelle liberté on a dans le choix de la matrice. Mais ce n'est peut-être pas ça.
Qu'est-ce qu'un plan D-optimal ? Je ne trouve que des romans à ce propos sur le ouebbe mais guère de définition mathématique (comme souvent, et malheureusement, en stats)
J'ai l'impression, d'après ce que j'ai vu, que dans le cas du modèle linéaire, choisir un plan D-optimal revient à choisir la matrice de 'design' (des prédicteurs) en sorte que la variance des estimateurs soit minimale. Mais cette matrice est plutôt imposée par le problème en question et le bon sens, je ne comprends pas quelle liberté on a dans le choix de la matrice. Mais ce n'est peut-être pas ça.
Réponses
-
Bonjour Steven.
Saporta règle ça en une ligne. Son modèle est $y=X\beta+e$ et il dit que le critère "revient à minimiser le volume de l'ellipsoïde de confiance des $\beta$ pour un niveau de confiance donnée".
Ce critère est en fait utilisé avant la construction du plan, donc sans tenir compte des possibilités de recueil des données (*) : ".. on cherchera des propriétés d'optimalité de la matrice de variance-covariance de $\beta$ ... L'optimum ne dépend que de X et non de la réponse."
Enfin il faut bien saisir que s'il existe d'autres critères, c'est bien que la D-optimalité n'est pas une panacée.
A noter : Je ne suis pas un spécialiste des plans d'expériences. Prends ma réflexion pour ce qu'elle vaut.
Cordialement.
(*) Un oubli fréquent des utilisateurs, qui commencent par recueillir des données puis se demandent "comment les interpréter ?". -
Bonjour !
Pour répondre à ta question et bien c'est relativement simple
Etant donné un modèle linéaire Y=Xb+e (je suis nouveau ici j'ai pas encore capté comment vous introduisez le mode "maths") mis en oeuvre sur un plan d'expérience donné, la D-efficacité de ce plan (D pour Déterminant) est la valeur du déterminant de la matrice d'information tXX (transposée de X par X).
Ensuite si plusieurs plans sont "en compétition" celui qui maximise ce critère est D-optimal.
L'intérêt profond de cette affaire est que le déterminant d'une matrice carrée introduit un ordre sur les matrices et ainsi on cherche en quelque sorte la "plus grande" des matrices d'information. Comme la matrice de covariance des estimateurs des moindre carrés des paramètres du modèle est proportionnelle à l'inverse de la matrice d'information, ceci nous assure donc d'obtenir les estimateurs ayant la "plus petite dispersion" selon cet ordre.
Quand à la remarque de Saporta donnée plus haut il fait référence à l'interprétation géométrique associée au calcul de ce déterminant.
Pour généraliser si ensuite on vous parle de A optimalité et bien les matrices sont ordonnées suivant leur trace (A pour Average car c'est équivalent à faire la moyenne des termes diagonaux) et pour la E optimalité l'ordre est cette fois basé sur la plus grande des valeurs propos (E comme Extremal).
Voila (:D -
Ok merci à vous deux, c'est très clair pour la D-optimalité.
Mais pour la A-optimalité et la E-optimalité, quel intérêt de choisir le plan avec la plus grande trace ou la plus grande valeur propre ? -
Re :P
Concernant ta question il me semble que la A-optimalité est la notion la plus "naturelle" (dumoins au premier abord).
L'objectif est alors en effet de minimiser la trace de l'inverse de la matrice tXX.
C'est à dire qu'à une constante multiplicative près on cherche à minimiser la somme des éléments diagonaux de la matrice de covariances .... donc on veut minimiser la somme (ou la moyenne si tu préfères) des variances associées aux estimateurs des paramètres de ton modèle.
Pour la E-optimalité il s'agit d'avoir une sorte de "borne supérieure" (toujours pour la dispersion de tes estimateurs) que l'on cherche à minimiser.
La D-optimalité reste cependant la propriété la plus recherché car elle vérifie des propriétés sympathiques que n'ont pas es deux "collègues" citées plus haut (facilité de calcul et invariance par changement de variable affine en particulier).
Ceci dit des optimalités plus fortes existent ausi pour les plans d'expérience, optimalités qui vont automatiquement entrainer les A, D et E optimalités B-)- -
Walter écrivait:
> Comme la matrice de covariance des
> estimateurs des moindre carrés des paramètres du
> modèle est proportionnelle à l'inverse de la
> matrice d'information, [..].
Hello,
Why ? J'ai déjà lu ça à plusieurs endroits mais j'ai jamais compris pourquoi. C'est fastoche à montrer ou pas ? -
Salut Milamber !
Oui c'est très facile à démontrer (mais j'ai la flemme de mettre du TeX là en cette fin de week-end ... lol).
En fait tu ecris la définition de l'estimateur des moindres carrés (qui est égal à (tXX)-1tXY puis tu calcules la matrice des covariances de cette expression et c'est quasi-immédiat (il faut utiliser les propriétés des matrices de covariances, et c'est simple car seul le vecteur Y est aléatoire).
Si c'est pas clair je mettrais la démonstration en TeX -
bonjour
pour construire un plan d'expérience D optimal et déterminer la matrice d'information qui vous donne le Déterminant le plus grand vous pouvez utiliser des algorithmes d’échange comme DETMAX. Avec DETMAX vous pouvez avoir la matrice qui vous donne la variance la plus faible sur la prédiction des paramètres du modèle.
j'ai déjà essayé cette méthode avec Dohelert qui n'est pas D optimal , et avec les algorithmes d’échange et en ajoutant d'autres expériences supplémentaires j'ai pu validé le modèle. -
Bonjour
est ce que vous pouvez me donner un exemple statique / dynamique, pour la D-optimalité car je sais pas comment faire?
pour l'estimateur des moindres carrés qui est égal à (tXX)-1tXY est ce qu'on maximise le determinant de (tXX), ou de la matrice de covariance?
je vous remercie -
Je voudrais savoir le type de problème de formulation où on dit forcement utiliser un plan D-optimal!
Quand est ce que ce plan est nécessaire pour les problèmes de formulation alimentaire!
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 165.5K Toutes les catégories
- 64 Collège/Lycée
- 22.2K Algèbre
- 37.6K Analyse
- 6.3K Arithmétique
- 61 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 26 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.8K Géométrie
- 85 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 79 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 29 Mathématiques et finance
- 343 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.4K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 804 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres