Correction de Bonferroni et alternatives

dans Statistiques
Bonjour à tous !
J’aimerais obtenir de l’aide sur la correction de Bonferroni.
Pour vérifier le mode distribution de n espèces d’animaux, j’ai utilisé le test non paramétrique Kruskal-Wallis sur des donnés comportant des valeurs nulles (avec XLSTAT 2007 et R). Mais j’ai toujours obtenu les mêmes P-value pour différents échantillons.
- Existe-t-il d’autres alternatives pour ce même test ?
- Sinon pouvez- vous suggérer d’autres méthodes de correction ?
Merci beaucoup
J’aimerais obtenir de l’aide sur la correction de Bonferroni.
Pour vérifier le mode distribution de n espèces d’animaux, j’ai utilisé le test non paramétrique Kruskal-Wallis sur des donnés comportant des valeurs nulles (avec XLSTAT 2007 et R). Mais j’ai toujours obtenu les mêmes P-value pour différents échantillons.
- Existe-t-il d’autres alternatives pour ce même test ?
- Sinon pouvez- vous suggérer d’autres méthodes de correction ?
Merci beaucoup
Réponses
-
Je ne comprends pas très bien ta question. Quelle est la variable dépendante dont tu recherche le mode et quelles sont tes variables explicatives ? Comment calcules-tu le mode ? De plus, Kruskal-Wallis étant un test de rang, il teste plutôt si les médianes sont identiques que tester les modes.
Ensuite, il existe des tests post-hoc, il est vrai peu connus, pour Kruskal-Wallis dont le test de Steel et Dwass, celui de Siegel et Castellan et celui de Conover et Inman. -
je cherche tout simplement de vérifier l’uniformité ou non de la distribution de l'abondance des espèces d'oiseaux suivant quatre hauteurs d'une foret!
-
Que signifie 'uniformité' et comment est définie la 'distribution'. Est-ce pour chacune des espèces et chacune des hauteurs, le nombre d'oiseaux, y-a-t-il une seule mesure pour chacune des espèces et chacune des hauteur ou plusieurs ?...
Si tu ne sais pas comment me répondre, envoies un extrait de tes données et ton script en R en code dans ton message. Pour créer l'extrait utilises la fonction dput. -
Le mode de distribution à tester est pour chacune des espèces. Il s’agit de déterminer si l’utilisation de chaque strate est uniforme ou avec une préférence particulière pour chaque espèce ceci en se basant sur leur abondance au niveau de chaque strate
Voici un extrait de mes données.
J'ai surtout travaillé avec XLSTATHauteur Acfra Alvits Bemad Copal Comad EtC 0 0 7 5 0 EtB 1 0 6 5 1 EtA 3 0 14 10 0 Sol 1 1 8 12 1
-
Donc chaque ligne commence par un identifiant de la hauteur puis contient ensuite le nombre d'oiseaux comptés à cette hauteur. Est-ce exact ? Est-ce que le comptage est répété pour chaque hauteur ?
Qu'est-ce que tu cherches alors à comparer, les lignes entre elles ou les colonnes ?
De plus, tes données, si l'extrait est représentatif, posent un gros problème puisque tu as des comptages très faibles et beaucoup de zéros (6 zéros pour 20 valeurs, 5 un). Traiter de telles données n'est jamais évident car il faut passer à des modèles qui gèrent 'correctement' l'inflation de zéros. -
Chaque ligne représente une hauteur et chaque colonne une espèce. Il s'agit de nombre de capture sur chaque hauteur.
Je veux comparer les lignes entre elles pour chaque espèce pour vérifier si la différence de nombre de capture `a chaque hauteur est significative ou non.
Effectivement le nombre de capture est très faible et beaucoup d’espèces n'ont pas été capturées sur certaine hauteur.
C'est exactement ce que je cherche car je pense que le problème est que l'on n'a pas le modèle qui gère correctement cette inflation de zeros. Pouvez vous m'en suggéré? -
Si tu n'as que quatre lignes et que tu as 5 espèces (sinon plus), le problème est sans solution car tu ne trouveras jamais de méthode pour gérer ce cas de figures. Si tu as plusieurs mesures à chacune de hauteurs on peut penser à des méthodes de type 'zero inflated', 'hurdle(-at-zero distributions)' ou des analyses basées sur la famille binomiale négative qui, d'après la littérature, fonctionnent aussi bien et sont plus simples. Il faudra certainement restructurer tes données pour avoir un facteur hauteur, un facteur espèce et une colonne comptage et expliquer le comptage en fonction du modèle complet espèce x hauteur. Mais alors tu t'embarques vers des problèmes qui ne sont pas simples.
N.B. : Je connais ces modèles plus du point de vue théorique que pratique. -
Effectivement il n'y a que quatre lignes [les quatre hauteurs définies] mais les cinq espèces ne sont que des extraits, en fait j'en ai eu 20, mais la n'est pas le problème étant donné que c'est la distribution de chaque espèce sur les quatre hauteurs qui est a tester[uniforme ou non?] et cela indépendamment les unes des autres.
C’était la que j'ai rencontré des problèmes au niveau des espèces dont les données ne sont pas normales.
Le test-T de Student a bien donné des p-value concluantes pour les données normales mais le test de Kruskal Wallis a donné les mêmes p-value pour toutes celles qui comportent un 0 [absence de capture a au moins une des quatre hauteurs]. Et j'ai pensé que c'est la correction de l'inflation de 0 de Bonferroni qui ne correspondait pas a mes types de données c'est pourquoi je cherche une autres alternative. -
Je ne vois pas quel test de Student tu fais. Un test de Student teste la moyenne de deux séries de valeurs, c'est-à-dire qu'il faut au moins deux valeurs dans chaque séries. Cependant, quand il y a moins d'une dizaine de valeurs, le test de Student est à éviter car on est loin de ses prérequis. Le test de Kruskal-Wallis peut donner un résultat mais celui-ci n'a aucun sens.
Une correction de Bonferroni est une correction des comparaisons multiples, c'est-à-dire qu'elle intervient comme correction a posteriori quand les tests conjoints sont liés.
Tu peux toujours faire un test de proportions en comparant tes quatre proportions (comptage à une hauteur / comptage total) à (0.25, 0.25, 0.25, 0.25) [fonction prop.test de R] tout en sachant que pour les colonnes dont le comptage maximal est inférieur à 10, la robustesse du test est douteuse. De même, pour celle dont la valeur minimale est inférieur à 5. -
Merci beaucoup de cette explication
Je vais revoir mon test alors et essayer de trouver ce que va donner ce test de proportion.
Merci de votre aide.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 165.8K Toutes les catégories
- 69 Collège/Lycée
- 22.2K Algèbre
- 37.7K Analyse
- 6.3K Arithmétique
- 61 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 28 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.8K Géométrie
- 86 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 83 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 30 Mathématiques et finance
- 345 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.4K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 808 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres