Qui a besoin de Friedman ?

Bonjour à tous,
C'est la première fois que je post sur ce forum, je vois que la communauté est très active et ça m'a directement incité à me créer un compte. Je remercie d'avance à quiconque me répondra qu'il connaisse la solution à mon problème ou non !
Alors, je me lance.

Je travaille sur une étude censé évaluer/comparer la prise en charge reçue par des patients issus de deux lieux d'hébergement de type EHPAD.
Mes variables dépendantes sont des scores d'échelles que j'ai fait passer à l'intégralité de mon échantillon en trois temps T1, T2, T3.

J'ai donc une VI intra-sujets à trois modalités (T1, T2, T3) -> Suivi longitudinal
Une VI inter-sujets à deux modalités (LH1, LH2) -> Lieu d'hébergement
Un nombre fini de VD, toutes quantitatives et continus.
Finalement, je voudrais tester une hypothèse d'effet principal et d’interaction entre mes variables.

Un plan idéal pour lancer une petite ANOVA à mesures répétées me direz-vous ? Oui mais non, après vérification graphique de la distribution (histogrammes, Q-Q plots, boites à moustaches..) + test de [large]S[/large]hapiro-[large]W[/large]ilk mes distributions sont très loin d'une distribution normale.

Et pourquoi pas son cousin non-paramétrique, un Friedman alors ? Eeeeeet encore non ! De ce que j'ai compris, pour pouvoir utiliser ce test, les échantillons doivent être équilibrés (balanced design) càd avoir un nombre égal d'observations dans chaque groupe, or les effectifs de mes deux groupes sont loin d’être égaux (LH1 : n=24)=/=(LH2 : n=13).

Alors me voilà à chercher comment "sur-échantillonner" mon groupe minoritaire pour me conformer aux prérequis de Friedman alors qu'il devrait bien exister un test non paramétrique à mesures répétées simple qui ne prend pas en compte les différences de tailles d’échantillons pour pouvoir être utilisé ? Je me rends bien compte que transformer/corriger/compléter mes données va grandement impacter la puissance statistique de mon test et rajouter du bruit dans mes analyses. Est-ce que quelqu'un s'est déjà retrouvé dans cette position ? Je pourrais bien faire des analyses par paires et décortiquer chaque effet simple mais où est le fun là-dedans ? On m'a dit qu'en statistiques il vaut mieux toujours analyser de manière globale, puis ensuite éplucher chaque effet simple indépendamment. Qu'en pensez-vous ?
Merci d'avoir lu jusqu'ici !

[Martin Wilk (1922-2013) et Samuel Sanford Shapiro (1930- ) prennent toujours une majuscule. AD]

Réponses

  • Bonjour.

    Je n'ai pas de réponse pour ton questionnement principal. Par contre, si ton nombre d'individus n'est pas trop faible, la Normalité des données n'est pas importante pour l'Anova (on teste des moyennes, plus volontiers gaussiennes que les valeurs), mais à condition que les variances ne soient pas trop différentes (homoscédasticité).

    Cordialement.
  • Bonjour.

    Tout d'abord bienvenue, tu présentes un chouette problème.

    Peut-être pourrais-tu, à titre d'exemple, montrer le graphique de l'une de tes distributions ?
    Ce n'est pas un manque de confiance, mais je trouve que tu as donné peu de détails sur tes données (c'est peut-être voulu).

    À bientôt.

    Cherche livres et objets du domaine mathématique :

    Intégraphes, règles log et calculateurs électromécaniques.

  • Bonjour à tous,

    Tout d'abord merci pour vos réponses rapides. Je ne voulais pas vous répondre avant de me retrouver devant mes données. Effectivement, pouvoir utiliser l’ANOVA dans ce cas précis me permettrais de résoudre mon problème sans me soucier de chercher un autre test. Par contre ce qui me turlupine est plutôt le nombre d’individus qui est à mon avis trop faible pour l’ANOVA. En cours été préconisé des groupes d’au moins 30 individus pour lancer le test. Ici on est à 24 et 13, ça ne te semble pas insuffisant ? Comment défendre l'utilisation du test alors que je ne passe pas les critères énoncés pour l'appliquer ? Je me rends compte que le modèle linéaire est robuste, mais est-ce une justification suffisante pour utiliser le test ?

    Je peux vous fournir une distribution d'une de mes variables principales que j'attache en copie de ce message pour vous aider à comprendre mon problème. On retrouve ici la distribution des deux groupes (1,2) pour deux VD (NPI et ADSC) sur deux temps (T0,T12).

    Merci pour vos remarques !
  • Effectivement, la taille de 13 est un peu faible. Mais je ne suis pas spécialiste des anova à mesures répétées.
    En fait, tout dépend du but de ton étude. Si c'est un travail de fin de formation, tu peux très bien faire ton anova pour montrer que tu maîtrises, en donnant les limites de la méthode. Si c'est un travail de recherche médicale, tu es déjà en dehors des clous, faute d'avoir fait valider par les services compétents le protocole et son exploitation. Et toutes les situations intermédiaires sont possibles.
    Une remarque encore : Il arrive fréquemment qu'on n'ait ni la validation d'un hypothèse, ni les moyens d'améliorer la situation en accroissant l'échantillon. Ça donne simplement une étude non significative. Un des grands reproches des statisticiens aux utilisateurs (en particulier en sciences humaines), c'est de ne jamais publier ces études non significatives, ce qui fausse nettement les méta-analyses.

    Cordialement.
  • Merci beaucoup pour ta réponse Gérard.

    Il s'agit en fait de ma première étude pro, mais j'arrive à la fin d'un projet qui n'a malheureusement pas été bien suivi durant toute sa durée (3 ans quand même!) et je me retrouve à devoir remplir les trous et faire des analyses avec les données que j'ai.

    Ma question finalement est quelle position dois-je prendre vis à vis de mon travail? Éplucher l'ensemble des situations avec des tests non para par paires (càd T0 1-2, puis T12 1-2; ensuite 1 T0-T12, puis 2 T0-T12 ) ? ou quand même faire l'ANOVA en stipulant simplement le non respect des conditions d'application ? Je suppose que la réponse doit être de faire les deux, mais je n'ai malheureusement pas de base de comparaison de ce qu'on attend de moi, ni l'accès à des études non significatives car celles-ci sont, comme tu le décris très bien, souvent étiquetées comme "non publiables" et donc difficiles à se procurer. Que faire quand les tests prévus ne sont finalement pas applicables ?

    Merci encore pour tes retours. Bien que cette situation soit assez inconfortable pour moi, je suis quand même content d'y faire face. J'espère que ce questionnement profitera à tous en ouvrant à la réflexion. Je pense qu'il faut parfois mettre les pieds dans le plat pour extraire une leçon formatrice d'une situation malheureuse.

    Bien à toi.
  • Désolé, je ne suis pas à ta place, ce serait malsain de conseiller : Les conseilleurs ne sont pas les payeurs.
    Bonne chance !
Connectez-vous ou Inscrivez-vous pour répondre.