Tests statistiques pour une étude quantitative : problème de choix

ericbugs
Modifié (August 2022) dans Statistiques
Bonjour
Je prépare ma thèse de médecine et me permets de vous solliciter car n'ayant pas eu de formation approfondie en statistiques j'ai encore quelques doutes lors de la phase d'analyse des données.
De manière assez classique, j'ai fait remplir des questionnaires à des individus.
Parmi les questions qui restent en suspend :
- J'ai demandé aux individus de me donner la répartition moyenne de leur journée (en %) avec 4 cases à remplir : travail, sommeil, sport, autres.
Une réponse serait par exemple : 40, 30, 5, 25.
J'ai synthétisé les réponses dans un tableau de contingence et me demande s'il existe un lien entre l'évolution au cours des 6 derniers mois du poids de l'individu à choisir parmi : baisse, stable, augmentation ET d'autres paramètres tels que le sexe, l'âge (groupé en tranche), le type de profession... Pour ce faire j'ai utilisé un test du Khi2 d'indépendance. Par contre quand je me demande s'il existe un lien entre la répartition de la journée et l'évolution du poids, je ne sais comment agencer les données, ni même quel test utiliser, ni encore même si cette question a un sens.
- Autre question : les individus doivent choisir parmi une liste les sports qu'ils affectionnent regarder à la télévision. Dans une autre question, ils doivent choisir les sports qu'il pratiquent. J'aimerais utiliser un test statistique pour voir s'il existe un lien entre les deux, mais je n'ai strictement aucune idée du test à utiliser.
J'ai réussi à avancer pas mal grâce à des cours de statistiques trouvés en ligne ici et là, malheureusement je sèche complètement pour les deux points précédents. Vos réponses seront à n'en point douter d'une immense aide.
Bonne journée !

Réponses

  • gerard0
    Modifié (August 2022)
    Bonjour.
    J'ai l'impression que tu es tombé dans le piège classique des débutants en statistique "je recueille des données, je le traiterai ensuite". Alors que la démarche statistique est de préparer le recueil des données à partir des moyens de les utiliser ensuite. Par exemple, on ne fait un test statistique que si on a une hypothèse statistique à tester, et on essayera alors de recueillir des données qui permettront de faire fonctionner un test classique, ou de créer un test adapté.
    Quand on a déjà des données, une méthode d'analyse est la statistique descriptive, la représentation des données pour voir si ça fait apparaître une idée qu'on pourra parfois tester (malheureusement, souvent avec un nouveau recueil de données !).
    Pour les sports, comme il s'agit de comparer deux séries qualitatives, un tableau de contingence est une bonne idée. Malheureusement, le probable grand nombre de cases à 0 interdira d'utiliser un  khi-deux, mais il peut apparaître des dominantes.
    Cordialement.
  • ericbugs
    Modifié (August 2022)
    Bonjour
    Merci pour votre retour.
    En réalité j'ai une hypothèse statistique H0 que je teste au moyen d'un test de Student.
    Je me posais cette question pour des objectifs secondaires de l'étude que j'avais désigné par "..." (et que je suis donc libre de moduler). J'avais voulu appliquer un test à toutes les caractéristiques de mes répondants de façon un peu mécanique, mais après tout c'est peut-être inutile.
    J'avais lu que lorsqu'une case du tableau de contingence avait moins de 5 '"éléments", on pouvait utiliser le test de Fisher exact à la place du khi2. Vous pensez que ce n'est pas une bonne idée (pour cette question ou une autre d'ailleurs) ? (En pratique, si j'ai un message d'avertissement lorsque je fais un test du khi2 dans R, j'utilise ce dernier test à la place).
    Encore merci.
    Bonne journée.
  • gerard0
    Modifié (August 2022)
    Si tu as un logiciel statistique qui fait le test exact de Fischer dans les conditions que tu as, pourquoi pas ?
    Mais je suis un peu surpris de cette étude pour une thèse de médecine ...
    Cordialement.
  • ericbugs
    Modifié (August 2022)
    Merci !
    Les sujets de thèse de médecine générale sont extrêmement variés. Et quand il s'agit d'une étude quantitative et non qualitative, on a besoin de faire quelques statistiques (même si certains ne font que du descriptif avec des histogrammes).
    Les thèses de spécialité d'organe sont quant à elle beaucoup moins originales et souvent centrées sur des traitements ou des pathologies.
    PS : je reviendrais peut-être avec une question sur les régressions lorsque je m'y essaierai dans quelques jours.
    Bonne soirée.
  • ericbugs
    Modifié (August 2022)
    Bonjour
    Je me permets de revenir vers vous concernant la question :
    ericbugs a dit
    - Autre question : les individus doivent choisir parmi une liste les sports qu'ils affectionnent regarder à la télévision. Dans une autre question, ils doivent choisir les sports qu'il pratiquent. J'aimerais utiliser un test statistique pour voir s'il existe un lien entre les deux, mais je n'ai strictement aucune idée du test à utiliser.
    En approfondissant, j'ai trouvé un test du khi2 d'homogénéité. J'ai essayé de trouver un équivalent non paramétrique à ce test mais n'ai pas réussi.
    Grosso modo, je voulais mettre en ligne une liste de sports et en colonne le nombre qui le regarde à la TV, et dans une autre le nombre qui le pratiquent et voir avec un test si les distributions étaient homogènes... laissant penser que regarder un sport à la TV peut encourager sa pratique... ou non.
    Merci.
  • Heu ... le khi-deux est non paramétrique.
  • Oups ! Comme je travaille aussi avec le test de Student et le Wilcoxon, j'ai confondu.
    Je voulais dire un équivalent du khi2 d'homogénéité lorsque certains des effectifs ont moins de 5 individus, comme le Fisher exact pour le khi2 d'indépendance.
  • gerard0
    Modifié (August 2022)
    Ben ... le Fischer exact a été construit justement pour ça, mais il ne faut pas rêver, s'il y a beaucoup de 0, que peut un test global ? Et que peut vouloir dire "homogénéité" dans cette situation ?
  • ericbugs
    Modifié (August 2022)
    J'avais cru de mes lectures que le test de Fisher exact était à utiliser en cas d'effectifs inférieurs à 5. à la place du test du khi2 d'INDEPENDANCE.
    Si j'utilise la même fonction dans R : fisher.test(tableau, simulate.p.value=TRUE), comment R va-t-il faire la part des choses entre le khi2 d'indépendance et le khi d'homogénéité.
    Par ailleurs, le tableau que je construis ainsi n'est pas un tableau de contingence, non ? Je dis ça car comme un individu peut à la fois regarder et pratiquer un sport, la somme des valeurs du tableau à très peu de chances d'être égale au nombres d'individus. Or il me semble que c'est une condition sine qua none pour les tableaux de contingence.
                        | Regarde à la TV | Pratique |
    Athlétisme    |           2            |   8          |
    Tennis           |          9             |   3          |
    Ping-pong    |          5             |   5          |
    Désolé si je dis des énormités. Je me suis familiarisé avec ces tests de manière très parcellaire au moyen d'articles en ligne.
  • J'ai été inattentif, il s'agit évidemment d'un khi2 d'indépendance (au résultat tout à fait prévisible). 
    Je n'ai pas compris pourquoi tu as fait cette analyse qui n'a rien à voir avec la médecine et sans une méthodologie sérieuse. Sans avoir regardé ce qui est connu sur le sujet et adapté l'échantillon des gens interrogés (on sait que les réponses sont très variables en fonction de l'âge, du sexe, de l'état de santé,...). Le bon outil serait une étude multifactorielle, avec un très grand échantillon. 
Connectez-vous ou Inscrivez-vous pour répondre.