Test de Student ?

Bonjour à tous,

Je vous explique mon petit problème, je possède deux jeux de données, le premier "élèves" où je peux y trouver la liste de tous les élèves inscrits (j'ai comme données le nom, le prénom, l'instrument de musique avec lequel l'élève joue) et le deuxième "demande de bourse" qui comporte les élèves demandeurs de bourses (nom, prénom et instruments avec lequel l'élève joue). Mon jeu de données "élèves" comporte entre 1000 et 1500 observations et "demande de bourse" entre 150 et 200 observations.
Ces deux jeux de données ne sont pas indépendants, on remarque que "élèves" est une population et "demande de bourse" est une sous-population de "élèves". On retrouve pratiquement tous les élèves demandeurs de bourses dans "élèves".
Je cherche à savoir si la répartition par instruments des élèves en demande de bourse est significativement différente de celle de l'ensemble des élèves ou pas.
Je voulais faire un test de Student, où j'ai rendu "élèves" et "demande de bourses" totalement indépendants (j'ai donc enlevé à "élèves tous les demandeurs de bourses). Mais l'hypothèse de normalité n'est pas vérifiée donc je n'ai pas pu appliquer le test.
Quel autre test puis-je appliquer dans ce cas-là?

Je vous remercie.

Réponses

  • Bonjour.

    Je n'ai pas compris quelle variable est utilisée pour faire un test de Student. Et d'ailleurs, comme il ne s'agit pas ici d'échantillons représentatifs, même la notion de test de Student est à rejeter.

    Finalement, tu as construit deux populations "demandeurs de bourse" et "élèves non demandeurs de bourse", ou plus généralement, une seule population dont les individus ont deux sortes de caractères : "demande de bourse ou non" et "instrument" (vu ce que tu dis, chaque élève n'a qu'un seul instrument). Et tu voudrais, à partir de ta statistique exhaustive chercher si ces caractères sont liés ou non. C'est de la statistique descriptive, mais dans ce genre de situation on utilise justement un test classique, le test du Khi-deux. Tu constitues le tableau (*) à deux entrées (et donc deux lignes et n colonnes, ou n est le nombre d'instruments) des effectifs de chaque sous-classe. S'il y a beaucoup de colonnes avec des effectifs faibles (moins de 5), il faudra regrouper des colonnes (regrouper de façon cohérente les instruments, quitte à faire une colonne "divers").

    Cordialement.

    NB : Souvent la simple lecture du tableau de contingence donne déjà des bonnes indications.

    (*) dit "tableau de contingence"
  • Bonjour gerard0
    Je vous remercie pour votre réponse.
    Mais ma table "élèves" comporte à la fois les élèves demandeurs de bourses et non demandeurs. Donc pour pouvoir faire ce test de Khi-deux, il faudra que j'extrais tous les élèves demandeurs de bourses dans la table "élèves" pour que les deux tables soient indépendantes. C'est bien cela ? Et donc dans ce test là, il n'y aura plus de problème car l'hypothèse de normalité n'est pas vérifié.

    [Inutile de reproduire le message précédent. AD]
  • "faudra que j'extraies tous les élèves demandeurs de bourses dans la table "élèves" pour que les deux tables soient indépendantes.". Oui, j'ai utilisé ce que tu proposais ... même si le mot "indépendantes" est mal choisie (on dira plutôt "éviter les doublons", ou faire deux populations sans élément commun - l'indépendance est une notion statistique précise).
    " car l'hypothèse de normalité n'est pas vérifiée" ?? Je ne comprends rien à cette phrase, la normalité de quelle variable numérique ? En tout cas, le test du khi-deux portant sur des effectifs, la Normalité n'a aucun sens.
Connectez-vous ou Inscrivez-vous pour répondre.