Pauvre forestier perdu dans une forêt de test de significativité

RickEden
Modifié (October 2023) dans Statistiques
Bonjour les statisticiens
Je sollicite votre aide car j'ai un test de statistique à faire entre deux variables qualitatives ordonnées.
J'imagine que les résultat devraient suivre une droite de régression linéaire positive.
Les variable sont 1 une note entre 1 et 5 que je donne à chaque arbre en fonction du dépérissement du houppier, et 2 une autre note entre 1 et 5 en fonction de la pureté de la couleur de la grume.
Savez-vous quel test de significativité et de corrélation utiliser ?
J'ai demander à une IA, et elle m'a indiqué le test de corrélation de Spearman, qu'en pensez-vous ?

Réponses

  • Si tu t'attends à une corrélation linéaire, il vaut mieux utiliser le test de Pearson, non ? Tu ne dis pas la question qui t'intéresse sur les données donc peut-être que c'est l'IA qui a raison...
  • quand pensez vous ?
    Tous les jours.

    Bon, je sors.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • gerard0
    Modifié (October 2023)
    Bonjour.
    La pratique traditionnelle est de commencer par étudier si des corrélations significatives peuvent exister. À partir de données (nombreuses si possible), on représentera un nuage de points qui donnera une idée du type de corrélation. Avec 5 valeurs par variable, on n'ira pas très loin, sauf si les valeurs de l'une augmentent (ou diminuent) régulièrement avec les valeurs de l'autre. On a alors, dans la représentation en nuage de points, un nuage nettement allongé, avec peu de points en dehors.
    Dans ce cas, on utilisera le coefficient de corrélation de Pearson pour donner une mesure de l'alignement.
    Comme tu nous dis "J'imagine que les résultat devraient suivre une droite de régression linéaire positive", tu n'as sans doute pas fait cette étape d'analyse statistique descriptive.
    Ensuite, un  test te dira si oui ou non (statistiquement) ce coefficient de corrélation est non nul. Mais si les données sont nombreuses (quelques dizaines au moins) et r proche de 1, inutile de faire le test, il sera positif.

    Si le nuage de points a une forme particulière (*), on pourra essayer d'autres modes de corrélation.
    Enfin, avec un nuage "plutôt rond", rien à attendre.
    Cordialement.

    (*) Mais avec 5 valeurs, je ne vois pas quelle forme pourrait apparaître.
  • Bibix
    Modifié (October 2023)
    Ah oui, je partais du principe que la note était un réel de $1$ à $5$ mais c'est vrai que c'est probablement discret vu ce que dit l'OP. Dans ce cas-là, pour savoir s'il existe une dépendance entre les données, il y a le test d'indépendance du $\chi_2$ qui peut être utile.
  • RickEden
    Modifié (October 2023)
    Merci, pour vos réponse rapide. 

    Quelque précisions, par rapport à vos réponses : les notes entre 1 et 5 correspondent à A, B, C, D, E  (A=1) et ce que j'essaye d'observer est si le dépérissement de l'arbre augmente, est-ce que la couleur de la culée de la grume se dégrade (aussi noté 'A, B, C, D, E ; E  étant la couleur la plus dégradée) .

    Bibix oui la variable est discrète.

    gerard0 justement s'il y a corrélation, 1 étant la meilleure note et 5 la moins bonne, les variables étant qualitatives ordonnées, plus le dépérissement est important, plus la couleur devrait être dégradée.
      
    Aussi, pour juger d'une corrélation linéaire entre deux variables qualitatives ordonnées, le R est un coefficient pertinent ?  D'Après mes recherche le R n'est que utilisable qu'avec des variables quantitatives.
  • Dans ce cas, tu peux faire une régression linéaire qui va te donner une tendance. Puis par exemple un test du $\chi_2$ pour montrer qu'il est statistiquement raisonnable au vu des données de penser qu'il y a effectivement une dépendance. Mais je pense que le R reste utilisable.
  • gerard0
    Modifié (October 2023)
    Rick Eden,
    tes données sont de type qualitatif ordonné, donc la corrélation de Spearman est utilisable. Elle te donnera une idée du lien de variation entre tes catégories. Tu t'attends à un $r$ de l'ordre de 1 ("plus le dépérissement est important, plus la couleur devrait être dégradée."). Sans référence à des analyses analogues, difficile de dire ce qui est "proche de 1", mais il est sûr qu'à moins de 0,5, plus aucune corrélation n'est réaliste.
    Encore une fois, la représentation en nuage de points est un excellent outil de visualisation.
    Cordialement.
  • RickEden
    Modifié (October 2023)
    Merci beaucoup pour votre aide, je vous tiens au courant de l'avancé de mes travaux.
Connectez-vous ou Inscrivez-vous pour répondre.