Interprétation d'un test de Pearson

Bonsoir !
Dans le cadre d'un exercice de cours, je dois interpréter un test de Pearson, effectué après l'hypothèse suivante : relation linéaire et négative.

Donc, il me semble qu'il faut choisir 'less' pour l'alternative du test.
À partir de là, j'obtiens un coefficient positif et non significatif (alors que je m'attendais à un coefficient négatif).

Je suis donc bien embêtée pour l'interprétation : dois-je conclure qu'on ne peut pas dire qu'il y ait relation linéaire et négative en me basant sur mon hypothèse de départ ou plutôt qu'il semblerait y avoir une relation positive mais que celle-ci est non significative et proposer de refaire le test avec l'alternative 'greater' ?

Merci d'avance pour vos conseils !
Mathilde

Réponses

  • Bonjour.

    Qu'appelles-tu "un test de Pearson" ? Je connais la régression linéaire de Pearson, qui n'est pas un test, et le test d'égalité du coefficient de régression à 0 (donc suite à une analyse de régression. D'autre part, je ne sais pas ce qu'est une relation négative.
    Si ce sont des éléments de ton cours, peux-tu rappeler ce que c'est ?

    Explique aussi la phrase : " j'obtiens un coefficient positif et non significatif " ?

    Cordialement.
  • Bonsoir,

    Effectivement vous avez raison, l'énoncé donné était : calcul du coefficient de corrélation de Pearson (cor.test sur R)

    Une relation négative serait ici une variable qui évolue dans l'autre sens que la deuxième variable (par exemple ici : quand le nombre de prédateur augmente, le nombre de proie diminue)

    Je m'attendais donc à trouver un coefficient de corrélation proche de moins 1, et j'ai obtenu un coefficient proche de 0,4 avec une p-value supérieure à 0.05

    J'espère que j'ai pu rendre mes explications plus claires ! :)

    Cordialement,
  • Ne serait-ce pas plutôt "une corrélation négative" ? Donc tu as une corrélation positive, et nettement différente de 0. Tu n'as pas obtenu ce que tu voulais.
    L'idéal serait de faire représenter le nuage de points, pour voir qu'en gros "il monte".
    Du point de vue purement statistique, c'est tout. Le reste de l'interprétation, c'est à toi de le faire, puisque tu sais de quoi il s'agit.

    Vérifie quand même que ce sont les bonnes données.
  • Bonjour !

    C'est bien là mon problème :) C'est un exercice d'interprétation de résultat : je n'ai accès ni aux données ni au nuage de point.
    Nous partons de l'hypothèse suivante : plus il y a de prédateurs, moins il y a de proies. À partir de cette hypothèse, sachant qu'ensuite nous aurons un calcul de coefficient de Pearson, nous devons donner le paramétrage du test (ici donc : unilatéral avec alternative less).
    C'est il me semble le paramétrage logique que nous pouvons déduire de l'hypothèse, je ne pense pas pouvoir partir sur 'greater'.

    Une fois là, je me retrouve donc avec ce coefficient de corrélation positif, et qui en plus a une p-value supérieure à 0,05.
    Je ne sais pas trop comment l'interpréter : comme dit dans mon premier message : est-ce que je dois rester concentrée sur mon hypothèse de départ et donc conclure qu'on ne puisse pas dire qu'il y ait une corrélation négative, ou dois-je plutôt oublier cette hypothèse, dire que le coefficient évoque plutôt une corrélation positive mais que celle ci n'est pas significative ?

    Enfin, je me demandais : si j'avais eu accès aux données et que j'avais refait le calcul mais cette fois avec l'alternative 'greater', est-ce que le coefficient de corrélation aurait été modifié, ou uniquement la p-value ?

    Merci beaucoup pour votre temps :)
  • OK,

    mais n'ayant pas l'énoncé de l'exercice, je serais bien présomptueux de vouloir te donner une réponse.

    Je ne connais pas suffisamment R pour te guider sur son usage, je ne sais même pas quel test tu fais. Vois l'aide sur le logiciel pour comprendre quel test tu fais (*).
    Je ne comprends pas trop non plus pourquoi c'est toi qui décides du test alors que tu n'as pas les données. A priori, si on a seulement les résultats du test, on a l'intitulé du test.

    Finalement, sans l'énoncé, je suis vraiment dans le flou !

    Cordialement.

    (*) en général, les logiciels donnent, avec le coefficient de corrélation, la p-value du test r=0, contre $r\neq 0$. Avec "greater" ou "less", on change H1. Si je comprends bien (mais lis la définition de cette syntaxe), alternative less veut dire que tu prends comme H1 l'hypothèse " coefficient de corrélation négatif", mais c'est alors normal que le test ne soit pas significatif puisqu'on est loin de H1.
  • Je comprends, je ne voulais pas mettre l'énoncé pour ne pas demander à ce qu'on fasse l'exercice à ma place !

    Sachant que les élans sont des proies pour les loups, vous formulez l'hypothèse que plus il y a de loups dans un secteur, moins on va trouver d'élans. Après avoir constitué un échantillon de 25 secteurs, vous dénombrez les loups et les élans sur chacun de ces secteurs et décidez (après avoir vu un graphique) d'effectuer un calcul de coefficient de corrélation de Pearson.

    2) Afin d'effectuer le test correctement, quelle fonction de R utilisez-vous (a, b, c ou d) ?
    Justifiez votre réponse
    a. > cor.test(Loups, Elans)
    b. > cor.test(Loups, Elans, alternative="two.sided")
    c. > cor.test(Loups, Elans, alternative="greater")
    d. > cor.test(Loups, Elans, alternative="less")

    3) Vous obtenez les résultats suivants : rédigez les résultats comme dans un rapport.
    Pearson's product-moment correlation
    data: Loups and Elans
    t = 1.7266, df = 23, p-value = 0.9512
    alternative hypothesis: true correlation is ............
    95 percent confidence interval:
    ............ .............
    sample estimates:
     cor
    0.368731
    
    C'est là tout ce dont on dispose pour répondre aux questions.

    Je pense cependant avoir résolu mon problème : Sur R, j'ai pris des valeurs plus ou moins au hasard pour avoir ce même type de résultat avec cor.test(Loups, Elans, alternative="less"), puis j'ai fait un deuxième calcul, cette fois ci avec "greater". Dans les deux cas, le coefficient de corrélation ne change pas, mais les p-values sont modifiées et semblent se rapprocher de 1 quand on les additionne. Ainsi, pour en revenir à mon exercice, il me semble que si j'ai eu p-value =0,951 avec "less", j'aurai pu obtenir p-value=0,049 avec "greater". Donc il me semble que ce premier résultat doit être interprété de la sorte :

    On constate que le coefficient de corrélation de Pearson entre le nombre de loups et le nombre d’élans est de +0,37, évoquant une relation linéaire et positive. Ce résultat ne va pas dans le sens de notre hypothèse. Ainsi, nous ne pouvons pas conclure qu’il existe une corrélation négative entre le nombre de loups et le nombre d’élans sur les secteurs étudiés. Il serait intéressant de poursuivre l’analyse statistique par un deuxième calcul du coefficient de corrélation de Pearson, cette fois avec l’alternative “greater”.

    Merci beaucoup pour votre aide, c'était effectivement la mauvaise compréhension de la modification de H1 impliquée par "less" qui me posait problème dans l'interprétation de la p-value !
    Bonne journée !
  • Maintenant que j'ai l'énoncé, je vois le biais de cet énoncé, la façon qu'il a de faire tromper : Pour des secteurs suffisamment étendus, s'il y a peu d'élans, il n'y a pas de quoi nourrir beaucoup de loups. Donc "plus il y a de loups dans un secteur, moins on va trouver d'élans" est une fausse idée ! Sans compter que les loups ne se nourrissent pas d'élans (ils ne mangent que les bêtes malades ou très vieilles), mais de souris, castors et autres petites bêtes, plus faciles à attraper. Mais même s'ils se nourrissaient que d'élans, il ne peut y avoir beaucoup de loups que s'il y a suffisamment à manger (beaucoup d'élans).

    Cordialement
Connectez-vous ou Inscrivez-vous pour répondre.