Indicateur de similitude entre deux séries
dans Statistiques
Bonsoir
Je suis enseignant et j'aimerais avoir un indicateur de similitude entre deux copies (je dispose des notes sous la forme de % à chacune des questions dans mon fichier tableur). Ainsi lorsque l'indicateur serait élevé, je regarderais plus en détails les copies concernées pour voir si l'élève a bien travaillé seul.
J'ai au départ pensé calculer une simple «distance» entre les copies : pour chaque paire de copie, je calcule la différence dans chaque question, puis je fais la somme des différences ; mais je m'aperçois que ce n'est pas très discriminant.
EDIT : je fais la somme des carrés des différences en fait. (j'ai oublié d'indiquer le carré !)
Existe-il un test statistique qui pourrait m'aider ? (s'il est facile à mettre en œuvre au tableur, c'est encore mieux !)
J'ai un peu cherché, essayé les fonctions test.khideux, test.student et testf, mais les tests que j'ai pu faire n'ont pas été très convaincants
Merci de vos conseils.
Je suis enseignant et j'aimerais avoir un indicateur de similitude entre deux copies (je dispose des notes sous la forme de % à chacune des questions dans mon fichier tableur). Ainsi lorsque l'indicateur serait élevé, je regarderais plus en détails les copies concernées pour voir si l'élève a bien travaillé seul.
J'ai au départ pensé calculer une simple «distance» entre les copies : pour chaque paire de copie, je calcule la différence dans chaque question, puis je fais la somme des différences ; mais je m'aperçois que ce n'est pas très discriminant.
EDIT : je fais la somme des carrés des différences en fait. (j'ai oublié d'indiquer le carré !)
Existe-il un test statistique qui pourrait m'aider ? (s'il est facile à mettre en œuvre au tableur, c'est encore mieux !)
J'ai un peu cherché, essayé les fonctions test.khideux, test.student et testf, mais les tests que j'ai pu faire n'ont pas été très convaincants
Merci de vos conseils.
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
X_i les données de la première copie et Y_i celles de la seconde.
Il y a des tests basés sur Student pour a = 1 et B = 0.
Ce n'est qu'une idée. Il y a sans doute mieux.
Or, pour chaque copie, j'ai 11 questions. Il me faut en fait comparer des points en 11 dimensions.
Tu peux jeter un coup d'oeil sur la méthode de Bland et Altman.
Disons que tu as une copie "de référence " et les 10 autres. Il me semble que tu cherches à évaluer les autres copies item par item avec cette dernière. Est-ce bien ça ?
Et on compare les 11 valeurs de deux copies.
Une distance classique est la racine carrée de la somme des carrés des différences.
Mais si seules deux questions sur 11 ont été copiées, ça ne fonctionne pas.
Cordialement.
Ce sont des «copies» de bureautique (des fichiers en fait) qu'ils font à la maison. Ce ne sont pas des questions à proprement parler mais un % de réussite sur certaines compétences. Les tricheurs que je veux découvrir sont ceux qui ont pris le fichier d'un copain et changé quelques éléments de forme seulement. Les fichiers sont visuellement différents mais la réussite par compétence devrait être similaire. Si j'ai des fichiers qui se ressemblent, je creuserai le pourquoi ensuite.
Je ne veux pas voir item par item, mais avoir une vue d'ensemble des copies, à travers de 11 nombres.