À la recherche du «coude» dans les données


8

La subitisation est l'énumération rapide et précise des affichages à faible numérosité, qui se distingue du comptage par une forte non-linéarité dans le tracé des temps de réponse. Vous trouverez ci-dessous un graphique représentatif de Watson, DG, Maylor, EA et Bruce, LAM (2007). Notez que les temps de dénombrement moyens pour les affichages 1-3 augmentent à peu près linéairement, mais le temps de dénombrement moyen pour 4 ne suit pas la tendance linéaire. Certaines recherches suggèrent que la «limite» de subitisation dépend des conditions de la tâche et de la mémoire de travail des participants.

entrez la description de l'image ici

Je cherche un moyen de tester la position du coude, dans le but ultime d'identifier la limite de subitisation d'un participant. Actuellement, ma meilleure idée est de faire quelque chose comme des contrastes polynomiaux répétés. Fondamentalement, je testerais une tendance quadratique dans les numérosités 1-3, puis dans les numérosités 1-4, etc. Je voudrais dire que j'ai passé la limite de subitisation lorsque la tendance quadratique devient significative (en ajustant pour les tests répétés).

C'est à peu près les limites de mes connaissances statistiques, donc je ne peux pas trop évaluer cette idée. Pensées?

Merci d'avance.

Réponses:


3

Selon votre définition du «coude», de nombreux tests statistiques sont à votre disposition. Avec un package R complet dédié à ce sujet.

Personnellement, j'ai tendance à les éviter, car vous ne savez jamais à l'avance ce qu'ils considéreront comme un «coude» et si vos opinions et celles-ci coïncideront. (mais cela pourrait être considéré comme une position extrême). Cela dépendrait aussi de savoir si vous voulez savoir s'il y a un «coude» à un endroit spécifique, ou si vous voulez demander s'il y en a un en général.

Dans le cas d'un emplacement spécifique, vous pouvez bien sûr ajuster une régression locale, comparer les coefficients et en déclarer un au coude selon votre propre règle sur la différence de pente.

Le vrai problème se produit dans ce dernier cas. De toute façon, si vous n'avez que quelques points, vous pouvez tous les essayer. Sinon, j'adapterais quelque chose de non paramétrique tel que LOESS, calculer le gradient de la ligne à intervalles réguliers (avec une densité suffisante), comme indiqué ici: /programming/12183137/calculate-min-max- pente-de-loess-courbe-ajustée-avec-r

et utilisez à nouveau une règle que vous jugez pratique pour déclarer quelque chose de "coude". Je considère le «coude» comme le cas où un changement suffisamment important de gradient d'une fonction se produit sur un intervalle suffisamment court. Bien sûr, les seuils pour les règles ci-dessus sont une question de goût individuel, c'est pourquoi il n'y a pas de test.

En général, je suppose que cela serait tout à fait inutile si les données sont ondulées (car il y aurait beaucoup de changements dans le gradient).


Je vous prie de différer: il existe de nombreux tests statistiques pour le «coude», à condition qu'il soit défini avec une clarté suffisante. Ceci est un exemple d'un point de changement ou de changement structurel problème.
whuber

1
Je devrais probablement reformuler la réponse alors. Mon point était exactement que le nœud est dans la définition du «coude». De plus, j'ai tendance à ne pas faire confiance à l'application d'une procédure de point de changement aux données (séries temporelles), car je ne sais jamais à quel point la définition du «coude» des auteurs diffère de la mienne. J'ai donc préconisé la création d'une règle personnelle pour identifier le «coude», plutôt que d'utiliser une partie de l'outil d'étagère. Vous n'avez peut-être pas de test statistique, mais au moins si vous le créez, vous savez ce qu'il fait et comment il a tendance à étiqueter les courbes.
signifiant

+1 C'est un très bon point.
whuber

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.