Quelqu'un peut-il m'aider à comprendre quel type de problème je regarde? Je ne sais pas si cela se classe comme test d'hypothèse


8

Veuillez m'excuser si cette question n'est pas claire. Je ne sais pas si j'utilise les bonnes terminologies.

J'ai mené plusieurs fois une expérience dans différents environnements. Donc, mes données ressemblent à ceci:

Environment1  1.2  2.1  1.1  1.5  1.6
Environment2  4.2  2.6  3.5  2.5  2.9
Environment3  7.2  4.6  5.3  4.5  1.6
Environment4  0.0  0.0  1.2  15.0 0.0
Environment5  3.2  2.4  7.2  5.5  6.6
Environment6  23.2  32.1  18.1  1.5  19.6

Je peux clairement voir (ou peut-être que mon intuition le dit) que l'expérience n'a pas été menée correctement dans Environnement4 (trop bas et fluctuant beaucoup) et Environnement5 (beaucoup trop élevé) mais je ne sais pas comment le prouver. Suis-je censé me fier aux tests d'hypothèses avec l'hypothèse:

L'expérience n'a pas été menée correctement dans les environnements 4 et 6.

puis utiliser une procédure pour le prouver? Ou existe-t-il une manière standard de le montrer? Quelqu'un peut-il m'aider à aborder ce genre de problèmes? J'utilise R.


Belle question, c'est un bon exemple pour exposer à différentes procédures, car nous savons essentiellement sans aucun calcul ni formalité, que les environnements 4 et 6 sont différents des autres (et l'environnement 1 est un peu différent de 2, 3 et 5). Ainsi, toute bonne procédure devrait pouvoir produire le résultat évident, seule la différence provenant de la quantification de la différence au sens mathématique. La question évidente est "y a-t-il une autre manière dont l'expérience aurait pu réellement produire ces résultats, en plus d'une erreur?"
Probabislogic

@probabilityislogic: Merci. Ce que vous dites est utile: si je peux en quelque sorte quantifier l'efficacité de l'expérience dans chaque environnement, alors je peux peut-être dire quelque chose mais je ne sais toujours pas quoi dire ou comment dire. Ah .. (... sensation stupide de taper dans des puzzles) :) Concernant votre question: l'expérience était assez contrôlée dans le sens où, on s'assurait que l'environnement ne changeait pas. Cependant, la procédure aurait pu mal tourner. Peut-être que la procédure n'a pas été exécutée correctement selon les directives (peut-être?)
Légende

Je parle plus dans le sens de " est-il une quantité physiquement significative? Que se passerait-il dans le monde réel si cela était correct". Il peut également être utile de parler à quelqu'un qui a réellement fait l'expérience 4 ou 6 (de préférence la personne qui a enregistré les données). 32.1
Probabislogic

@probabilityislogic: Je vois. Je comprends ton point de vue. La donnée est question est une variable de temps de réponse. Mon point de vue sur votre question serait que la valeur a du sens dans un monde physique, mais c'est juste trop inhabituel pour être qualifié de cas rare. La personne à qui j'ai parlé a dit qu'il n'avait rien fait de différent. En fait, les données que je mets ici ne sont qu'un échantillon de l'ensemble des données et il y a des cas comme celui-ci répartis ici et là.
Legend

il semblerait donc que le résultat le plus probable soit une erreur, mais des découvertes intéressantes peuvent être faites si vous "creusez plus profondément" pour ainsi dire. Cela pourrait être une nouvelle découverte en quelque sorte! mais ne vous excitez pas trop, ce n'est probablement rien, mais il peut être utile d'envisager la possibilité et de voir où cela vous mène.
Probabilogic

Réponses:


2

Vous pouvez faire un test d'élève pour voir si la moyenne est différente entre le groupe 4,6 et le reste. Même si la taille de votre échantillon est petite, vous conclurez par une différence. Notez qu'il vous dira que le groupe 4,6 est significativement différent en moyenne du reste, mais il ne vous dira pas que "l'expérience n'a pas été menée correctement dans les environnements 4 et 6", ce qui ne peut être répondu sans une connaissance de ce que "correctement" signifie dans les observations.


girad: En fait, cette question est venue de quelqu'un de l'équipe de test. Signifie correctement qu'ils ont reçu un ensemble d'instructions à exécuter pour obtenir une valeur finale. L'expérience se terminera même si l'une des instructions est ignorée mais entraînera une observation incorrecte. Je vais vérifier ce student testque vous avez mentionné. Mais si le test repose sur la moyenne, la moyenne n'est-elle pas censée être une mauvaise mesure en raison de sa sensibilité au changement des valeurs des données? Merci pour votre temps.
Legend

@Legend Un test de différence de moyens peut être inapproprié, mais ce n'est pas la faute de @robin, comme souligné dans la seconde moitié de sa réponse, qui est juste: le test à utiliser est déterminé par quelle caractéristique d'une suite de résultats signale une expérience "incorrecte". Vous pouvez effectuer un test F pour une différence des écarts-types; vous pouvez effectuer des tests à valeurs aberrantes multiples; vous pouvez effectuer un test de Kruskal-Wallis; etc., selon le type de différences que vous recherchez.
whuber

@Legend Il y a aussi une autre difficulté qui est ombragée par votre question car ici vous avez deviné que 4,6 étaient les différents échantillons. Mais que se passe-t-il si vous ne savez pas à l'avance ... vous devrez tester toutes les configurations et probablement introduire un critère d'hypothèses multiples. Dans ce cas, cela ressemble à une détection des valeurs aberrantes et de nombreuses questions ont déjà été traitées ici.
Robin Girard

@whuber: Je n'avais pas l'intention de voir que c'était la faute de quelqu'un. Je suis un novice ici, donc je m'excuse si cela vous semble. @robin girard: C'est une prise très intéressante. Merci. Je pensais juste à la détection des valeurs aberrantes. Serez-vous en mesure de m'indiquer des éléments pertinents pour ce cas particulier? Tout ce que j'ai utilisé auparavant sont des simples comme k-means etc.
Legend
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.