Fait référence aux complications ou problèmes statistiques dus au manque de données. Si votre question concerne un petit échantillon par rapport au nombre de variables, veuillez utiliser la balise [underdetermined] à la place.
Certaines hypothèses peuvent être vérifiées à l'aide du test t de Student (peut-être à l'aide de la correction de Welch pour les variances inégales dans le cas à deux échantillons), ou par un test non paramétrique comme le test de Wilcoxon apparié signé, le test de Wilcoxon-Mann-Whitney U, ou le …
Cette question a été déclenchée par quelque chose que j'ai lu dans ce manuel de statistiques de deuxième cycle et que j'ai entendu (indépendamment) lors de cette présentation lors d'un séminaire statistique. Dans les deux cas, la déclaration était dans les lignes de "parce que la taille de l'échantillon est …
Je me demande ce que nous pouvons dire, le cas échéant, sur la moyenne de la population, quand tout ce que j’ai, c’est une seule mesure, (taille de l’échantillon de 1). Évidemment, nous aimerions avoir plus de mesures, mais nous ne pouvons pas les obtenir.y 1μμ\muy1y1y_1 Il me semble que …
J'ai des données montrant les résultats de l'examen d'entrée des pompiers. Je teste l'hypothèse selon laquelle les résultats des examens et l'appartenance ethnique ne sont pas mutuellement indépendants. Pour tester cela, j’ai effectué un test du chi-carré de Pearson dans R. Les résultats montrent ce à quoi j’attendais, mais il …
J'ai une question liée à la modélisation de courtes séries chronologiques. Ce n'est pas une question de savoir si les modéliser , mais comment. Quelle méthode recommanderiez-vous pour la modélisation de séries chronologiques (très) courtes (disons de longueur )? Par "meilleur", j'entends ici le plus robuste, le moins sujet aux …
Le test ttt Student nécessite l'écart type de l'échantillon . Cependant, comment puis-je calculer pour lorsque seules la taille et la moyenne de l'échantillon sont connues?ssssss Par exemple, si la taille de l'échantillon est de et la moyenne de l'échantillon est de , j'essaierai alors de créer une liste de …
L'analyse exploratoire des données (EDA) conduit souvent à explorer d'autres «pistes» qui n'appartiennent pas nécessairement à l'ensemble initial d'hypothèses. Je suis confronté à une telle situation dans le cas d'études avec une taille d'échantillon limitée et beaucoup de données collectées à travers différents questionnaires (données socio-démographiques, échelles neuropsychologiques ou médicales …
Je travaille sur un projet où je souhaite extraire des informations sur le contenu d'une série d'essais ouverts. Dans ce projet particulier, 148 personnes ont écrit des essais sur une organisation étudiante hypothétique dans le cadre d'une expérience plus vaste. Bien que dans mon domaine (psychologie sociale), la façon typique …
Jusqu'à présent, j'ai utilisé la statistique de Shapiro-Wilk afin de tester les hypothèses de normalité dans de petits échantillons. Pourriez-vous s'il vous plaît recommander une autre technique?
J'ai appris qu'une petite taille d'échantillon peut entraîner une alimentation insuffisante et une erreur de type 2. Cependant, j'ai le sentiment que les petits échantillons ne sont généralement pas fiables et peuvent conduire à tout type de résultat par hasard. Est-ce vrai?
La précision est définie comme: p = true positives / (true positives + false positives) Est - il exact que, true positiveset false positivesapproche 0, la précision approche 1? Même question pour rappel: r = true positives / (true positives + false negatives) J'implémente actuellement un test statistique où j'ai …
Si mon résultat de test t unilatéral est significatif mais que la taille de l'échantillon est petite (par exemple inférieure à 20 environ), puis-je toujours faire confiance à ce résultat? Sinon, comment dois-je traiter et / ou interpréter ce résultat?
Existe-t-il une "règle" pour déterminer la taille d'échantillon minimale requise pour qu'un test t soit valide? Par exemple, une comparaison doit être effectuée entre les moyennes de 2 populations. Il y a 7 points de données d'une population et seulement 2 points de données de l'autre. Malheureusement, l'expérience est très …
TLDR: Mon ensemble de données est assez petit (120) échantillons. Lors de la validation croisée 10 fois, dois-je: Recueillir les résultats de chaque pli test, les concaténer en un vecteur, puis calculer l'erreur sur ce vecteur complet de prédictions (120 échantillons)? Ou devrais-je plutôt calculer l'erreur sur les sorties que …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.