Fait référence aux complications ou problèmes statistiques dus au manque de données. Si votre question concerne un petit échantillon par rapport au nombre de variables, veuillez utiliser la balise [underdetermined] à la place.
Supposons que l'on effectue le bootstrap dit non paramétrique en tirant échantillons de taille n chacun à partir des n observations originales avec remplacement. Je crois que cette procédure équivaut à estimer la fonction de distribution cumulative par le cdf empirique:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function puis obtenir les échantillons de bootstrap en simulant …
Voici un peu de contexte. Je souhaite déterminer comment deux variables environnementales (température, niveaux de nutriments) affectent la valeur moyenne d'une variable de réponse sur une période de 11 ans. Chaque année, des données proviennent de plus de 100 000 emplacements. Le but est de déterminer si, au cours de …
J'ai un petit ensemble de données de 14 temps distincts pour terminer une tâche. Cependant, j'ai du mal à trouver un graphique approprié à utiliser pour représenter graphiquement les données. Si l'échantillon était plus grand, j'utiliserais une boîte à moustaches ou un histogramme, mais je ne sais pas s'il serait …
À partir d'une réponse à une question précédente , j'ai été orienté vers la séquence de Halton, pour créer un ensemble de vecteurs qui couvraient un espace d'échantillonnage uniforme de manière assez uniforme. Mais la page wikipedia mentionne que les nombres premiers supérieurs en particulier sont souvent fortement corrélés au …
J'ai un ensemble de données comprenant 24 lignes de données mensuelles. Les caractéristiques sont le PIB, les arrivées aux aéroports, le mois et quelques autres. La variable dépendante est le nombre de visiteurs d'une destination touristique populaire. Random Forest conviendrait-il à un tel problème? Les données ne sont pas publiques, …
Supposons la situation suivante: nous avons un grand nombre (par exemple 20) avec un petit groupe (par exemple n = 3). J'ai remarqué que si je génère des valeurs à partir de la distribution uniforme, les résidus sembleront approximativement normaux même si la distribution d'erreur est uniforme. Le code R …
J'essaie de comprendre exactement quelle est la différence entre les tests et les tests .ztttzzz Pour autant que je sache, pour les deux classes de tests, on utilise la même statistique de test, quelque chose de la forme b^−Cseˆ(b^)b^−Cse^(b^)\frac{\hat{b} - C}{\widehat{\operatorname{se}}(\hat{b})} où est un exemple de statistique, est une constante …
Jerome Cornfield a écrit: L'un des meilleurs fruits de la révolution des pêcheurs a été l'idée de la randomisation, et les statisticiens qui sont d'accord sur peu d'autres choses sont au moins d'accord là-dessus. Mais malgré cet accord et malgré l'utilisation généralisée des procédures d'allocation aléatoire en clinique et dans …
Les méthodes d'ensemble basées sur des arbres telles que la forêt aléatoire et les dérivés subséquents (par exemple, la forêt conditionnelle), prétendent toutes être utiles dans les problèmes dits «petits n , grands p », pour identifier l'importance relative des variables. En effet, cela semble être le cas, mais ma …
Je veux exécuter une régression avec 4 à 5 variables explicatives, mais je n'ai que 15 observations. Ne pouvant supposer que ces variables sont normalement distribuées, existe-t-il une méthode de régression non paramétrique ou toute autre méthode de régression valide?
J'ai un petit échantillon de 15. Je veux voir s'il y a une différence dans les apports nutritionnels entre deux variables indépendantes, groupe 1 n = 11, groupe 2 n = 4. Les données ne sont pas normalement distribuées. Quel test est le plus approprié, le test Mann Whitney U …
Le taux de fausses découvertes (Benjamini-Hochberg) est généralement utilisé sur les «Big Data», comme les études génétiques utilisant des centaines de tests. Mais peut-il également être utilisé sur un plus petit nombre de tests? Par exemple, en examinant les résultats de deux groupes (hommes vs femmes) sur, disons, 10-20 questionnaires …
Fermé . Cette question a besoin de détails ou de clarté . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Ajoutez des détails et clarifiez le problème en modifiant ce message . Fermé il y a 5 ans . Si je sais que la population est normalement distribuée, …
J'ai 21 variables macroéconomiques et socio-économiques d'attitudes (comme le pourcentage de mères âgées de 24 à 54 ans sans emploi, le pourcentage d'enfants âgés de 3 à 5 ans dans les écoles maternelles, etc.). J'ai également des données sur les proportions de grands-parents qui ont fourni des services de garde …
J'ai un ensemble de données d'études de cas de projet pour un nouveau type de méthode de recherche pour les agences gouvernementales pour soutenir les activités de prise de décision. Ma tâche consiste à développer une méthode d'estimation basée sur l'expérience passée pour de futurs projets à des fins d'estimation. …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.