Statistiques et Big Data small-sample

3

Bootstrap: la question du sur-ajustement

Supposons que l'on effectue le bootstrap dit non paramétrique en tirant échantillons de taille n chacun à partir des n observations originales avec remplacement. Je crois que cette procédure équivaut à estimer la fonction de distribution cumulative par le cdf empirique:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function puis obtenir les échantillons de bootstrap en simulant …

14 bootstrap sample-size sample small-sample finite-population

7

Les courtes séries temporelles valent-elles la modélisation?

Voici un peu de contexte. Je souhaite déterminer comment deux variables environnementales (température, niveaux de nutriments) affectent la valeur moyenne d'une variable de réponse sur une période de 11 ans. Chaque année, des données proviennent de plus de 100 000 emplacements. Le but est de déterminer si, au cours de …

14 time-series regression sample-size small-sample

4

Représentation graphique de petits échantillons

J'ai un petit ensemble de données de 14 temps distincts pour terminer une tâche. Cependant, j'ai du mal à trouver un graphique approprié à utiliser pour représenter graphiquement les données. Si l'échantillon était plus grand, j'utiliserais une boîte à moustaches ou un histogramme, mais je ne sais pas s'il serait …

13 data-visualization descriptive-statistics small-sample

1

Séquence de Halton vs séquence de Sobol?

À partir d'une réponse à une question précédente , j'ai été orienté vers la séquence de Halton, pour créer un ensemble de vecteurs qui couvraient un espace d'échantillonnage uniforme de manière assez uniforme. Mais la page wikipedia mentionne que les nombres premiers supérieurs en particulier sont souvent fortement corrélés au …

13 sampling small-sample quasi-monte-carlo

2

La forêt aléatoire convient-elle à de très petits ensembles de données?

J'ai un ensemble de données comprenant 24 lignes de données mensuelles. Les caractéristiques sont le PIB, les arrivées aux aéroports, le mois et quelques autres. La variable dépendante est le nombre de visiteurs d'une destination touristique populaire. Random Forest conviendrait-il à un tel problème? Les données ne sont pas publiques, …

13 random-forest small-sample

1

ANOVA: test d'hypothèse de normalité pour de nombreux groupes avec peu d'échantillons par groupe

Supposons la situation suivante: nous avons un grand nombre (par exemple 20) avec un petit groupe (par exemple n = 3). J'ai remarqué que si je génère des valeurs à partir de la distribution uniforme, les résidus sembleront approximativement normaux même si la distribution d'erreur est uniforme. Le code R …

12 anova normal-distribution small-sample

1

tests vs tests?

J'essaie de comprendre exactement quelle est la différence entre les tests et les tests .ztttzzz Pour autant que je sache, pour les deux classes de tests, on utilise la même statistique de test, quelque chose de la forme b^−Cseˆ(b^)b^−Cse^(b^)\frac{\hat{b} - C}{\widehat{\operatorname{se}}(\hat{b})} où est un exemple de statistique, est une constante …

12 hypothesis-testing t-test small-sample

2

La randomisation est-elle fiable avec de petits échantillons?

Jerome Cornfield a écrit: L'un des meilleurs fruits de la révolution des pêcheurs a été l'idée de la randomisation, et les statisticiens qui sont d'accord sur peu d'autres choses sont au moins d'accord là-dessus. Mais malgré cet accord et malgré l'utilisation généralisée des procédures d'allocation aléatoire en clinique et dans …

11 small-sample random-allocation

3

Limites des méthodes d'ensemble arborescentes dans les petits problèmes n, grands p?

Les méthodes d'ensemble basées sur des arbres telles que la forêt aléatoire et les dérivés subséquents (par exemple, la forêt conditionnelle), prétendent toutes être utiles dans les problèmes dits «petits n , grands p », pour identifier l'importance relative des variables. En effet, cela semble être le cas, mais ma …

10 random-forest small-sample ensemble

1

Régression avec un échantillon de très petite taille

Je veux exécuter une régression avec 4 à 5 variables explicatives, mais je n'ai que 15 observations. Ne pouvant supposer que ces variables sont normalement distribuées, existe-t-il une méthode de régression non paramétrique ou toute autre méthode de régression valide?

9 regression small-sample

1

Kolmogorov Smirnov Z vs Mann Whitney U petit échantillon n = 15?

J'ai un petit échantillon de 15. Je veux voir s'il y a une différence dans les apports nutritionnels entre deux variables indépendantes, groupe 1 n = 11, groupe 2 n = 4. Les données ne sont pas normalement distribuées. Quel test est le plus approprié, le test Mann Whitney U …

8 mean wilcoxon-mann-whitney small-sample median kolmogorov-smirnov

1

Correction pour plusieurs tests sur un nombre modeste de tests (10-20) avec FDR?

Le taux de fausses découvertes (Benjamini-Hochberg) est généralement utilisé sur les «Big Data», comme les études génétiques utilisant des centaines de tests. Mais peut-il également être utilisé sur un plus petit nombre de tests? Par exemple, en examinant les résultats de deux groupes (hommes vs femmes) sur, disons, 10-20 questionnaires …

8 multiple-comparisons small-sample false-discovery-rate

2

La distribution d'échantillonnage pour les petits échantillons d'une population normale est-elle normale ou distribuée? [fermé]

Fermé . Cette question a besoin de détails ou de clarté . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Ajoutez des détails et clarifiez le problème en modifiant ce message . Fermé il y a 5 ans . Si je sais que la population est normalement distribuée, …

8 distributions normal-distribution sampling small-sample t-distribution

3

Techniques de réduction des dimensions pour les très petits échantillons

J'ai 21 variables macroéconomiques et socio-économiques d'attitudes (comme le pourcentage de mères âgées de 24 à 54 ans sans emploi, le pourcentage d'enfants âgés de 3 à 5 ans dans les écoles maternelles, etc.). J'ai également des données sur les proportions de grands-parents qui ont fourni des services de garde …

8 pca factor-analysis dimensionality-reduction small-sample correspondence-analysis

1

Régression multiple avec de petits ensembles de données

J'ai un ensemble de données d'études de cas de projet pour un nouveau type de méthode de recherche pour les agences gouvernementales pour soutenir les activités de prise de décision. Ma tâche consiste à développer une méthode d'estimation basée sur l'expérience passée pour de futurs projets à des fins d'estimation. …

8 regression small-sample

Questions marquées «small-sample»