Un échantillon est un sous-ensemble d'une population. Les statistiques, en général, concernent l'utilisation d'échantillons pour faire des inférences sur les paramètres régissant une population plus grande (peut-être infinie).
Je travaille sur une nouvelle méthode d'analyse et d'analyse de jeux de données pour identifier et isoler les sous-groupes d'une population sans connaître à l'avance les caractéristiques d'aucun sous-groupe. Bien que la méthode fonctionne assez bien avec des échantillons de données artificiels (c'est-à-dire des ensembles de données créés spécifiquement dans …
Quelle est la différence entre une population et un échantillon? Quelles variables et statistiques communes sont utilisées pour chacune d’elles, et comment se rapportent-elles?
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 2 ans . J'utilise caret pour exécuter une forêt aléatoire validée de façon croisée …
Que se passe-t-il si vous prenez un échantillon aléatoire et que vous pouvez voir qu'il n'est clairement pas représentatif, comme dans une question récente . Par exemple, que se passe-t-il si la distribution de la population est censée être symétrique autour de 0 et que l'échantillon que vous tirez au …
Je viens de tomber sur cet article , qui décrit comment calculer la répétabilité (aka fiabilité, aka corrélation intraclasse) d'une mesure via la modélisation d'effets mixtes. Le code R serait: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute …
Lorsque j'utilise GAM, cela me donne un DF résiduel de (dernière ligne du code). Qu'est-ce que ça veut dire? Au-delà de l'exemple GAM, en général, le nombre de degrés de liberté peut-il être un nombre non entier?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) …
J'ai échantillonné un processus du monde réel, les temps de ping du réseau. Le "temps d'aller-retour" est mesuré en millisecondes. Les résultats sont tracés sur un histogramme: Les temps de ping ont une valeur minimale, mais une longue queue supérieure. Je veux savoir de quelle distribution statistique il s'agit et …
Supposons que l'on effectue le bootstrap dit non paramétrique en tirant échantillons de taille n chacun à partir des n observations originales avec remplacement. Je crois que cette procédure équivaut à estimer la fonction de distribution cumulative par le cdf empirique:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function puis obtenir les échantillons de bootstrap en simulant …
Est-il valable d'utiliser la longueur moyenne ( ) et le poids moyen ( )) d'une population donnée pour calculer l'indice de masse corporelle moyen ( ) pour cette population?hhhwwwBMI=wh2BMI=wh2BMI = \frac{w}{h^2}
Je connais relativement bien la distinction entre les termes statistique et paramètre. Je vois une statistique comme la valeur obtenue en appliquant une fonction aux données d'échantillon. Cependant, la plupart des exemples de paramètres concernent la définition d'une distribution paramétrique. Un exemple courant est la moyenne et l'écart type pour …
J'espère que cette question ne sera pas marquée comme «trop générale» et j'espère qu'une discussion commencera qui bénéficiera à tous. En statistiques, nous passons beaucoup de temps à apprendre de grandes théories d'échantillonnage. Nous souhaitons vivement évaluer les propriétés asymptotiques de nos estimateurs, notamment s’ils sont asymptotiquement impartiaux, asymptotiquement efficaces, …
Quels sont les avantages et les inconvénients de l'utilisation de LARS [1] par rapport à l'utilisation de la descente de coordonnées pour ajuster la régression linéaire régularisée L1? Je m'intéresse principalement aux aspects de performance (mes problèmes ont tendance à avoir Ndes centaines de milliers et p<20). Cependant, toute autre …
Ces deux expressions m'ont beaucoup dérouté lorsque j'apprenais les statistiques. Il me semble que ce sont des choses totalement différentes. Un échantillon aléatoire consiste à prélever au hasard un échantillon dans une population, tandis qu'une variable aléatoire est comme une fonction qui mappe l'ensemble de tous les résultats possibles d'une …
Les compétitions de Kaggle déterminent les classements finaux sur la base d'un ensemble de tests en suspens. Un ensemble de test retenu est un échantillon; il peut ne pas être représentatif de la population modélisée. Étant donné que chaque soumission est comme une hypothèse, l'algorithme qui a remporté le concours …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.