Questions marquées «weighted-mean»

Une moyenne pondérée (ou moyenne pondérée) est comme une moyenne ordinaire, mais les observations ne contribuent pas également - l'accent est mis davantage sur certaines valeurs de données que sur d'autres; ils sont pondérés par un montant supérieur ou inférieur à 1 / n.

8
Générer une variable aléatoire avec une corrélation définie avec une ou plusieurs variables existantes
Pour une étude de simulation , je dois générer des variables aléatoires qui montrent une corrélation prefined (population) à une variable existante .YYY J'ai examiné les Rpackages copulaet ceux CDVinequi peuvent produire des distributions multivariées aléatoires avec une structure de dépendance donnée. Cependant, il n'est pas possible de fixer l'une …


2
Correction du biais dans la variance pondérée
Pour la variance non pondérée il existe la variance d'échantillon corrigée du biais, lorsque la moyenne a été estimée à partir des mêmes données: Var(X):=1Var(X):=1n∑i(xi−μ)2Var(X):=1n∑i(xi−μ)2\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2Var(X):=1n−1∑i(xi−E[X])2Var(X):=1n−1∑i(xi−E[X])2\text{Var}(X):=\frac{1}{n-1}\sum_i(x_i - E[X])^2 J'examine la moyenne et la variance pondérées et je me demande quelle est la correction de biais appropriée pour la variance …

1
Variance pondérée, une fois de plus
La variance pondérée non biaisée a déjà été abordée ici et ailleurs, mais il semble toujours y avoir une confusion surprenante. Il semble y avoir un consensus sur la formule présentée dans le premier lien ainsi que dans l'article Wikipedia . Cela ressemble également à la formule utilisée par R, …

2
Comment calculer la durée moyenne d'adhésion au végétarisme alors que nous ne disposons que de données d'enquête sur les végétariens actuels?
Un échantillon de population aléatoire a été sondé. On leur a demandé s'ils avaient un régime végétarien. S'ils ont répondu oui, on leur a également demandé de préciser depuis combien de temps ils suivaient un régime végétarien sans interruption. Je veux utiliser ces données pour calculer la durée moyenne d'adhésion …

2
Calcul de l'erreur standard dans l'estimation moyenne pondérée
Supposons que w1,w2,…,wnw1,w2,…,wnw_1,w_2,\ldots,w_n et x1,x2,...,xnx1,x2,...,xnx_1,x_2,...,x_n sont chacun tirés iid de certaines distributions, avec wiwiw_i indépendant de xixix_i . Les sont strictement positifs. Vous observez tous les , mais pas les ; vous observez plutôt . Je souhaite estimerwiwiw_iwiwiw_ixixix_i∑ixiwi∑ixiwi\sum_i x_i w_iE[x]E⁡[x]\operatorname{E}\left[x\right]à partir de ces informations. Il est clair que l'estimateur est …



4
La moyenne d'un ensemble de moyennes sera-t-elle toujours la même que la moyenne obtenue à partir de l'ensemble des données brutes?
Si j'ai calculé la moyenne de 4 ensembles de données (qui ont des tailles d'échantillon différentes), puis-je alors obtenir une "moyenne globale" en calculant la "moyenne des moyennes"? Si oui, cette «moyenne des moyens» sera-t-elle la même que si j'avais combiné les données des 4 ensembles et calculé la moyenne?


2
Pourquoi un modèle statistique serait-il surchargé s'il était doté d'un énorme ensemble de données?
Mon projet actuel peut m'obliger à construire un modèle pour prédire le comportement d'un certain groupe de personnes. l'ensemble de données de formation ne contient que 6 variables (id est uniquement à des fins d'identification): id, age, income, gender, job category, monthly spend dans laquelle se monthly spendtrouve la variable …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 

1
Une façon plus simple de calculer la moyenne mobile à pondération exponentielle?
Méthode proposée: Étant donné une série temporelle , je veux calculer une moyenne mobile pondérée avec une fenêtre de moyenne de points, où les pondérations favorisent les valeurs plus récentes par rapport aux valeurs plus anciennes.Xjexix_iNNN En choisissant les poids, j'utilise le fait familier qu'une série géométrique converge vers 1, …

1
Moyennes de moyennes (de moyennes, de moyennes…)
Considérez l'expérience de biologie cellulaire suivante. Nous comparons différents traitements de cellules en culture. Chaque traitement est répliqué dans plusieurs puits (microtitrage) , indexés par la variable . Pour mesurer la réponse au traitement dans le puits , un total de micrographies ou champs non chevauchants sont enregistrés. Ensuite, pour …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.