Statistiques et Big Data weighted-mean

8

Générer une variable aléatoire avec une corrélation définie avec une ou plusieurs variables existantes

Pour une étude de simulation , je dois générer des variables aléatoires qui montrent une corrélation prefined (population) à une variable existante .YYY J'ai examiné les Rpackages copulaet ceux CDVinequi peuvent produire des distributions multivariées aléatoires avec une structure de dépendance donnée. Cependant, il n'est pas possible de fixer l'une …

71 r correlation random-variable random-generation independence assumptions random-variable unbiased-estimator regression hypothesis-testing heteroscedasticity generalized-least-squares distributions networks data-visualization sas reproducible-research philosophical time-series variance outliers quality-control mean multilevel-analysis average weighted-mean regression confidence-interval prediction-interval correlation matlab matrix data-mining maximum-likelihood r time-series survival predictive-models

5

Comment calculer un écart-type pondéré? Dans Excel?

Donc, j'ai un ensemble de données de pourcentages comme ceci: 100 / 10000 = 1% (0.01) 2 / 5 = 40% (0.4) 4 / 3 = 133% (1.3) 1000 / 2000 = 50% (0.5) Je veux trouver l'écart type des pourcentages, mais pondéré pour leur volume de données. c'est-à-dire que …

29 standard-deviation excel weighted-mean

2

Correction du biais dans la variance pondérée

Pour la variance non pondérée il existe la variance d'échantillon corrigée du biais, lorsque la moyenne a été estimée à partir des mêmes données: Var(X):=1Var(X):=1n∑i(xi−μ)2Var(X):=1n∑i(xi−μ)2\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2Var(X):=1n−1∑i(xi−E[X])2Var(X):=1n−1∑i(xi−E[X])2\text{Var}(X):=\frac{1}{n-1}\sum_i(x_i - E[X])^2 J'examine la moyenne et la variance pondérées et je me demande quelle est la correction de biais appropriée pour la variance …

22 variance unbiased-estimator weighted-mean weighted-data bias-correction

1

Variance pondérée, une fois de plus

La variance pondérée non biaisée a déjà été abordée ici et ailleurs, mais il semble toujours y avoir une confusion surprenante. Il semble y avoir un consensus sur la formule présentée dans le premier lien ainsi que dans l'article Wikipedia . Cela ressemble également à la formule utilisée par R, …

17 variance weighted-mean weighted-data

2

Comment calculer la durée moyenne d'adhésion au végétarisme alors que nous ne disposons que de données d'enquête sur les végétariens actuels?

Un échantillon de population aléatoire a été sondé. On leur a demandé s'ils avaient un régime végétarien. S'ils ont répondu oui, on leur a également demandé de préciser depuis combien de temps ils suivaient un régime végétarien sans interruption. Je veux utiliser ces données pour calculer la durée moyenne d'adhésion …

16 survival mean missing-data survey weighted-mean

2

Calcul de l'erreur standard dans l'estimation moyenne pondérée

Supposons que w1,w2,…,wnw1,w2,…,wnw_1,w_2,\ldots,w_n et x1,x2,...,xnx1,x2,...,xnx_1,x_2,...,x_n sont chacun tirés iid de certaines distributions, avec wiwiw_i indépendant de xixix_i . Les sont strictement positifs. Vous observez tous les , mais pas les ; vous observez plutôt . Je souhaite estimerwiwiw_iwiwiw_ixixix_i∑ixiwi∑ixiwi\sum_i x_i w_iE[x]E⁡[x]\operatorname{E}\left[x\right]à partir de ces informations. Il est clair que l'estimateur est …

16 standard-error weighted-mean

1

Déterminer la vraie moyenne à partir d'observations bruyantes

J'ai un grand ensemble de points de données du formulaire (moyenne, stdev). Je souhaite réduire cela à une moyenne (meilleure) et à un écart-type (espérons-le) plus petit. De toute évidence, je pourrais simplement calculer , mais cela ne tient pas compte du fait que certains points de données sont nettement …

13 normal-distribution repeated-measures weighted-mean

1

Système de vote qui utilise la précision de chaque électeur et l'incertitude associée

Disons que nous avons une simple question "oui / non" à laquelle nous voulons savoir une réponse. Et il y a N personnes "votant" pour la bonne réponse. Chaque électeur a une histoire - une liste de 1 et de 0, montrant s'ils avaient raison ou tort au sujet de …

11 accuracy uncertainty weighted-mean voting-system

4

La moyenne d'un ensemble de moyennes sera-t-elle toujours la même que la moyenne obtenue à partir de l'ensemble des données brutes?

Si j'ai calculé la moyenne de 4 ensembles de données (qui ont des tailles d'échantillon différentes), puis-je alors obtenir une "moyenne globale" en calculant la "moyenne des moyennes"? Si oui, cette «moyenne des moyens» sera-t-elle la même que si j'avais combiné les données des 4 ensembles et calculé la moyenne?

11 mathematical-statistics weighted-mean mean

2

Variance de la moyenne pondérée supérieure à la moyenne non pondérée

Un de mes critiques demande pourquoi j'ai utilisé des données non pondérées, au lieu de données pondérées. J'ai discuté de la question avec un statisticien et sa réponse allait dans le sens de Si vous avez des observations indépendantes et que vous prenez la moyenne globale, sa variance est toujours …

8 variance weighted-mean weighted-data

2

Pourquoi un modèle statistique serait-il surchargé s'il était doté d'un énorme ensemble de données?

Mon projet actuel peut m'obliger à construire un modèle pour prédire le comportement d'un certain groupe de personnes. l'ensemble de données de formation ne contient que 6 variables (id est uniquement à des fins d'identification): id, age, income, gender, job category, monthly spend dans laquelle se monthly spendtrouve la variable …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

1

Une façon plus simple de calculer la moyenne mobile à pondération exponentielle?

Méthode proposée: Étant donné une série temporelle , je veux calculer une moyenne mobile pondérée avec une fenêtre de moyenne de points, où les pondérations favorisent les valeurs plus récentes par rapport aux valeurs plus anciennes.Xjexix_iNNN En choisissant les poids, j'utilise le fait familier qu'une série géométrique converge vers 1, …

8 time-series forecasting algorithms weighted-mean

1

Moyennes de moyennes (de moyennes, de moyennes…)

Considérez l'expérience de biologie cellulaire suivante. Nous comparons différents traitements de cellules en culture. Chaque traitement est répliqué dans plusieurs puits (microtitrage) , indexés par la variable . Pour mesurer la réponse au traitement dans le puits , un total de micrographies ou champs non chevauchants sont enregistrés. Ensuite, pour …

8 mean multilevel-analysis average weighted-mean

Questions marquées «weighted-mean»