Statistiques et Big Data panel-data

1

Données de panneau: effets OLS groupés vs effets RE vs FE

Nous avons discuté de l'utilité des estimateurs groupés OLS et RE par rapport à FE. Donc, pour autant que je sache, l'estimation OLS groupée est simplement une technique OLS exécutée sur des données Panel. Par conséquent, tous les effets spécifiques à chaque individu sont complètement ignorés. Pour cette raison, de …

8 panel-data random-effects-model fixed-effects-model pooling

4

Régression des pays en développement: PIB-croissance ou PIB

Pour ma thèse de maîtrise, je veux essentiellement savoir pourquoi les pays en développement stagnent. À côté des aspects théoriques, je veux également faire une régression. Je veux régresser le PIB ou la croissance du PIB en tant que variable dépendante de nombreuses variables indépendantes, telles que le mandat du …

8 regression econometrics panel-data macroeconomics

3

Trouvez la distribution et passez à la distribution normale

J'ai des données qui décrivent la fréquence à laquelle un événement se produit pendant une heure ("nombre par heure", nph) et la durée des événements ("durée en secondes par heure", dph). Ce sont les données d'origine: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, …

8 normal-distribution data-transformation logistic generalized-linear-model ridge-regression t-test wilcoxon-signed-rank paired-data naive-bayes distributions logistic goodness-of-fit time-series eviews ecm panel-data reliability psychometrics validity cronbachs-alpha self-study random-variable expected-value median regression self-study multiple-regression linear-model forecasting prediction-interval normal-distribution excel bayesian multivariate-analysis modeling predictive-models canonical-correlation rbm time-series machine-learning neural-networks fishers-exact factorisation-theorem svm prediction linear reinforcement-learning cdf probability-inequalities ecdf time-series kalman-filter state-space-models dynamic-regression index-decomposition sampling stratification cluster-sample survey-sampling distributions maximum-likelihood gamma-distribution

1

Comment utiliser le test Hausman pour la discrimination fondée sur le sexe?

J'essaie d'estimer l'écart salarial entre hommes et femmes pour les employés de bureau masculins et féminins d'une grande entreprise suédoise afin de vérifier s'il existe une discrimination fondée sur le sexe. Le test de Hausman rejette la valeur nulle selon laquelle les effets fixes individuels sont aléatoires et, par conséquent, …

8 econometrics panel-data random-effects-model fixed-effects-model hausman

2

Correspondance du score de propension avec un traitement variant dans le temps

La procédure d'appariement des scores de propension de base fonctionne avec des données transversales (c'est-à-dire collectées à un certain moment). La commande psmatch2 populaire utilise une variable fictive indiquant qu'une observation appartient au groupe de traitement ou de contrôle. Cependant, dans mon jeu de données, cette fonction d'indicateur varie dans …

8 stata panel-data propensity-scores

1

Spécification des données du panneau

J'essaie de trouver la meilleure spécification pour mon jeu de données. J'essaie de sonder l'efficacité des zones économiques spéciales en Pologne dans le sens de la croissance de l'économie dans trois modèles de données de panel similaires pour les variables expliquées: a) taux de chômage enregistré b) PIB par habitant …

8 stata econometrics panel-data fixed-effects-model

2

Pourquoi un modèle statistique serait-il surchargé s'il était doté d'un énorme ensemble de données?

Mon projet actuel peut m'obliger à construire un modèle pour prédire le comportement d'un certain groupe de personnes. l'ensemble de données de formation ne contient que 6 variables (id est uniquement à des fins d'identification): id, age, income, gender, job category, monthly spend dans laquelle se monthly spendtrouve la variable …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

1

Visualisation des données longitudinales avec résultat binaire

Pour les données longitudinales avec un résultat numérique, je peux utiliser des tracés de spaghetti pour visualiser les données. Par exemple quelque chose comme ça (tiré du site UCLA Stats): tolerance<-read.table("http://www.ats.ucla.edu/stat/r/faq/tolpp.csv",sep=",", header=T) head(tolerance, n=10) interaction.plot(tolerance$time, tolerance$id, tolerance$tolerance, xlab="time", ylab="Tolerance", legend=F) Mais que se passe-t-il si mon résultat est binaire 0 …

8 data-visualization repeated-measures binary-data panel-data

3

Tests de racine unitaire pour les données de panel dans R

J'ai le plmpaquet et je voudrais exécuter des tests de racine unitaire sur certaines variables. J'obtiens l'erreur suivante: > purtest(data$tot.emp) Error in data.frame(baldwin = c(59870, 61259, 60397, 58919, 57856, 57227, : arguments imply differing number of rows: 14, 19, 11, 12, 1, 20, 18, 10, 13 Je suppose que j'obtiens …

8 r panel-data unit-root

1

Correction des erreurs standard lorsque les variables indépendantes sont autocorrélées

J'ai une question sur la façon de corriger les erreurs standard lorsque la variable indépendante a une corrélation. Dans un cadre simple de séries chronologiques, nous pouvons utiliser la matrice de covariance de Newey-West avec un tas de décalages et cela réglera le problème de corrélation dans les résidus. Que …

8 clustering standard-error panel-data

3

Modèles longitudinaux en R et WINBUGS ou JAGS

J'ai essayé d'utiliser R pour s'adapter à certains modèles longitudinaux, principalement via lmeret nlmepackages. Cependant, il semble que de nombreux modèles standard font défaut, tels que les modèles d'antidépendance ou les modèles analytiques factoriels pour les matrices de covariance. Ces modèles sont facilement disponibles dans SAS. Quelqu'un recommanderait-il d'autres packages …

8 r jags panel-data

1

Les pentes des régressions linéaires peuvent-elles être utilisées comme variables indépendantes ou dépendantes dans d'autres modèles de régression?

J'ai 100 patients et chaque patient a 10 mesures longitudinales de la créatinine sérique. Les taux de filtration glomérulaire estimés (DFGe) ont été calculés à partir d'une formule MDRD comprenant le sexe, l'âge et la créatinine sérique. Le DFGe est la variable dépendante et le temps est la variable indépendante …

8 regression mixed-model repeated-measures panel-data

Questions marquées «panel-data»