Les données de panel se réfèrent à des données multidimensionnelles impliquant fréquemment des mesures dans le temps en économétrie. On l'appelle également données longitudinales en biostatistique.
Nous avons discuté de l'utilité des estimateurs groupés OLS et RE par rapport à FE. Donc, pour autant que je sache, l'estimation OLS groupée est simplement une technique OLS exécutée sur des données Panel. Par conséquent, tous les effets spécifiques à chaque individu sont complètement ignorés. Pour cette raison, de …
Pour ma thèse de maîtrise, je veux essentiellement savoir pourquoi les pays en développement stagnent. À côté des aspects théoriques, je veux également faire une régression. Je veux régresser le PIB ou la croissance du PIB en tant que variable dépendante de nombreuses variables indépendantes, telles que le mandat du …
J'ai des données qui décrivent la fréquence à laquelle un événement se produit pendant une heure ("nombre par heure", nph) et la durée des événements ("durée en secondes par heure", dph). Ce sont les données d'origine: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, …
J'essaie d'estimer l'écart salarial entre hommes et femmes pour les employés de bureau masculins et féminins d'une grande entreprise suédoise afin de vérifier s'il existe une discrimination fondée sur le sexe. Le test de Hausman rejette la valeur nulle selon laquelle les effets fixes individuels sont aléatoires et, par conséquent, …
La procédure d'appariement des scores de propension de base fonctionne avec des données transversales (c'est-à-dire collectées à un certain moment). La commande psmatch2 populaire utilise une variable fictive indiquant qu'une observation appartient au groupe de traitement ou de contrôle. Cependant, dans mon jeu de données, cette fonction d'indicateur varie dans …
J'essaie de trouver la meilleure spécification pour mon jeu de données. J'essaie de sonder l'efficacité des zones économiques spéciales en Pologne dans le sens de la croissance de l'économie dans trois modèles de données de panel similaires pour les variables expliquées: a) taux de chômage enregistré b) PIB par habitant …
Mon projet actuel peut m'obliger à construire un modèle pour prédire le comportement d'un certain groupe de personnes. l'ensemble de données de formation ne contient que 6 variables (id est uniquement à des fins d'identification): id, age, income, gender, job category, monthly spend dans laquelle se monthly spendtrouve la variable …
Pour les données longitudinales avec un résultat numérique, je peux utiliser des tracés de spaghetti pour visualiser les données. Par exemple quelque chose comme ça (tiré du site UCLA Stats): tolerance<-read.table("http://www.ats.ucla.edu/stat/r/faq/tolpp.csv",sep=",", header=T) head(tolerance, n=10) interaction.plot(tolerance$time, tolerance$id, tolerance$tolerance, xlab="time", ylab="Tolerance", legend=F) Mais que se passe-t-il si mon résultat est binaire 0 …
J'ai le plmpaquet et je voudrais exécuter des tests de racine unitaire sur certaines variables. J'obtiens l'erreur suivante: > purtest(data$tot.emp) Error in data.frame(baldwin = c(59870, 61259, 60397, 58919, 57856, 57227, : arguments imply differing number of rows: 14, 19, 11, 12, 1, 20, 18, 10, 13 Je suppose que j'obtiens …
J'ai une question sur la façon de corriger les erreurs standard lorsque la variable indépendante a une corrélation. Dans un cadre simple de séries chronologiques, nous pouvons utiliser la matrice de covariance de Newey-West avec un tas de décalages et cela réglera le problème de corrélation dans les résidus. Que …
J'ai essayé d'utiliser R pour s'adapter à certains modèles longitudinaux, principalement via lmeret nlmepackages. Cependant, il semble que de nombreux modèles standard font défaut, tels que les modèles d'antidépendance ou les modèles analytiques factoriels pour les matrices de covariance. Ces modèles sont facilement disponibles dans SAS. Quelqu'un recommanderait-il d'autres packages …
J'ai 100 patients et chaque patient a 10 mesures longitudinales de la créatinine sérique. Les taux de filtration glomérulaire estimés (DFGe) ont été calculés à partir d'une formule MDRD comprenant le sexe, l'âge et la créatinine sérique. Le DFGe est la variable dépendante et le temps est la variable indépendante …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.