Lorsque les données présentent un manque d'informations (lacunes), c'est-à-dire qu'elles ne sont pas complètes. Par conséquent, il est important de prendre en compte cette fonctionnalité lors d'une analyse ou d'un test.
J'ai lu les excellents commentaires sur la façon de traiter les valeurs manquantes avant d'appliquer SVD, mais j'aimerais savoir comment cela fonctionne avec un exemple simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Étant donné la matrice …
J'ai un ensemble de données x, y que j'utilise pour construire une forêt aléatoire. Les données x sont un vecteur de valeurs qui inclut certaines NA. J'utilise donc rfImputepour gérer les données manquantes et créer une forêt aléatoire. Maintenant, j'ai une nouvelle observation invisible x (avec un NA) et je …
J'espère mettre en commun les résultats d'un ensemble d'analyses assez basique effectué sur une multiplicité de données imputées (par exemple régression multiple, ANOVA). L'imputation multiple et les analyses ont été effectuées dans SPSS, mais SPSS ne fournit pas de résultats groupés pour quelques statistiques, y compris la valeur F, la …
Quelles sont les approches typiques de traitement des données incomplètes dans le filtre de Kalman? Je parle de la situation où certains éléments du vecteur observé sont manquants, distinct du cas où un vecteur observé entier est manquant. Une autre manière de penser serait que la dimension du vecteur observé …
Mon projet actuel peut m'obliger à construire un modèle pour prédire le comportement d'un certain groupe de personnes. l'ensemble de données de formation ne contient que 6 variables (id est uniquement à des fins d'identification): id, age, income, gender, job category, monthly spend dans laquelle se monthly spendtrouve la variable …
J'ai un problème où y=a+by=a+by = a + b J'observe y, mais ni ni . Je veux estimeraaabbb b=f(x)+ϵb=f(x)+ϵb = f(x) + \epsilon Je peux estimer , en utilisant une sorte de modèle de régression. Cela me donne . Je pourrais alors estimeraaab^b^\hat b b^=f(x)+ϵb^=f(x)+ϵ\hat b = f(x) + \epsilon …
J'ai deux questions sur l'utilisation de la forêt aléatoire (spécifiquement randomForest dans R) pour l'imputation des valeurs manquantes (dans l'espace des prédicteurs). 1) Comment fonctionne l'algorithme d'imputation - en particulier comment et pourquoi l'étiquette de classe est-elle requise pour l'imputation? la matrice de proximité qui sert à pondérer la valeur …
J'ai des problèmes à trouver une solution concernant la façon d'exécuter un test post-hoc (Tukey HSD) après une ANOVA à mesures répétées à 2 facteurs (tous deux intra-sujets) en R. Pour l'ANOVA, j'ai utilisé la fonction aov: summary(aov(dv ~ x1 * x2 + Error(subject/(x1*x2)), data=df1)) Après avoir lu les réponses …
Je calcule des probabilités conditionnelles et des intervalles de confiance à 95% associés. Pour bon nombre de mes cas, j'ai un décompte simple des xsuccès des nessais (à partir d'un tableau de contingence), donc je peux utiliser un intervalle de confiance binomial, tel que celui fourni par binom.confint(x, n, method='exact')dans …
J'utilise ARMA sur un ensemble de données avec des échantillons manquants. Comment les traiter? Souhaitez-vous suggérer de faire une interpolation linéaire / non linéaire ou simplement de les garder à l'écart et de considérer deux échantillons avec des données manquantes entre les deux comme échantillons consécutifs?
Y a-t-il une limite qui est la moins acceptable lors de l'utilisation de l'imputation multiple (MI)? Par exemple, puis-je utiliser MI si les valeurs manquantes dans une variable représentent 20% des cas alors que d'autres variables ont des valeurs manquantes mais pas à un niveau aussi élevé?
La méthode de substitution moyenne pour remplacer les données manquantes est-elle obsolète? Y a-t-il des modèles plus sophistiqués à utiliser? Si c'est vrai, que sont-ils?
J'utilise un modèle de décalage distribué pour analyser les données d'une série chronologique. La durée de la période d'étude est de 18 ans, et l'observation est des données annuelles. Lorsqu'on inclut un effet de décalage d'un an, la première année de la variable de décalage devient manquante. Ensuite, un effet …
J'essaie de corréler l'âge (6-90 ans) avec le volume de la voix (en dB). Cependant, mes données ne contiennent aucun point de données dans la plage de 20 à 50 ans. Quelle mesure de corrélation est la plus appropriée avec un écart aussi considérable, et pourquoi? J'utilise Kendall Tau jusqu'à …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.