Lorsque les données présentent un manque d'informations (lacunes), c'est-à-dire qu'elles ne sont pas complètes. Par conséquent, il est important de prendre en compte cette fonctionnalité lors d'une analyse ou d'un test.
J'ai un tableau de données T1, qui contient près d'un millier de variables (V1) et environ 200 millions de points de données. Les données sont rares et la plupart des entrées sont NA. Chaque point de données a un identifiant et une paire de dates uniques pour se distinguer les …
J'ai un ensemble de données sur les essais agricoles. Ma variable de réponse est un rapport de réponse: log (traitement / contrôle). Je m'intéresse à ce qui intervient dans la différence, donc je lance des méta-régressions RE (non pondérées, car il semble assez clair que la taille de l'effet n'est …
Contexte : régression hiérarchique avec quelques données manquantes. Question : Comment utiliser l'estimation du maximum de vraisemblance (FIML) pour traiter les données manquantes dans R? Y a-t-il un package que vous recommanderiez et quelles sont les étapes typiques? Des ressources et des exemples en ligne seraient également très utiles. PS …
Données de base : j'ai environ 1 000 personnes marquées par des évaluations: «1», [bon] «2», [moyen] ou «3» [mauvais] - ce sont les valeurs que j'essaie de prédire pour les personnes à l'avenir . En plus de cela, j'ai quelques informations démographiques: sexe (catégorique: H / F), âge (numérique: …
Un échantillon de population aléatoire a été sondé. On leur a demandé s'ils avaient un régime végétarien. S'ils ont répondu oui, on leur a également demandé de préciser depuis combien de temps ils suivaient un régime végétarien sans interruption. Je veux utiliser ces données pour calculer la durée moyenne d'adhésion …
J'ai un grand ensemble de données sur la pollution qui ont été enregistrées toutes les 10 minutes pendant 2 ans, mais il y a un certain nombre de lacunes dans les données (y compris certaines qui durent quelques semaines à la fois). Les données semblent être assez saisonnières et il …
Je suis impressionné par le forecastpackage R , ainsi que par exemple le zoopackage pour les séries temporelles irrégulières et l'interpolation des valeurs manquantes. Mon application est dans le domaine des prévisions de trafic du centre d'appels, donc les données le week-end sont (presque) toujours manquantes, ce qui peut être …
J'expérimente l'algorithme de la machine de renforcement de gradient via le caretpackage en R. À l'aide d'un petit ensemble de données d'admission à l'université, j'ai exécuté le code suivant: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- …
Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test non paramétrique comme Mann-Whitney-U-testcela entraînerait la perte …
Je sais que cela pourrait être un peu compliqué, statistiquement, mais c'est mon problème. J'ai beaucoup de données de plage, c'est-à-dire la taille minimum, maximum et échantillon d'une variable. Pour certaines de ces données, j'ai également une moyenne, mais pas beaucoup. Je veux comparer ces gammes entre elles pour quantifier …
Il ne semble pas y avoir de méthode standard pour traiter les données manquantes dans le contexte de la famille de modèles de lissage exponentiel. En particulier, l'implémentation R appelée ets dans le package de prévision semble ne prendre que la sous-séquence la plus longue sans données manquantes, et le …
Quelles sont certaines approches pour classer les données avec un nombre variable de fonctionnalités? Par exemple, considérons un problème où chaque point de données est un vecteur de points x et y, et nous n'avons pas le même nombre de points pour chaque instance. Pouvons-nous traiter chaque paire de points …
J'ai eu ces deux expliqués plusieurs fois. Ils continuent de cuisiner mon cerveau. Missing Not at Random a du sens, et Missing Complet at Random a du sens ... c'est le Missing at Random qui n'en a pas autant. Qu'est-ce qui donne naissance à des données qui seraient MAR mais …
Je voudrais utiliser l'imputation pour remplacer les valeurs manquantes dans mon ensemble de données sous certaines contraintes. Par exemple, j'aimerais que la variable imputée x1soit supérieure ou égale à la somme de mes deux autres variables, disons x2et x3. Je veux aussi x3être imputé par ou 0ou >= 14et je …
Je lis Multivariable Model Building: A Pragmatic Approach to Regression Analysis Based on Fractional Polynomials for Modeling Continuous Variables par Patrick Royston et Willie Sauerbrei. Jusqu'à présent, je suis impressionné et c'est une approche intéressante que je n'avais pas envisagée auparavant. Mais les auteurs ne traitent pas des données manquantes. …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.