Questions marquées «outliers»

Une valeur aberrante est une observation qui semble inhabituelle ou mal décrite par rapport à une simple caractérisation d'un ensemble de données. Une possibilité déconcertante est que ces données proviennent d'une population différente de celle qui doit être étudiée.

5
Comment corriger les valeurs aberrantes une fois détectées pour la prévision des données de séries chronologiques?
J'essaie de trouver un moyen de corriger les valeurs aberrantes une fois que je les ai trouvées / détectées dans les données de séries chronologiques. Certaines méthodes, comme nnetar dans R, donnent des erreurs pour les séries temporelles avec des valeurs aberrantes grandes / grandes. J'ai déjà réussi à corriger …


1
Comment intégrer une valeur aberrante innovante à l'observation 48 dans mon modèle ARIMA?
Je travaille sur un ensemble de données. Après avoir utilisé certaines techniques d'identification de modèle, je suis sorti avec un modèle ARIMA (0,2,1). J'ai utilisé la detectIOfonction dans le package TSAen R pour détecter une valeur aberrante innovante (IO) à la 48e observation de mon ensemble de données d'origine. Comment …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 


2
Résiduel influent vs valeur aberrante
Tout d'abord, je dois dire que j'ai cherché sur ce site la réponse. Soit je n'ai pas trouvé de question qui répondait à ma question, soit mon niveau de connaissances est si bas que je ne savais pas que j'avais déjà lu la réponse. J'étudie pour l'examen statistique AP. Je …

4
Détection des valeurs aberrantes en ligne
Je souhaite traiter des images de microscopie à segmentation automatique pour détecter des images défectueuses et / ou des segmentations défectueuses, dans le cadre d'un pipeline d'imagerie à haut débit. Il existe une multitude de paramètres qui peuvent être calculés pour chaque image brute et segmentation, et qui deviennent «extrêmes» …
10 outliers  online 

1
Différence entre Outlier et Inlier
Je suis tombé sur le terme inlier dans la mesure LOF (Local Outlier Factor), je connais bien le terme de valeurs aberrantes (enfin essentiellement des menteurs - des instances qui ne se comportent pas comme les autres instances). Que signifie «Inliers» dans le contexte de la détection d'anomalies? et comment …

2
Comment interpréter et faire des prévisions en utilisant le package tsoutliers et auto.arima
J'ai des données mensuelles de 1993 à 2015 et j'aimerais faire des prévisions sur ces données. J'ai utilisé le package tsoutliers pour détecter les valeurs aberrantes, mais je ne sais pas comment continuer à prévoir avec mon ensemble de données. Voici mon code: product.outlier<-tso(product,types=c("AO","LS","TC")) plot(product.outlier) Ceci est ma sortie du …

2
Rétro-test ou validation croisée lorsque le processus de création de modèle était interactif
J'ai quelques modèles prédictifs dont je voudrais tester les performances (c.-à-d. Prendre mon jeu de données, le «rembobiner» à un point antérieur dans le temps et voir comment le modèle aurait fonctionné de manière prospective). Le problème est que certains de mes modèles ont été construits via un processus interactif. …

2
Moyenne ajustée vs médiane
J'ai un ensemble de données avec tous les appels passés à un service d'urgence et les temps de réponse du service d'ambulance. Ils ont admis qu'il y avait des erreurs avec les temps de réponse car il y a des cas où ils n'ont pas commencé à enregistrer (donc la …


6
Comment préparer / construire des fonctionnalités pour la détection d'anomalies (données de sécurité réseau)
Mon objectif est d'analyser les journaux du réseau (par exemple, Apache, syslog, audit de sécurité Active Directory, etc.) à l'aide de la détection de cluster / anomalie à des fins de détection d'intrusion. Dans les journaux, j'ai beaucoup de champs de texte comme l'adresse IP, le nom d'utilisateur, le nom …


1
Valeur de coupure de distance du cuisinier
J'ai lu sur la distance du cuisinier pour identifier les valeurs aberrantes qui ont une grande influence sur ma régression. Dans l'étude originale de Cook, il dit qu'un taux de coupure de 1 devrait être comparable pour identifier les influenceurs. Cependant, diverses autres études utilisent ou44n4n\frac{4}{n} comme seuil.4n - k …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.