Questions marquées «outliers»

Une valeur aberrante est une observation qui semble inhabituelle ou mal décrite par rapport à une simple caractérisation d'un ensemble de données. Une possibilité déconcertante est que ces données proviennent d'une population différente de celle qui doit être étudiée.


3
pourquoi la méthode de boosting est sensible aux valeurs aberrantes
J'ai trouvé de nombreux articles qui indiquent que les méthodes de boosting sont sensibles aux valeurs aberrantes, mais aucun article expliquant pourquoi. D'après mon expérience, les valeurs aberrantes sont mauvaises pour tout algorithme d'apprentissage automatique, mais pourquoi les méthodes de renforcement sont-elles particulièrement sensibles? Comment les algorithmes suivants se classeraient-ils …

4
Bonne forme pour éliminer les valeurs aberrantes?
Je travaille sur les statistiques des builds de logiciels. J'ai des données pour chaque build sur réussite / échec et le temps écoulé et nous générons ~ 200 de ces / semaine. Le taux de réussite est facile à agréger, je peux dire que 45% ont réussi une semaine donnée. …

3
STL sur séries chronologiques avec valeurs manquantes pour la détection d'anomalies
J'essaie de détecter des valeurs anormales dans une série chronologique de données climatiques avec quelques observations manquantes. En cherchant sur le Web, j'ai trouvé de nombreuses approches disponibles. Parmi ceux-ci, la décomposition stl semble attrayante, dans le sens de supprimer les composantes de tendance et saisonnières et d'étudier le reste. …

1
Différences entre PROC Mixed et lme / lmer en R - degrés de liberté
Remarque: cette question est une rediffusion, car ma question précédente a dû être supprimée pour des raisons juridiques. En comparant PROC MIXED de SAS avec la fonction lmedu nlmepackage dans R, je suis tombé sur des différences assez confuses. Plus précisément, les degrés de liberté dans les différents tests diffèrent …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 



1
Estimation robuste du kurtosis?
J'emploie l'estimateur habituel de , mais je remarque que mêmepetites valeurs aberrantes « » dans ma distribution empirique,savoirpetits pics loin du centre, affectent énormément. Existe-t-il un estimateur de kurtosis qui est plus robuste?K^=μ^4σ^4K^=μ^4σ^4\hat{K}=\frac{\hat{\mu}_4}{\hat{\sigma}^4}

2
Modèles mixtes linéaires généralisés: diagnostics
J'ai une régression logistique d'interception aléatoire (due à des mesures répétées) et je voudrais faire quelques diagnostics, en particulier concernant les valeurs aberrantes et les observations influentes. J'ai regardé les résidus pour voir s'il y a des observations qui ressortent. Mais je voudrais aussi regarder quelque chose comme la distance …



3
Trouver le point GPS moyen
J'ai besoin d'écrire un programme pour trouver le point GPS moyen à partir d'une population de points. En pratique, les événements suivants se produisent: Chaque mois, une personne enregistre un point GPS du même actif statique. En raison de la nature du GPS, ces points diffèrent légèrement chaque mois. Parfois, …
11 outliers  spatial 

2
Détection des valeurs aberrantes à l'aide de la régression
La régression peut-elle être utilisée pour une détection externe. Je comprends qu'il existe des moyens d'améliorer un modèle de régression en supprimant les valeurs aberrantes. Mais l'objectif principal ici n'est pas d'adapter un modèle de régression, mais de découvrir des mensonges en utilisant la régression



En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.