Questions marquées «outliers»

Une valeur aberrante est une observation qui semble inhabituelle ou mal décrite par rapport à une simple caractérisation d'un ensemble de données. Une possibilité déconcertante est que ces données proviennent d'une population différente de celle qui doit être étudiée.

4
Détection des valeurs aberrantes à l'aide des écarts-types
Suite à ma question ici , je me demande s'il existe des opinions bien arrêtées pour ou contre l'utilisation de l'écart-type pour détecter les valeurs aberrantes (par exemple, tout point de données supérieur à 2 écarts-types est une valeur aberrante). Je sais que cela dépend du contexte de l'étude, par …
27 outliers 


4
Pourquoi RANSAC n'est-il pas le plus utilisé en statistique?
Issu du domaine de la vision par ordinateur, j'ai souvent utilisé la méthode RANSAC (Random Sample Consensus) pour ajuster les modèles aux données avec beaucoup de valeurs aberrantes. Cependant, je ne l'ai jamais vu utilisé par les statisticiens, et j'ai toujours eu l'impression qu'il n'était pas considéré comme une méthode …

3
Application des ondelettes aux algorithmes de détection d'anomalies basées sur des séries chronologiques
J'ai commencé à me frayer un chemin à travers les didacticiels d'exploration de données statistiques d'Andrew Moore (fortement recommandé pour toute autre personne qui s'aventure dans ce domaine). J'ai commencé par lire ce PDF extrêmement intéressant intitulé "Présentation introductive des algorithmes de détection d'anomalies basées sur des séries chronologiques" dans …





1
Détection des valeurs aberrantes dans les données de comptage
J'ai ce que je pensais naïvement être un problème assez simple qui implique la détection de valeurs aberrantes pour de nombreux ensembles différents de données de comptage. Plus précisément, je veux déterminer si une ou plusieurs valeurs dans une série de données de comptage sont supérieures ou inférieures aux attentes …

3
Comment évaluer l'asymétrie à partir d'un boxplot?
Comment décider de l'asymétrie en regardant un boxplot construit à partir de ces données: 340, 300, 520, 340, 320, 290, 260, 330 Un livre dit: "Si le quartile inférieur est plus éloigné de la médiane que le quartile supérieur, alors la distribution est faussée." Plusieurs autres sources ont dit à …

2
Bootstrapping - dois-je d'abord supprimer les valeurs aberrantes?
Nous avons effectué un test fractionné d'une nouvelle fonctionnalité de produit et voulons mesurer si l'augmentation des revenus est significative. Nos observations ne sont certainement pas distribuées normalement (la plupart de nos utilisateurs ne dépensent pas, et parmi ceux qui le font, ils sont fortement biaisés vers de nombreux petits …

2
Détection d'anomalies avec des fonctions factices (et d'autres fonctions discrètes / catégorielles)
tl; dr Quelle est la méthode recommandée pour traiter les discretedonnées lors de la détection d'anomalies? Quelle est la méthode recommandée pour traiter les categoricaldonnées lors de la détection d'anomalies? Cette réponse suggère d'utiliser des données discrètes pour filtrer simplement les résultats. Peut-être remplacer la valeur de la catégorie par …




En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.