Existe-t-il des différences dans les approches bayésienne et fréquentiste de l'EDA?


14

Très simplement: y a-t-il des différences dans les approches bayésienne et fréquentiste de l'analyse des données exploratoires?

Je ne connais aucun biais inhérent aux méthodes de l'EDA car un histogramme est un histogramme, un nuage de points est un nuage de points, etc., et je n'ai pas trouvé d'exemples de différences dans la façon dont l'EDA est enseigné ou présenté (en ignorant un article particulièrement théorique de A. Gelman) . Enfin, j'ai regardé CRAN, l'arbitre de toutes les choses appliquées: je n'ai pas trouvé de packages adaptés à une approche bayésienne. Cependant, je pensais que CV pourrait avoir quelques personnes qui pourraient éclairer cela.

Pourquoi devrait-il y avoir des différences?

Pour commencer:

  1. Lors de l'identification des distributions antérieures appropriées, ne devrait-on pas enquêter visuellement sur cela?
  2. Lorsqu'elle résume les données et suggère d'utiliser un modèle fréquentiste ou bayésien, l'EDA ne devrait-elle pas suggérer la direction à prendre?
  3. Les deux approches ont des différences très claires sur la façon de gérer les modèles de mélange. Identifier qu'un échantillon provient probablement d'un mélange de populations est difficile et directement lié à la méthodologie utilisée pour estimer les paramètres du mélange.
  4. Les deux approches intègrent des modèles stochastiques et la sélection du modèle est déterminée par la compréhension des données. Des données plus complexes ou des modèles plus complexes nécessitent plus de temps dans l'EDA. Avec de telles distinctions entre les modèles stochastiques ou les processus de génération, il y a des différences dans les activités d'EDA, ne devrait-il donc pas y avoir de distinctions résultant de différentes approches stochastiques?

Note 1: Je ne suis pas concerné par les philosophies de l'un ou l'autre "camp" - je veux seulement combler les lacunes dans ma boîte à outils et méthodes EDA.

Réponses:


17

Dans mon esprit, Bayes vs fréquentiste concerne l'inférence formelle, et l'analyse exploratoire des données ne l'est pas non plus.

Certes, en ce qui concerne l'évaluation du modèle / la qualité de l'ajustement et l'analyse de sensibilité, dans laquelle je classerais vos points (1), (3) et (4), il y aura des différences dans la façon de procéder, mais c'est parce que la nature des différences entre l'analyse et les méthodes de calcul plutôt que sur la philosophie.

En ce qui concerne votre (2), je ne vois généralement pas les résultats de l'EDA comme vous orientant vers l'approche bayésienne ou frquentiste, mais je pense plutôt que c'est l'objectif de l'étude qui importait le plus.

Pour moi personnellement, l'EDA (plus une introspection profonde) me dirigerait vers un modèle, et si je pouvais trouver une approche fréquentiste naturelle qui répondait assez bien à la question scientifique, j'irais avec cela, mais si par la nature de la situation , aucune méthode fréquentiste ne fonctionnerait bien, et s'il y avait un préalable raisonnable, j'utiliserais Bayes.


(1) Très bien dit - en particulier, « EDA (plus profonde introspection) me pointer vers un modèle »
suncoolsu

+1 également. L'EDA ne consiste pas vraiment à choisir une perspective, il s'agit de comprendre vos données pour prendre des décisions plus éclairées.
Fomite

+1 Pour une bonne réponse. Malheureusement, je pense que la question initiale a été mal comprise. Je ne demandais pas à utiliser EDA pour choisir entre des modèles bayésiens ou fréquentistes. Je vais devoir revoir la façon dont je l'ai libellé s'il semble que plusieurs personnes ont le même malentendu.
Iterator

@Iterator Je comprends que votre question principale soit: y a-t-il des différences entre les approches bayésiennes et fréquentistes de l'EDA? Ma réponse à cela est: non; EDA n'est ni fréquentiste ni bayésien.
Karl

3
Je pense que ma définition de «l'analyse exploratoire des données» est plus étroite que la vôtre. À mon avis, toute bonne analyse de données implique une exploration. Ce qui distingue "l'analyse exploratoire des données", c'est l'absence de modèle ou tout effort vers l'inférence formelle.
Karl

0

Je pense que EDA vous aide à construire un modèle, à faire quelques hypothèses et (si nécessaire) à mettre à jour le modèle et ses hypothèses. Je sélectionne une approche pragmatique à utiliser pour l'ajustement et l'évaluation des modèles.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.