Supposons que j'ai un échantillon à partir de la distribution conjointe de et . Comment tester l'hypothèse selon laquelle et sont indépendants ?Y X Y
Aucune hypothèse n'est faite sur les lois de distribution conjointe ou marginale de et (la normalité la moins commune, car dans ce cas, l'indépendance est identique à la corrélation étant ).Y 0
Aucune hypothèse n'est faite sur la nature d'une relation possible entre et ; il peut être non linéaire, donc les variables sont non corrélées ( ) mais fortement dépendantes ( ).Y r = 0 I = H
Je peux voir deux approches:
Répertorier les deux variables et utiliser le test exact ou le test G de Fisher .
- Pro: utiliser des tests statistiques bien établis
- Con: dépend de binning
Estimez la dépendance de et : ( pour indépendant et et quand ils se déterminent complètement).Y I ( X ; Y )XY1
- Pro: produit un nombre avec une signification théorique claire
- Con: dépend du calcul approximatif d'entropie (ie binning à nouveau)
Ces approches ont-elles un sens?
Quelles autres méthodes les gens utilisent?