Le problème se réfère à la construction d'arbres de décision. Selon Wikipedia, le « coefficient de Gini » ne doit pas être confondu avec «l' impureté de Gini ». Cependant, les deux mesures peuvent être utilisées lors de la construction d'un arbre de décision - elles peuvent soutenir nos choix lors de la division de l'ensemble des éléments.
1) «impureté de Gini» - il s'agit d'une métrique de fractionnement d'arbre de décision standard (voir dans le lien ci-dessus);
2) «coefficient de Gini» - chaque fractionnement peut être évalué sur la base du critère AUC. Pour chaque scénario de fractionnement, nous pouvons construire une courbe ROC et calculer la métrique AUC. Selon Wikipedia AUC = (GiniCoeff + 1) / 2;
La question est: ces deux mesures sont-elles équivalentes? D'une part, je suis informé que le coefficient de Gini ne doit pas être confondu avec l'impureté de Gini. D'un autre côté, ces deux mesures peuvent être utilisées pour faire la même chose - évaluer la qualité d'une division d'arbre de décision.