J'ai lu d'autres sujets sur les diagrammes de dépendance partielle et la plupart d'entre eux concernent la façon dont vous les tracez réellement avec différents packages, pas comment vous pouvez les interpréter avec précision, donc:
J'ai lu et créé une bonne quantité de parcelles de dépendance partielle. Je sais qu'ils mesurent l'effet marginal d'une variable χs sur la fonction ƒS (χS) avec l'effet moyen de toutes les autres variables (χc) de mon modèle. Des valeurs y plus élevées signifient qu'elles ont une plus grande influence sur la prévision précise de ma classe. Cependant, je ne suis pas satisfait de cette interprétation qualitative.
Mon modèle (forêt aléatoire) prévoit deux classes discrètes. "Oui arbres" et "Pas d'arbres". TRI est une variable qui s'est avérée être une bonne variable pour cela.
Ce que j'ai commencé à penser, c'est que la valeur Y montre une probabilité de classification correcte. Exemple: y (0,2) montre que les valeurs TRI> ~ 30 ont 20% de chances d'identifier correctement une classification True Positive.
Où inversement
y (-0,2) montre que les valeurs TRI de <~ 15 ont 20% de chances d'identifier correctement une classification True Negative.
Les interprétations générales qui sont faites dans la littérature sonneraient comme ceci "Les valeurs supérieures à TRI 30 commencent à avoir une influence positive pour la classification dans votre modèle" et c'est tout. Cela semble si vague et inutile pour un complot qui peut potentiellement en dire autant sur vos données.
En outre, tous mes tracés plafonnent à -1 à 1 dans la plage pour l'axe y. J'ai vu d'autres graphiques de -10 à 10, etc. Est-ce une fonction du nombre de classes que vous essayez de prédire?
Je me demandais si quelqu'un pouvait parler de ce problème. Peut-être montrez-moi comment je dois interpréter ces intrigues ou de la littérature qui peut m'aider. Peut-être que je lis trop loin là-dedans?
J'ai lu très attentivement Les éléments de l'apprentissage statistique: exploration de données, inférence et prédiction et cela a été un excellent point de départ, mais c'est tout.