Les interactions ne sont-elles utiles que dans le contexte de la régression?

11

J'ai toujours lu le terme interaction dans le contexte de la régression. Devrions-nous également considérer les interactions avec différents modèles, par exemple knn ou svm?

S'il y a , ou même plus de fonctionnalités et disons observations quelle est la manière habituelle de trouver des interactions utiles? Essayez toutes les combinaisons? Ou utiliser uniquement des combinaisons qui ont du sens? $50$ $100$ $1000$

machine-learning interaction terminology

— DerTom
source

Une réponse est que les interactions qui réduisent le VIF peuvent être utiles.

— Carl

(+1) Pour avoir posé une question utile.

— Carl

1

Les interactions sont explicitement nécessaires dans les modèles de régression car la formule ne comprend aucune interaction en soi. Plus précisément, un modèle de régression sera toujours linéaire en entrée, alors qu'une interaction est une combinaison non linéaire des caractéristiques. $X_i * X_j$

La façon la plus simple de voir cela est à travers le problème XOR, un modèle de régression sans aucune interaction ne peut pas résoudre ce problème, car il nécessite une combinaison non linéaire.

Les KNN et SVM, d'autre part (et de nombreux autres modèles également) sont des approximateurs de fonctions universelles. Cela signifie qu'ils peuvent non seulement combiner leurs entrées de manière linéaire, mais également de toute manière non linéaire possible. À condition de disposer de suffisamment de couches ou d'un noyau approprié, ils peuvent "créer" leurs propres interactions, exactement comme ils en ont besoin. Si vous savez ou prévoyez que des interactions spécifiques sont importantes, vous pouvez néanmoins les utiliser comme entrées pour guider les modèles dans la bonne direction.

De même, les modèles arborescents peuvent être interprétés comme consistant uniquement en interactions. Fondamentalement, une division dans un modèle arborescent crée une interaction spécifique avec toutes les variables précédentes.

Donc, pour décider des interactions à utiliser, pour des modèles suffisamment "puissants" (c'est-à-dire ceux qui sont des approximateurs de fonctions universelles), vous n'en avez pas besoin et vous pouvez laisser le modèle faire sa propre magie. Pour les autres modèles, cela dépend. Il existe certaines techniques disponibles pour guider la décision, comme CHAID ou la régression pas à pas. CHAID fonctionne également avec un grand nombre de fonctionnalités, pour une régression pas à pas, il peut se perdre dans le nombre d'interactions possibles. Étant donné que si vous avez entités, il y a interactions possibles (en comptant non seulement les interactions bidirectionnelles mais aussi d'ordre supérieur). $N$ $2^N$

— LiKao
source

1

Non.

$(x_1,x_2)$ $(x_1^2,x_2^2,x_1x_2)$

$10^{10}$

Ainsi, non seulement l'interaction a été largement utilisée dans d'autres modèles. En ajoutant à l'interaction, d'autres modèles tentent d'en faire plus avec l'ingénierie des fonctionnalités. Au lieu de multiplier deux colonnes, des fonctionnalités plus complexes sont dérivées.

— Haitao Du
source

0

Interactions qui améliorent le R au carré ajusté, le BIC pour la régression de vraisemblance (alternativement AICc et autres), la VIF et la statistique F de l'ANOVA, cette dernière sans paramètres individuels jugés non contributifs en utilisant leurs probabilités partielles.

Il est également très important, mais non demandé, que la reparamétrisation puisse considérablement améliorer à la fois l'effet des variables individuelles et leurs interactions. Cependant, le BIC, l'AIC et d'autres mesures de qualité de vraisemblance ne sont pas valables pour comparer différentes reparétérisations laissant le R au carré ajusté, le VIF et la statistique F de l'ANOVA à de telles fins.

— Carl
source