J'ai des données avec un nombre minimum de fonctionnalités qui ne changent pas, et quelques fonctionnalités supplémentaires qui peuvent changer et avoir un grand impact sur le résultat. Mon ensemble de données ressemble à ceci:
Les fonctionnalités sont A, B, C (toujours présentes) et D, E, F, G, H (parfois présentes)
A = 10, B = 10, C = 10 outcome = 10
A = 8, B = 7, C = 8 outcome = 8.5
A = 10, B = 5, C = 11, D = 15 outcome = 178
A = 10, B = 10, C = 10, E = 10, G = 18 outcome = 19
A = 10, B = 8, C = 9, E = 8, F = 4 outcome = 250
A = 10, B = 11, C = 13, E = 8, F = 4 outcome = 320
...
Je veux prédire la valeur du résultat, et la combinaison de paramètres supplémentaires est très importante pour déterminer le résultat. Dans cet exemple, la présence de E et F conduit à un gros résultat, contrairement à la présence de E et G. Quels algorithmes ou techniques d'apprentissage automatique sont bons pour capturer ce phénomène?