J'utilise la régression vectorielle de support pour modéliser certaines données assez asymétriques (avec un kurtosis élevé). J'ai essayé de modéliser les données directement, mais je reçois des prédictions erronées, je pense principalement en raison de la distribution des données, qui est faussée à droite avec des queues très grasses. Je suis à peu près sûr que quelques valeurs aberrantes (qui sont des points de données légitimes) affectent la formation SVR, et peut-être aussi dans la validation croisée, où en ce moment j'optimise les hyperparamètres en minimisant l'erreur quadratique moyenne.
J'ai essayé de mettre à l'échelle mes données avant d'appliquer SVR (par exemple en utilisant une fonction sqrt pour réduire les valeurs aberrantes) ainsi que d'utiliser une fonction de minimisation hyperparamétrique différente (par exemple, erreur absolue), qui semble donner de meilleurs résultats, mais toujours pas très bonne. Je suis curieux de savoir si quelqu'un a rencontré des problèmes similaires et comment ils l'ont abordé? Toutes suggestions et / ou méthodes alternatives sont les bienvenues.