Je sais que c'est principalement un site de statistiques, donc si je suis hors sujet, veuillez me rediriger.
J'ai un système avec des pompes qui se cassent parfois et doivent être remplacées. Je voudrais pouvoir prédire les pannes et ainsi prévenir rapidement les personnes qui remplacent les pompes. J'ai des données historiques sur le processus de pompage, telles que le débit, la pression, la hauteur du liquide, etc.
Je n'ai qu'une petite expérience dans l'utilisation des techniques d'apprentissage automatique pour classer les données - en gros, j'ai suivi et fait les exercices du cours d'apprentissage automatique d'Andrew Ng sur coursera, ainsi que d'Andrew Conway Statistics One, - et je n'ai jamais utilisé l'apprentissage automatique pour classer les séries chronologiques. Je pense à des moyens de transformer mon problème afin de pouvoir utiliser mes connaissances existantes à ce sujet. Avec mes connaissances limitées, je n'obtiendrai pas une prédiction très optimale, mais j'espère en tirer des leçons, et pour ce problème, toute petite amélioration de la prédiction est utile, par rapport à l'attente de la survenue des défauts.
L'approche que je propose consiste à transformer la série chronologique en un problème de classification normal. L'entrée serait un résumé d'une fenêtre de séries chronologiques, avec la valeur moyenne, l'écart type, les valeurs maximales, etc. pour chaque type de données dans la fenêtre. Pour la sortie, je ne sais pas ce qui fonctionnerait le mieux. Une approche est que la sortie serait une classification binaire indiquant si la pompe est tombée en panne dans un certain laps de temps à partir de la fin de la fenêtre ou non. Un autre est que la sortie serait le temps restant avant que la pompe ne tombe en panne, donc pas une classification, mais une régression (au sens de l'apprentissage automatique) à la place.
Pensez-vous que cette approche est susceptible de donner des résultats? S'agit-il de "dépend du domaine et des données historiques". Y a-t-il de meilleures transformations (d'entrée et de sortie) que je n'ai pas envisagées, ou la prédiction de panne basée sur des données de série temporelle est-elle si différente de la prédiction de panne plus standard, que mon temps serait mieux utilisé pour lire sur l'apprentissage automatique avec des séries temporelles ?