Je travaille dans le domaine de l'exploration de données et j'ai eu très peu de formation formelle en statistique. Dernièrement, j'ai lu beaucoup de travaux qui se concentrent sur les paradigmes bayésiens pour l'apprentissage et l'exploitation minière, ce que je trouve très intéressant.
Ma question est (en plusieurs parties), étant donné un problème, existe-t-il un cadre général par lequel il est possible de construire un modèle statistique? Quelles sont les premières choses que vous faites lorsque vous disposez d'un ensemble de données dont vous souhaitez modéliser le processus sous-jacent? Existe-t-il de bons livres / tutoriels qui expliquent ce processus ou est-ce une question d'expérience? L'inférence est-elle au premier plan de votre esprit lors de la construction de votre modèle ou visez-vous d'abord à décrire les données avant de vous soucier de la façon de les utiliser pour calculer?
Toute idée serait grandement apprécié! Merci.