Travaillant en tant que Data Scientist dans l'un des plus grands cabinets de conseil du monde, je peux simplement donner mes deux cents, dont l'un est utile pour un travail comme le mien. Tous les cours sont sympas et ont des applications à la fois dans la recherche, le développement et le conseil. Cependant, certains cours peuvent être plus importants pour une application pratique. Avis de non-responsabilité: cela ne reflète pas l'opinion de mon employeur et je n'ai également vu que plusieurs départements en Allemagne.
LES COURS LES PLUS UTILES:
- Introduction aux séries chronologiques
Si vous travaillez en tant que Data Scientist, vous ferez certainement des prévisions de temps en temps. Il est important que vous compreniez des modèles tels que les tendances, les racines unitaires, les saisonnalités, etc.
En pratique, vous serez confronté à des données de fréquences différentes telles que des données mensuelles ou trimestrielles.
Lire le principe et la pratique de la prévision afin de comprendre les applications de la prévision.
- Prédiction statistique moderne et apprentissage automatique
Ce cours augmentera vos chances d'obtenir un emploi bien rémunéré. L'apprentissage automatique est en corrélation avec des salaires plus élevés que les statistiques classiques. Il vaut vraiment la peine de connaître des choses telles que la formation et les données de test. Vous construirez toujours un modèle et le testerez.
C'est également en raison de l'importance du Machine Learning que cette page s'appelle CrossValidated. hahahaha
AUSSI UTILE:
- Modélisation linéaire: théorie et applications
- Introduction à l'analyse économétrique (inscription croisée entre statistiques et économie)
Ces cours me semblent assez similaires. Je suppose que les deux concernent principalement les données longitudinales et les données de panneau. Cependant, la plupart des problèmes de régression auxquels vous serez confronté en tant que Data Scientist traitent des séries chronologiques. Je viens d'avoir un projet avec la régression de sélection Heckman modell / Tobit et quelques petits trucs où j'ai été confronté à Count Data et Survival Analysis. Les tâches de classification globale sont plus répandues dans mon entreprise que les tâches de régression.
Vous êtes le plus susceptible de travailler en équipe avec des mathématiciens, des statisticiens et des informaticiens. Ils ne colleront pas aux modèles économétriques. Néanmoins, une solide compréhension des modèles linéaires et de l'analyse économétrique vous aidera à gérer les séries chronologiques et les problèmes de prévision.
Cela dépend également du langage de programmation que vous préférez. R (et plus particulièrement Stata) sont très pratiques pour les modèles de régression. Python est plutôt utile pour d'autres tâches.
Comme Michael Chernick l'a déjà déclaré, les problèmes microéconométriques sont largement utilisés dans les assurances. Si vous travaillez pour un service d'assurance-vie, l'analyse de la survie sera cruciale. Cependant, la plupart des data scientist ne sont pas confrontés à de telles tâches.
Vous pouvez suivre ce cours de fondation économétrique appliquée de l'UCLA et réfléchir à la mesure dans laquelle vous serez confronté à ces questions dans votre futur emploi.
PLUTÔT IRRELEVANT:
- Processus stochastiques (promenades aléatoires, chaînes de Markov à temps discret, processus de Poisson)
Cela ne sera guère utile en tant que Data Scientist. Vous pouvez peut-être faire face à de tels modèles si vous travaillez dans un département de finance quantitative d'une banque.
La théorie des jeux est un concept théorique qui est à peine directement appliqué dans la pratique. Dans la recherche économique et psychologique, cela peut être utile, mais ce n'est pas dans la portée classique d'un data scientist.
N'hésitez pas à me demander si je devrais être plus précis sur certains cours.