De quoi s'agit-il
Connaître les techniques équivaut à connaître les animaux d'un zoo - vous pouvez les nommer, décrire leurs propriétés, peut-être les identifier à l'état sauvage.
Comprendre quand les utiliser, formuler, construire, tester et déployer des modèles mathématiques fonctionnels dans un domaine d'application tout en évitant les pièges - ce sont les compétences qui distinguent, à mon avis.
L'accent devrait être mis sur la science , en appliquant une approche scientifique systématique aux problèmes commerciaux, industriels et commerciaux. Mais cela nécessite des compétences plus vastes que l’exploration de données et l’apprentissage automatique, comme le fait valoir Robin Bloor dans «A Data Science Rant» .
Alors, que peut-on faire?
Domaines d'application : découvrez les différents domaines d'application proches de votre intérêt ou de celui de votre employeur. La zone est souvent moins importante que de comprendre comment le modèle a été construit et comment il a été utilisé pour ajouter de la valeur à cette zone. Les modèles qui réussissent dans un domaine peuvent souvent être transplantés et appliqués à différents domaines qui fonctionnent de manière similaire.
Compétitions : essayez le site de compétition d’exploration de données Kaggle , rejoignant de préférence une équipe. (Kaggle: une plate-forme pour les concours de modélisation prédictive. Les entreprises, les gouvernements et les chercheurs présentent des ensembles de données et des problèmes, ainsi que les meilleurs scientifiques de données du monde se font concurrence pour produire les meilleures solutions.)
Principes fondamentaux : Il en existe quatre: (1) une solide base en statistiques, (2) des compétences en programmation assez bonnes, (3) une bonne structuration des requêtes de données complexes, (4) la création de modèles de données. Si certains sont faibles, alors c'est un point de départ important.
Quelques citations à ce sujet:
`` J'ai appris très tôt la différence entre connaître le nom de quelque chose et savoir quelque chose. Vous pouvez connaître le nom d'un oiseau dans toutes les langues du monde, mais lorsque vous aurez terminé, vous ne saurez absolument rien sur cet oiseau ... Alors, regardons cet oiseau et voyons ce qu'il fait. ce qui compte. '' - Richard Feynman, "L’établissement d’un scientifique", page 14 dans De quoi parlez-vous, que pensent les autres, 1988
Garder en tete:
`` La combinaison des compétences requises pour mener à bien ces projets de science des affaires réside rarement chez une seule personne. Quelqu'un aurait en effet pu acquérir une connaissance approfondie des trois domaines suivants: (i) ce que fait l'entreprise, (ii) comment utiliser les statistiques et (iii) comment gérer les données et les flux de données. Si tel est le cas, il pourrait en effet prétendre être un scientifique commercial (ou «scientifique des données») dans un secteur donné. Mais ces personnes sont presque aussi rares que les dents de poule. '' - Robin Bloor, A Data Science Rant , août 2013, Inside Analysis
Et enfin:
`` La carte n'est pas le territoire. '' - Alfred Korzybski, 1933, Science & Sanity.
La plupart des problèmes réels et appliqués ne sont pas accessibles uniquement à partir de `` la carte ''. Pour faire des choses pratiques avec la modélisation mathématique, il faut être prêt à s'empiffrer de détails, de subtilités et d'exceptions. Rien ne peut remplacer la connaissance du territoire.