Un de mes amis a suggéré que l'industrie du logiciel avait principalement besoin de compétences en «mégadonnées», et non de compétences statistiques en soi.
Tout en étant partiellement d'accord avec le commentaire de votre ami, je voudrais souligner que dans n'importe quelle industrie, les outils Big Data sont choisis, uniquement si tous les V sont satisfaits.
Je travaille en tant que responsable de la science des données dans une entreprise leader du support client. Ici, je fais du piratage de données à la fois pour le produit et pour la croissance de l'entreprise.
J'utilise principalement des techniques d'analyse de séries chronologiques pour la prédiction de désabonnement et l'analyse des ventes. Cela comprend également l'analyse comportementale des clients, de la concurrence et de l'industrie.
Côté produits, nous utilisons un éventail de techniques à partir de l'analyse des sentiments à l'aide de LSTM, d'algorithmes de recommandation, etc.
Mais l'objectif principal réside dans l'analyse des séries chronologiques. Le workflow général serait:
- Nettoyage et moulage des données.
- les analyses exploratoires et explicatives qui impliquent l'identification de la saisonnalité, des tendances et des cycles. Il faut donc explorer les corrélations, les auto-corrélations et plusieurs statistiques univariées et bivariées; avec un tracé étendu comprenant les courbes de dispersion, AFC, PAFC.
- Vient maintenant la partie prévision, où différents modèles sont testés les uns les autres, en prenant sérieusement en considération l'étape - 2.
Outils utilisés par moi: R, Python et Excel parfois.
Et même le mélange de science des données et de piratage de la croissance s'est avéré faire de la magie dans le domaine du marketing. Ainsi, la demande de statisticiens et de nerds mathématiques resterait telle quelle; et ne va décliner nulle part dans un avenir proche; en particulier lorsque des startups axées sur le client fleurissent à travers le monde.