Au début de ma carrière en tant que Data Scientist, une expérience en génie logiciel est-elle requise? [fermé]


20

Je suis un étudiant à la maîtrise à l'Université d'Édimbourg, spécialisé dans l'apprentissage automatique et le traitement du langage naturel. J'ai suivi des cours pratiques axés sur l'exploration de données et d'autres sur l'apprentissage automatique, les statistiques bayésiennes et les modèles graphiques. Mon expérience est un BSc en informatique.

J'ai fait du génie logiciel et j'ai appris les concepts de base, tels que les modèles de conception, mais je n'ai jamais été impliqué dans un grand projet de développement logiciel. Cependant, j'avais un projet d'exploration de données dans mon MSc. Ma question est la suivante: si je veux faire carrière en tant que Data Scientist, dois-je d'abord postuler à un poste de Data Scientist diplômé, ou devrais-je d'abord obtenir un poste d'Ingénieur logiciel diplômé, peut-être quelque chose lié à la science des données, comme le Big Data infrastructure ou développement de logiciels d'apprentissage automatique?

Ma préoccupation est que je pourrais avoir besoin de bonnes compétences en génie logiciel pour la science des données, et je ne sais pas si elles peuvent être obtenues en travaillant directement en tant que scientifique diplômé en données.

De plus, en ce moment j'aime le Data Mining, mais que faire si je veux changer ma carrière vers le génie logiciel à l'avenir? Cela pourrait être difficile si je me spécialisais autant en science des données.

Je n'ai pas encore d'emploi, donc mes connaissances sont encore limitées. Toute clarification ou conseil est le bienvenu, car je suis sur le point de terminer mon MSc et je veux commencer à postuler pour des postes de diplômés début octobre.


1
Cette question semble être hors sujet car elle concerne les conseils de carrière. Il a été prouvé que les conseils en matière de carrière débouchent sur des questions larges, orientées vers l’opinion ou parfois des questions extrêmement restreintes, dont la plupart n’aboutissent à aucun discours utile. Si vous n'êtes pas d'accord avec cette opinion, veuillez soulever la question de Data Science Meta .
asheeshr

1
Demandez à Quora pourrait vous aider.
zihaolucky

Réponses:


30

1) Je pense qu'il n'est pas nécessaire de se demander si votre parcours est adéquat pour une carrière en science des données. CS degré IMHO est plus que suffisant pour le scientifique des données du point de vue de l'ingénierie logicielle. Cela dit, les connaissances théoriques ne sont pas très utiles sans une expérience pratique correspondante , alors j'essaierais certainement d' enrichir mon expérience en participant à des projets scolaires supplémentaires, des stages ou des projets open source (peut-être ceux axés sur la science des données / l'apprentissage automatique / l'intelligence artificielle) ).

2) Je pense que votre préoccupation de vous concentrer trop tôt sur la science des données n'est pas fondée, tant que vous pratiquerez le génie logiciel soit dans le cadre de votre travail en science des données, soit en plus pendant votre temps libre.

3) Je trouve la définition suivante d'un data scientist assez précise et j'espère qu'elle vous sera utile pour votre future carrière:

Un data scientist est quelqu'un qui est meilleur en statistique que n'importe quel ingénieur logiciel et meilleur en génie logiciel que n'importe quel statisticien.

Le nombre énorme de ressources diverses sur les sujets de science des données d'aujourd'hui est époustouflant, mais ce programme open source pour l'apprentissage de la science des données pourrait combler certaines lacunes entre vos programmes respectifs BSc / MSc et la réalité de la carrière en science des données (ou, au moins, fournir une direction pour de plus amples recherches et peut-être répondre à certaines de vos préoccupations): http://datasciencemasters.org , ou sur GitHub: https://github.com/datasciencemasters/go .


2
+1 Vous avez besoin de beaucoup d'expérience en ingénierie pour être une science des données efficace, mais vous ne l'obtenez pas à l'école. Utilisez l'école pour la théorie et utilisez les emplois pour les compétences en ingénierie.
Sean Owen

3
J'ai aimé votre "Un scientifique des données est quelqu'un qui est meilleur en statistique que n'importe quel ingénieur logiciel et meilleur en génie logiciel que n'importe quel statisticien."
wabbit

Pourriez-vous répondre à cette question concernant l' Data Engineerorientation professionnelle?
stom

@stom Pour diverses raisons, je ne peux pas répondre à votre question, mais je suis heureux de partager avec vous les excellentes ressources pertinentes et IMO suivantes : 1) medium.com/@rchang/… ; 2) medium.com/@rchang/… ; 3) medium.com/@rchang/… ; 4) medium.com/@richard534/… . Comme vous le remarquerez peut-être, les trois premiers liens pointent vers une série d'articles. J'espère que cela t'aides.
Aleksandr Blekh

9

D'après les offres d'emploi que j'ai vues, la réponse dépend: il y a des emplois qui sont de nature plus technique (conception de projets de Big Data, analyse) ou exactement le contraire (l'analyse, le stockage, etc., c'est quelqu'un d'autre).

Je dirais donc que CERTAINES compétences en conception de logiciels sont extrêmement utiles, mais vous n'avez pas besoin de la capacité de construire un énorme programme en C # / Java ou autre. Pourquoi j'aime certaines compétences SW, c'est simplement que votre code est probablement bien meilleur que le code de quelqu'un qui n'a jamais programmé pour la programmation. La plupart du temps, ce dernier code est très difficile à comprendre / déboguer pour les étrangers. De plus, parfois votre analyse doit être intégrée dans un programme plus vaste, une compréhension des besoins des programmes aide certainement.


6

Absolument. Gardez vos compétences logicielles affûtées. Vous pouvez le faire dans un programme académique si vous implémentez simplement par vous-même tous les algorithmes que vous apprenez.

Bon choix de cours, btw. Pensez également à obtenir un stage.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.