Que pensez-vous des certifications Data Science?


35

J'ai maintenant vu deux programmes de certification en science des données, celui de John Hopkins disponible à Coursera et celui de Cloudera .

Je suis sûr qu'il y en a d'autres là-bas.

L'ensemble de classes de John Hopkins est axé sur R en tant qu'ensemble d'outils, mais couvre un éventail de sujets:

  • Programmation R
  • nettoyage et obtention de données
  • L'analyse des données
  • Recherche reproductible
  • Inférence statistique
  • Modèles de régression
  • Apprentissage machine
  • Développement de produits de données
  • Et ce qui semble être une tâche d'achèvement basée sur un projet similaire au Data Science Challenge de Cloudera

Le programme Cloudera a l’air mince en apparence, mais il cherche à répondre aux deux questions importantes suivantes: "Connaissez-vous les outils", "Pouvez-vous appliquer les outils dans le monde réel". Leur programme comprend:

  • Introduction à la science des données
  • Examen Data Science Essentials
  • Data Science Challenge (scénario d'un projet de science des données du monde réel)

Je ne cherche pas une recommandation sur un programme ou une comparaison de qualité.

Je suis curieux de connaître d’autres certifications, les sujets qu’elles abordent et le sérieux avec lequel les certifications DS sont considérées à ce stade par la communauté.

EDIT: Ce sont toutes d'excellentes réponses. Je choisis la bonne réponse par des votes.


4
C'est trop large et principalement basé sur l'opinion. Veuillez consulter datascience.stackexchange.com/help/dont-ask
asheeshr le

3
@ AsheeshR - Nous calculons en moyenne 2 questions par jour et 2 réponses par question. À ce stade, l’accent doit être mis sur la participation et l’intérêt croissant.
Steve Kallestad

10
L'engagement aux dépens de la qualité du site n'est pas la solution. L'engagement est transitoire. La qualité est beaucoup plus difficile à modifier plus tard.
Asheeshr

4
Vélos , lieu de travail , finances personnelles et argent , sceptiques , développement de jeux: tous lancés avec moins de 10 questions par jour. Vélos a été lancé avec 4 par jour, car il était considéré comme un site de haute qualité.
Asheeshr

3
Eh bien ... Je suppose que je dois vous déclarer le gagnant à ce stade. :)
Steve Kallestad

Réponses:


13

J'ai fait les 2 premiers cours et j'ai l'intention de faire tous les autres aussi. Si vous ne connaissez pas R, c'est un très bon programme. Il y a des devoirs et des quiz chaque semaine. Beaucoup de gens trouvent certains cours très difficiles. Si vous n'avez aucune expérience en programmation, vous allez avoir du mal à le faire (même si on vous dit que ce n'est pas nécessaire).

Rappelez-vous juste .. ce n'est pas parce que vous pouvez conduire une voiture que vous êtes un pilote de F1;)


32

En tant qu'ancien responsable de l'analyse et principal responsable des données, je suis très réticent sur le besoin de certificats en science des données. Le terme scientifique des données est assez vague et le domaine de la science des données en est à ses balbutiements. Un certificat implique une sorte de norme uniforme qui manque tout simplement à la science des données, mais qui reste très sauvage.

Même si un certificat ne vous fera probablement pas de mal, je pense que votre temps serait mieux utilisé pour développer l'expérience afin de savoir quand utiliser une certaine approche et une compréhension approfondie pour pouvoir expliquer cette approche à un public non technique.


2
Il est parfois difficile d’avoir de l’expérience si votre emploi actuel ne se concentre pas sur la science des données, mais sur un domaine connexe (dans mon cas, les statistiques). J'utilise les cours pour acquérir des connaissances et rester sur le sujet, ce que je ne peux pas faire dans mon travail de jour.
Christian Sauer

1
Je suis tout à fait d’accord, les cours sont très précieux pour vous donner un point de départ et une structure pour acquérir cette expérience. Pour tirer le meilleur parti du Mooc, je suggère de prendre un exemple très spécifique, disons une régression logistique, et de le travailler réellement avec un ensemble de données différent, double bonus si vous le faites dans une langue autre que celle dans laquelle le cours est enseigné. .
neone4373

C'est une bonne idée. Ce qui manque aux statistiques en général, c’est un site Web de formation. Par exemple, un ensemble de bases de données, avec les objectifs et les résultats possibles à la fin. Quelque chose comme khancademy, mais plus puissant;)
Christian Sauer

11

Les programmes de certification que vous avez mentionnés sont vraiment des cours de niveau débutant. Personnellement, je pense que ces certificats ne montrent que la persistance de la personne et qu’ils ne peuvent être utiles que pour ceux qui postulent à un stage, et non les vrais emplois dans le domaine de la science des données.


Je suis d'accord. Le matériel de cours est utile pour commencer, mais il s’agit surtout d’un niveau d’entrée.
Shagun Sodhani

10

Je dirige des équipes de science des données pour une grande société Internet et j'ai examiné des centaines de profils et interrogé des dizaines d'autres pour nos équipes du monde entier. De nombreux candidats ont réussi les cours et programmes susmentionnés ou possèdent des qualifications similaires. Personnellement, j'ai aussi suivi les cours, certains sont bons, d'autres sont décevants, mais aucun d'eux ne fait de vous un "data scientist".

En général, je suis d'accord avec les autres ici. Un certificat de Coursera ou de Cloudera indique simplement un intérêt mais il ne déplace pas l'aiguille. Il y a beaucoup plus à considérer et vous pouvez avoir un impact plus important en fournissant un référentiel complet de votre travail (profil github par exemple) et en mettant en réseau d'autres scientifiques de données. Quiconque embauche pour un profil Data Science préfèrera toujours voir vos travaux précédents et votre style / vos capacités de codage.


8

Plusieurs certifications sont en cours, mais elles ont un domaine d’intervention et un style d’enseignement différents.

Je préfère davantage The Analytics Edge sur eDX à la spécialisation John Hopkins, car il est plus intensif et pratique. L'attente de la spécialisation John Hopkins est de mettre 3 à 4 heures par semaine contre 11 à 12 heures par semaine sur Analytics Edge.

Du point de vue de l'industrie, je considère ces certifications comme un signe d'intérêt et non comme un niveau de connaissance. Il y a trop d'abandons dans ces MOOC. J'apprécie beaucoup plus mon expérience (comme participer à des compétitions Kaggle) que de subir la certification XYZ sur MOOC.


2
And what about stats.SE, datascience.SE profiles. Do you think they can say much about relevant level of knowledge?
IharS

What do dropouts have to do with it? Presumably, certification is contingent upon completing the course, not merely registering…
Gala

There are many people who mention that they are undergoing certification by doing a course on these MOOCs. You need to be careful with that.
Kunal

@Kunal It makes sense but your answer jumps from the “certification” to “dropouts” (who presumably don't have a certification). The key here is undergoing. It's a bit like being registered as a student or having a Kaggle account. None of this tells us whether you should value someone who did actually get a degree, complete a course or participate in a competition to the end.
Gala

6

Not sure about the cloud era one, but one of my friends joined the John Hopkins one and in his words it's "brilliant to get you started". It has also been recommended by a lot of people. I am planning to join it in few weeks. As far as seriousness is concerned, I don't think these certifications are gonna help you land a job, but they sure will help you learn.


4

@OP: Choosing answers by votes is the WORST idea.

Your question becomes a popularity contest. You should seek the right answer, I doubt you know what you are asking, know what you are looking for.

To answer your question:
Q: how seriously DS certifications are viewed at this point by the community.

A: What is your goal from taking these courses? For work, for school, for self-improvement, etc? Coursera classes are very applied, you will not learn much theory, they are intentionally reserved for classroom setting.

Nonetheless, Coursera classes are very useful. I'd say it is equivalent to one year of stat grad class, out of a two year Master program.

I am not sure of its industry recognition yet, because the problem of how did you actually take the course? How much time did you spend? It's a lot easier to get A's in these courses than a classroom paper-pencil exam. So, there is be a huge quality variation from person to person.


Part of the question is meant to gauge whether or not the community placed value on certification. In some areas, certification is an absolute necessity. In others, certification doesn't matter at all. In still others, certifications by a particular company are held in high regard and competitive certifications are not. The other part was meant to understand the difference in topical focus of the certifications that are out there. Data Science is a broad term. Certifications are normally more focused. This is a bad question for QA format - it's more of a discussion, subject to opinion.
Steve Kallestad

My purpose in noting that I chose the answer by votes was to make it plain that all of the answers deserved reading. Everybody makes good points, including you way down here at the bottom. Somebody who is wondering about these things shouldn't limit themselves to the top one or two answers.
Steve Kallestad

Voting to find the right answer is a horrible idea. It is the wrong way to approach math. You clearly missed my point.
user13985

2

Je pense que l’effet de la certification de coursera dépend de l’individu et des classes. L'exigence dit: minimum 3 à 5 heures par semaine, si vous en mettez plus, et que le matériel ouvre bien plus que 3 à 5 heures. Ces cours et certifications peuvent être équivalents à une solide base de connaissances et à une expérience dans le domaine. . La science s'adresse à ceux qui le demandent.


2

J'en ai presque fini avec la spécialisation en science des données de Johns Hopkins sur Coursera (un cours et une pierre angulaire pour obtenir mon diplôme). Je vais simplement vous en présenter les avantages et les inconvénients, en essayant de le garder aussi objectif que possible:

Avantages :

  • Structure autour du processus d'apprentissage
  • Vous construirez un portefeuille au fil du temps

Inconvénients :

  • Different backgrounds needed for different courses. The first few courses don't assume previous knowledge. It suddenly gets not easy to understand in the conceptual courses. (Statistical Inference, Regression Analysis)
  • Taught by 3 professors. I think they are not on the same page about their potential audience and their abilities/needs/interests.

2

The best way to be successful at getting the job that you want it to show that you can do it.

The MOOCs that you mention will give you a good grounding in the basics and should be enough to get you started solving your own machine learning/data science problems. Try a Kaggle competition or two, that is a great way to improve your skills, and a decent grade there will be of interest to a potential employer. Publish your results on Github using something like an iPython Notebook, which will allow your work to be easily seen and judged.

Try an analysis on other public data sets, like the UCI Bike Sharing Dataset, or the UCI Diabetes Treatment Dataset those are lots of fun to try, and show that you are keen and willing to develop your skills.


2

It really depends on the credibility of the institution granting the certificate. For example, Data Science Certification from a Harvard-based company is recognized by many industry partners and may make a good choice. You did not say what kind of certificate you are looking for?


1

Value to student, mixed bag. Paying several hundred dollars for a program or a hundred a pop for a course is a motivator.

I've completed one series, from MITx. It's a graduate survey course of methods and tools aimed at those who need to "know about" in some detail. It's enough grounding, that I've felt comfortable applying what I've learned.

A stand-alone HarvardX course on the directed acyclic graph method was more like a graduate seminar in statistics on the Judea Pearl method. It would have been a long time before I heard about it, otherwise.

The HarvardX series is a graduate level boot camp aimed at orienting the new student to the R toolset and applications.

The BerkeleyX series is an undergraduate survey course using a purpose built Python class that's almost a domain specific language.

As to the value of the certificates, I can only report that my only related educational experience was a master's in geophysics, and I had about a year of paid experience outside my job description (senior bank lawyer).

Perhaps as a result of the certificates, I've been turned down as "overqualified" for at least two jobs I know about. So, my advice is that if you have a certificate don't mention it if the word "Excel" appears in the job posting.


1

Some resources on edX for data science courses from Harvard, MIT, Microsoft and more that might be of interest to this group.

For example, we have a professional certificate program from Harvard consisting of 8 courses and a capstone exam here.

For more advanced studies, we have a MicroMasters program from MIT here.

as well as one from UC San Diego here. For a great overview of Data Science, we have a program from Microsoft. For all of our programs you can check out here.

Hope this helps,

Josh from edX

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.