Auto-apprentissage vs éducation enseignée?


28

Il y a une question avec une intention similaire sur programmers.SE . Cette question a de très bonnes réponses, mais le thème général semble être que sans auto-étude, vous n'obtenez nulle part.

De toute évidence, il existe une différence majeure entre la programmation et les statistiques - avec la programmation, vous apprenez vraiment une logique de base, puis vous l'appliquez à plusieurs reprises. Les nouvelles langues utilisent toutes les mêmes concepts de base. L'autoformation vous permet d'apprendre des concepts plus avancés et de devenir plus efficace. Ce genre de choses est assez difficile à enseigner.

Les statistiques sont assez différentes. Il est facile d'appliquer la logique impliquée - parce que quelqu'un d'autre a généralement défini la méthodologie. En effet, la méthodologie est généralement la plupart de ce qui est enseigné dans les universités. Mais les statistiques sont bien plus profondes que cela et impliquent des concepts de très haut niveau. Il est même difficile de rechercher ces concepts, si tout ce que vous avez appris est des statistiques appliquées, et encore moins de les comprendre (bien que je me demande combien cela peut être dû au jargon sur le terrain). De plus, je trouve que l'autoformation en programmation implique la lecture de nombreux articles / blogs courts pour vous présenter de nouveaux concepts, tandis que les articles accessibles sur les statistiques sont presque toujours destinés au débutant total, et sont donc quelque peu inutiles pour un novice avancé, comme moi même.

La question est donc la suivante: l'autoformation est-elle plus ou moins appropriée qu'une formation universitaire pour les statistiques? Quelles sont les méthodologies d'autoformation qui fonctionnent? Tout exemple de ce qui a fonctionné pour les gens avant serait le bienvenu.

(cela devrait probablement être un wiki communautaire, mais je ne vois aucune case à cocher)



@cardinal: certainement. Vous répondez qu'il est excellent. Espérons que cette question se révélera complémentaire et non un double de cette question.
naught101

2
Je ne pense pas que ce soit un doublon. Je pense que toutes les réponses et bon nombre des commentaires fournissent des informations utiles. À votre santé. :)
Cardinal

Réponses:


14

Je pense que je suis dans un endroit assez similaire, mais je vais essayer. J'ai commencé en tant qu'étudiant diplômé en sociologie et, une fois que j'ai terminé tous les cours de statistiques disponibles dans mon département, j'ai erré dans certains cours de niveau diplômant du département de statistiques de mon université. Ce fut une révélation; la façon dont les professeurs de statistiques abordaient les problèmes était radicalement différente de mes professeurs de soc - beaucoup plus intuitive et inspirante que ce que j'avais appris auparavant, beaucoup moins formulée et dépendante de beaucoup de choses que je n'avais pas apprises ou n'avais pas eues '' t réussi à apprendre dans mes cours plus fondamentaux. J'ai dû me réapprendre beaucoup de choses juste pour suivre le rythme, et je crains toujours de ne pas avoir vraiment cloué ces concepts fondamentaux.

Au cours des quatre ou cinq dernières années, j'ai passé beaucoup de temps à lire largement - les blogs, ce site et certains manuels remarquables ont été très utiles. Mais cet auto-apprentissage a des limites, la plus grande n'étant pas que je n'ai pas assisté à certaines conférences à l'école, mais plutôt que cela fait quatre ou cinq ans que je travaille en étroite collaboration avec quelqu'un qui en sait plus que moi fait. Ce site est ma principale source pour abattre mes notions incorrectes. Cela me fait peur, au point que je prévois de postuler à des programmes de SP en biostats cet automne - pour suivre des cours intéressants, certainement, mais aussi parce que je veux juste que quelqu'un passe en revue mes idées et découvre ce que j'ai vraiment appris.

En revanche, j'ai moi-même enseigné le R pendant à peu près la même période et dans les mêmes conditions. Jusqu'à ce que j'aie aidé à fonder un groupe d'utilisateurs R il y a environ un an et demi, je n'avais pas vraiment de personne pour signaler des constructions manifestement stupides dans mon code. Mais je ne ressens pas la même inquiétude à propos de mon code, en grande partie parce que la programmation se résume finalement à la question de savoir si quelque chose fonctionne. Je ne veux pas diminuer les défis là-bas - je suis sur StackOverflow depuis assez longtemps pour savoir que, pour les vrais développeurs de logiciels, il existe une énorme expertise qui permet de créer quelque chose d'élégant, performant, maintenable, adaptable et facile -utiliser. Mais le logiciel est finalement jugé sur la façon dont il remplit sa fonction. Comme tu dis, Les statistiques ont presque le problème inverse - un logiciel de statistiques moderne facilite relativement le lancement de modèles complexes, mais dans de nombreux cas, nous n'avons pas de bons systèmes en place pour garantir que ces modèles en valent la peine. Il est difficile de recréer de nombreuses analyses publiées, et reproduire à partir de zéro des études précédemment publiées n'est pas aussi glamour que de faire de nouvelles découvertes (appliquez des citations effrayantes comme bon vous semble). Je sais presque toujours quand mes programmes sont inutiles, mais je ne suis jamais entièrement certain que mes modèles sont bons. t aussi glamour que de faire de nouvelles découvertes (appliquez des citations effrayantes comme bon vous semble). Je sais presque toujours quand mes programmes sont inutiles, mais je ne suis jamais entièrement certain que mes modèles sont bons. t aussi glamour que de faire de nouvelles découvertes (appliquez des citations effrayantes comme bon vous semble). Je sais presque toujours quand mes programmes sont inutiles, mais je ne suis jamais entièrement certain que mes modèles sont bons.

Donc ... comme en programmation, je pense que l'auto-apprentissage est essentiel. Mais je pense aussi qu'il est extrêmement important d'avoir un mentor ou un pair qui vous donnera des idées, vous exposera à de nouvelles idées et vous donnera des coups de pied si nécessaire. L'éducation formelle est un moyen de rencontrer des gens comme ça. Que ce soit efficace dépend plus de votre situation ...


@ naught101 Rétrospectivement, j'ai un peu l'impression de ressasser ce que vous avez dit. J'espère que ce n'est pas totalement le cas ...
Matt Parker

Un peu de remaniement, mais quelques points intéressants aussi :) Votre commentaire sur le mentorat me rappelle qu'une partie de l'année dernière, j'ai eu un mentor en programmation (non lié à la science, quelque chose comme un GSOC informel ). Ce fut un processus extrêmement utile et bénéfique non seulement pour moi, car il a fait avancer le développement d'un code de cadre Web open source largement utile. Malheureusement, j'ai du mal à voir comment un tel mentorat mutuellement bénéfique pourrait se produire dans les statistiques, même si mon projet actuel aidera à tester une méthodologie de combinaison de modèles relativement nouvelle.
naught101

13

+1 pour une grande question. Je pense qu'à long terme, vous devrez toujours vous fier à l'autoformation sous une forme ou une autre. Si vous vous sentez mal à l'aise avec les fondamentaux, les cours formels seront parfaits. Par exemple, si vous vous sentez solide sur les statistiques appliquées, mais que vous n'avez pas l'impression d'avoir une compréhension des mathématiques sous-jacentes, suivre des cours de statistiques mathématiques sera le chemin à parcourir. Même là-bas, cependant, les études supérieures viseront à apprendre à naviguer par vous-même sur le terrain.

Je veux saisir cette occasion pour chanter les louanges de CV. Je pense honnêtement que ce site va être la réponse à vos préoccupations. Il est vrai qu'il existe de nombreuses ressources qui ne sont pas destinées au niveau approprié (trop élevé ou trop bas) et qu'il est difficile de trouver ce dont vous avez besoin. Je suppose que les livres seront plus souvent au niveau qui vous convient le mieux; ils vont être plus complets, et pour n'importe quel sujet, il y en aura de presque sans mathématiques aux traités purement théoriques avec de nombreuses graduations entre les deux. Vous pouvez rechercher un CV souset si vous ne trouvez rien de correct, posez une nouvelle question. En général, si vous n'êtes pas sûr d'un concept spécifique, demandez-le. Même le simple fait de lire sur le site et de suivre les liens est incroyablement instructif - je suis étonné de tout ce que j'ai appris depuis que je suis actif sur le site.

En termes de stratégies spécifiques qui aident à l'auto-apprentissage, deux choses m'ont le plus aidé. Tout d'abord, avec les statistiques appliquées, c'est vraiment la même chose qu'avec la programmation, ou pour se rendre au Carnegie Hall, s'entraîner. Essayez de trouver des ensembles de données (du monde réel, si possible) et explorez-les; examinez les données, réfléchissez à ce qui pourrait se passer, ajustez certains modèles et vérifiez s'ils sont raisonnables, etc. Plus vous pourrez faire cela, mieux vous serez. Pour comprendre les concepts théoriques qui sous-tendent diverses techniques, la simulation est ce qui fonctionne pour moi. Quand je lis quelque chose et qu'il dit que cela fonctionne d'une manière particulière ou qu'il se décomposera sous certaines conditions, j'écris souvent un petit code pour créer ces conditions et générer des données à partir de ce processus, puis ajuster le modèle et stocker tout indicateur pertinent , imbriquez cela en boucle et jouez avec. C'est vraiment ainsi que j'ai fini par comprendre à peu près tout. Je peux lire quelque chose, et cela peut être parfaitement clair - je peux même me retourner et l'expliquer - mais je ne sais pas vraimentl'obtenir jusqu'à ce que je puisse le générer et le voir en action.


2

La base théorique des statistiques est trop profonde pour être en mesure de bien comprendre le sujet simplement en travaillant sur les problèmes qui se produisent sur votre bureau. Certaines des plus grosses chutes statistiques que j'ai vues proviennent de personnes ayant une formation en programmation ou en mathématiques qui pensaient allègrement que savoir coder ou calculer des probabilités était la même chose que connaître des statistiques.

Tout de même, il n'y a aucune raison pour qu'un programme d'auto-apprentissage bien pensé ne fasse pas l'affaire. Et c'est le cas, pour certaines personnes au moins: voir le diplôme d'études supérieures de la Royal Statistical Society . Il n'y a pas de pénurie de manuels à lire (et écrits par des gens comme Cox, Berger, Tukey, Nelder et Efron!), Un excellent logiciel gratuit (R) pour essayer les choses, et bien sûr Cross Validated pour résoudre les doutes.


1

Pour la programmation, je conviens que l'auto-apprentissage est la voie à suivre. J'ai enseigné le R pendant quelques mois en travaillant comme statisticien. J'ai ensuite suivi un cours Coursera en programmation R pour voir si je pouvais apprendre quelque chose de nouveau, et comme j'avais une solide formation, j'ai réussi et j'ai été invité à être assistant pédagogique sur le cours.

Quant aux statistiques d'auto-apprentissage, cela dépend, mais par prudence, je dirais non. La plupart des emplois pour un statisticien ont besoin d'au moins un MSc en statistiques juste pour mettre le pied dans la porte et pour une raison. Les statisticiens expérimentés ont généralement un doctorat.

Imaginez un médecin vous demandant de concevoir un programme de sélection pour un traitement particulier (quelque chose sur lequel j'ai travaillé). Vous prenez vos livres de statistiques pour un rafraîchissement et commencez à travailler. Vous faites des erreurs mathématiques ou vous ne reconnaissez pas certaines variables cachées et les mauvaises personnes sont sélectionnées. Coup! Les proches poursuivent pour négligence et / ou vous êtes en prison pour homicide involontaire.

Donc, avec la programmation, l'autoformation est la seule voie à suivre, mais ne dites jamais que vous connaissez les statistiques ou travaillez sur un projet statistique sans le mentorat d'un statisticien qualifié et expérimenté ou du moins demandez d'abord à quoi les résultats doivent être utilisés.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.