Quel logiciel statistique convient pour l'enseignement d'un cours d'introduction à la statistique en sciences sociales?


11

Je recherche un progiciel statistique que je peux utiliser dans un cours d'introduction aux statistiques pour un programme d'études en sciences sociales. Les étudiants n'ont aucune connaissance préalable des statistiques et aucune expérience avec les langages de programmation non plus. L'objectif est de leur présenter des concepts statistiques de base (comme les moyennes, la variance, la somme des carrés, les valeurs de p, ... et enfin la régression linéaire) et de leur permettre de mener des analyses de base par eux-mêmes à l'aide d'exemples de jeux de données. Le cours devrait porter sur l'apprentissage de concepts en faisant des statistiques plutôt qu'en mémorisant des formules (même si je pense que les formules sont importantes).

Par conséquent, je recherche une alternative à la syntaxe habituelle (comme R normal) ou au logiciel piloté par pointer-cliquer (comme SPSS ou Rcmdr). Le logiciel doit être facile à apprendre et il doit avoir une interface utilisateur graphique claire qui visualise les ensembles de données et propose les graphiques et les tableaux standard. Le mieux serait de visualiser toutes les différentes étapes d'une analyse (par exemple, lire et manipuler des données, calculer des mesures descriptives, créer des tableaux et graphiques descriptifs, calculer des mesures inférentielles, tracer des graphiques inférentiels, exporter vers un rapport).

Avez-vous des suggestions de logiciels statistiques (open-source ou gratuits) adaptés à l'apprentissage et à la première pratique des statistiques?

EDIT
Merci pour vos suggestions. Je l' ai regardé dans Gretl , et deux autres programms j'ai trouvé au cours de ma propre enquête en ligne: RapidMiner et statistique Lab . [1]
J'ai trouvé que gretlest plus claire et ciblée de l' interface et la sortie de » que , par exemple Rcmdr, SPSS ou Stata. Par conséquent, c'est un outil bien qualifié pour commencer à enseigner les statistiques de mon point de vue.
Cependant, l'interface graphique de l'organigramme de RapidMineretStatistical Labm'a impressionné en visualisant les étapes uniques d'une analyse statistique (en commençant par le chargement des données). Je pense que cela pourrait être utile à de nombreux élèves qui ont du mal à se concentrer sur les explications mathématiques. Bien sûr, RapidMiner me semble trop surchargé de fonctions, de menus et de boutons pour les débutants alors que le Statistical Lab est beaucoup plus concentré. Le gros plus du Statistical Lab est le "R-Calculator" de type console avec un "R-code Wizard" qui aide à produire une vraie syntaxe R sur laquelle le Statistical Lab s'appuie Rpour ses calculs.
Enfin, j'ai décidé de commencer par le laboratoire de statistique au premier semestre tout en introduisant les concepts de base et de passer à RStudio (et Rcmdr) au deuxième semestre.

[1]: Gnumeric, SciPy, Scilab, GNU Octave et similaires me semblent moins orientés vers les sciences sociales.


8
@Matthias: Je pense que si vos étudiants viennent / visent depuis / pour un domaine des sciences sociales, leur enseigner R comme un premier pas en statistique est une exagération. La plupart d'entre eux auront des problèmes avec le concept de console, de commandes, de syntaxe, etc. et vous passerez plus de temps à parcourir les "concepts de programmation" (qu'est-ce que "fonction", "boucle", etc.) que les "statistiques". Je base cela sur une expérience antérieure, quand j'ai fait des tutoriels pour un Stats 101 dans un département Soc.Science; les gens ont manqué le but des conférences parce qu'ils se sont concentrés davantage à faire travailler R pour eux qu'à explorer réellement leurs données.
usεr11852

1
@ user11852: Vous avez peut-être raison, mais il est triste que les lycées envoient des étudiants sans aucune programmation. Ou les universités qui permettent cet écart. Aucun étudiant ne devrait venir dans une classe universitaire qui ne sait pas ce qu'est une boucle ou une fonction. Retarder l'exposition ne fait que pousser le problème ailleurs.
curious_cat

2
@ user11852: L'autre option moins acceptable pourrait être que les départements de Satistique insistent pour que les cours "Stats 101 for Social Sciences" aient une condition préalable à une certaine expérience en programmation ou un cours de rattrapage en programmation. De nos jours, lorsque presque tous les sujets sont si fortement biaisés en calcul, il n'y a vraiment aucune raison pour que la programmation 101 ne soit pas la toute première classe que tout le monde suit.
curious_cat

6
Pour ce que ça vaut, j'ai utilisé R avec succès dans mon cours d'introduction aux statistiques pour la science politique. J'ai utilisé RStudio . J'avais aussi des «laboratoires» hebdomadaires où je permettais aux étudiants de travailler ensemble sur de petites tâches, pendant que je faisais le tour et répondais aux questions. Avec un exemple de code bien commenté, les élèves se sont bien comportés et se sont plaints à peine. En fait, ils se plaignaient beaucoup moins de R que lors du semestre précédent lorsque j'ai utilisé Stata. Parce que Stata n'est pas libre, les étudiants devaient venir pendant des heures de laboratoire pour faire leur travail - ils détestaient ça.
Jason Morgan

6
Je pense que R en conjonction avec RStudio peut être une excellente approche. Il ouvre également la voie à des pratiques de recherche reproductibles, contrairement aux systèmes de menus. Je recommanderais de distribuer plusieurs modèles de code que les étudiants peuvent charger dans RStudio à partir du Web (RStudio rend cela facile) et laisser les étudiants faire le travail de changer les noms de variables et les modèles statistiques en fonction de ce qui est nécessaire pour le problème actuel.
Frank Harrell

Réponses:


12

Peut-être Gretl? http://gretl.sourceforge.net/

Il est gratuit et utilisé dans notre université pour les statistiques de premier cycle.


9
+1. Excellente suggestion. J'ai toujours trouvé l'interface graphique de Gretl intuitive et au point et les commentaires qu'elle fournit sont précis et sans trop de fioritures, ce qui rebuterait certains étudiants moins "technophiles". De plus, il est gratuit, bien documenté et possède une console R si quelqu'un est enclin à voir quelque chose d'un peu "plus profond".
usεr11852

8

J'éviterais la plupart des trucs "célèbres", MatLab , Maple , Mathematica , JMP , SAS ou Minitab , parce que lorsque vos étudiants obtiennent leur diplôme, ils doivent payer des milliers de dollars par an pour l'utiliser professionnellement. Chaque entreprise a généralement son outil préféré, et si vous lui apprenez un outil que son entreprise ne paiera pas, ses compétences seront gaspillées. Je n'aime pas non plus les bibliothèques propriétaires - elles entraînent les utilisateurs à appuyer sur des boutons et si l'utilisateur veut aller ailleurs (JMP ou autre), il n'y a pas de report d'apprentissage.

Python incluant SciPy / NumPy est plutôt bon. Il est open source et bien pris en charge. Il a une grammaire facile à apprendre. Il est toujours interprété de sorte qu'il ne crie pas rapidement, mais s'ils ne connaissent aucun script ou tableur, c'est beaucoup plus rapide qu'ils n'en auraient besoin. PythonXY est une bonne version, a de bonnes bibliothèques et un bon support. J'aime aussi que la programmation GUI soit possible grâce à elle. La création d'applications autonomes dans Windows est un peu difficile mais probablement supérieure au niveau de vos élèves. (modifier) Sage et Cythonaméliorer considérablement la proposition de valeur de Python. L'interface et la convivialité sont considérablement améliorées. Un code compilé 1000 fois plus rapide qu'un très bon code interprété me semble génial (ou étonnant). EDIT: J'ai eu du plaisir à utiliser les distributions Anaconda (aka conda), et elles sont également très simples à utiliser.

Je ne suis pas un grand fan de Perl . C'est un peu dépassé. Il s'agit d'analyser et de traiter du texte plus que des mathématiques / sciences. Ne vous méprenez pas, il peut faire des mathématiques / sciences, mais si vous connaissez VBA, alors MSWord peut faire des mathématiques / sciences. Être capable de ne pas être le même a un emploi particulier comme objectif principal.

J'aime R , même si vous ne le faites pas, car il est agressivement développé par des docteurs qualifiés en mathématiques / statistiques. Cela signifie que même si la grammaire peut être klugy, elle aura des bibliothèques à jour et sans erreur. (En général)

Excel n'est pas un mauvais début. Une fois que vous connaissez une feuille de calcul, il est plus facile d'en utiliser une autre. Dans un environnement professionnel, presque toutes les entreprises ont un bureau MicroSloth , donc Excel n'est pas une mauvaise idée. Je n'aime pas leur script, mais c'est juste une préférence, je peux toujours l'utiliser. Il coûte environ 150 dollars américains contre 5000 dollars américains pour certains des autres logiciels, donc son coût d'entrée pour les gens normaux est plus raisonnable.

Le langage de script JMP est étranger. Il ne se traduit pas sur d'autres logiciels (non SAS). Restez à l'écart. La seule caractéristique utilisable de la langue est qu'elle peut (dans un sens limité) exécuter le code "R". Si vous codez en "R", utilisez simplement "R" et "RStudio".

Je n'ai pas utilisé MathCAD donc je ne peux pas parler de sa pertinence. Je pense que c'est plus symbolique, moins sur l'importation de données externes. Jusqu'à présent, c'est moins cher. Ce n'est pas gratuit et ouvert. Facilité à elle ne se traduit pas par facilité dans une autre langue. ( EDIT ) EES , également dans cette catégorie , ne me impressionne pas non plus en dehors d'une fenêtre d'utilisation très étroite.

EDIT : J'ai été un peu impressionné par LabVIEW . Il est assez simple à utiliser que quelques heures peuvent rendre quelqu'un capable. Il fonctionne très rapidement, comme littéralement 1000 fois plus vite que MatLab pour littéralement exactement le même code ( MathScript ). Si vous avez du poids, cela vaut la peine d'être considéré. Cela coûte de l'argent, mais quelque chose dans le voisinage de 1/5 du gros fer conventionnel.

Bonne chance

EDIT: Je n'utiliserais pas LAboratory statistique parce que même lorsque vous sélectionnez "anglais" pour la langue, il sort en allemand, et il ne se désinstalle pas sur Windows 7. Les deux faiblesses administratives en font un no-go pour moi. Je ne peux pas le faire fonctionner et quand j'ai essayé de le retirer, cela a échoué.

Par essais et erreurs, j'ai découvert le réglage du menu pour qu'il s'affiche en anglais. Il semble que ce soit une interface relativement simple (et donc utile et cohérente) dans certaines bibliothèques R pour le traitement et l'affichage des données. Je vais devoir approfondir les choses, donc à ce stade «le jury est toujours absent».

MODIFIER davantage:

-> Voici <- est un lien amusant vers une toute autre discussion sur les outils et les établis.


2
Il y a aussi RPy rpy.sourceforge.net , R comme bibliothèque pour Python, donc vous obtenez les aspects à jour et sans erreur prouvée de R avec la simplicité syntaxique de Python.
Ghillie Dhu

1
"ils entraînent les utilisateurs à appuyer sur des boutons et si l'utilisateur veut aller ailleurs (JMP ou autre), il n'y a pas de report de l'apprentissage." SAS, un programme propriétaire, ne s'entraîne pas particulièrement bien pour «appuyer sur des boutons», et avoir du mal à passer d'une langue à l'autre n'est guère une caractéristique des logiciels propriétaires seuls. Heck, j'étais plus à la maison pour passer de SysStat à JMP que pour Python à R.
Fomite

@Epigrad - Je le regarde tourner le cerveau des ingénieurs tout le temps. Des dizaines et des dizaines de gens. Je suis heureux que vous l'ayez trouvé utile, mais je m'attends fermement à ce que vous soyez une valeur aberrante et la tendance générale du préjudice n'est pas substantiellement modifiée par votre expérience.
EngrStudent

@EngrStudent: Merci pour vos efforts pour essayer le laboratoire de statistique! Le réglage du menu pour la langue anglaise est en effet non intuitif, mais après l'avoir réglé une fois, je n'ai pas rencontré plus de problème avec la langue. Malheureusement, je ne peux pas faire fonctionner "l'assistant R-Graph", bien que le R-Graph normal fonctionne très bien si je mets du code R. Par conséquent, je donnerai à mes élèves des exemples d'extraits de code pour produire des graphiques de base. Peut-être que je passe plus tôt à RStudio ...
non-numeric_argument

1

Vous pouvez essayer d'utiliser Gnumeric, une feuille de calcul très appréciée, il existe également une feuille de calcul Open Office. À condition d'expliquer les pièges de l'utilisation de feuilles de calcul, en particulier Excel, après l'université dans leur vie pratique ultérieure, ils peuvent ne pas avoir le luxe de quelque chose comme SPSS, mais pourraient toujours obtenir un service utile de ces produits gratuits qui ne sont pas trop exigeants en mathématiques et en compétences en programmation . De nombreux environnements de bureau contiennent Excel par défaut.

Jettes un coup d'oeil à:

http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Statistiques et Excel 2007

et recherchez des références similaires telles que

http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=en#d85edd4978e53568 Keeling, Kellie B. & Pavur, Robert J. (2007). Une étude comparative de la fiabilité de neuf progiciels statistiques. Statistiques computationnelles et analyse des données, 51, 3811–3831.


1

J'ai été CalEst . La licence est bon marché, comme 10 buck et fournit à la fois des calculs / graphiques ainsi que de superbes activités de simulation pour les étudiants. De plus, dans leur site Web, ils ont quelques outils, principalement sur les distributions que vous trouverez utiles.


Cette réponse est un peu courte. Pourriez-vous en savoir plus sur les raisons pour lesquelles vous proposerez ce logiciel et quels avantages il a par rapport à la concurrence?
kjetil b halvorsen

1

Nous avons commencé à utiliser Rguroo. Ce logiciel vient d'être publié. Il est basé sur R, mais aucune connaissance du codage R n'est requise. Il s'agit également d'une application Web, il vous suffit de vous connecter sur un navigateur. Mes élèves peuvent sauvegarder leur travail à tout moment et revenir en arrière pour terminer leur travail. L'interface utilisateur graphique est très intuitive et les sorties sont superbes.


0

Nous utilisons la version bêta de Rguroo dans nos cours d'introduction à la statistique à la California State University, Fullerton depuis trois ans. Ils ont maintenant (août 2019) publié une version officielle, voir https://Rguroo.com. Il s'agit d'un logiciel de statistiques d'application Web qui fonctionne dans n'importe quel navigateur. Ce logiciel est conçu pour l'enseignement et offre une démonstration et une formation individuelles pour les professeurs; envoyez un e-mail ou appelez-les pour organiser une démonstration. Le logiciel exécute R en arrière-plan, mais vous n'avez pas besoin de connaître R, il suffit de pointer et de cliquer. Il possède de nombreuses fonctionnalités intéressantes, notamment des sorties détaillées, d'excellents outils graphiques, un calculateur de probabilité et des outils de simulation. J'aime particulièrement les fonctionnalités de reproductibilité où vous pouvez enregistrer votre travail à tout moment et revenir et continuer là où vous vous étiez arrêté. Vous pouvez également partager votre travail avec les étudiants via ce qu'ils appellent les fichiers RGR. En bout de ligne ... c'est un grand et nous continuons à l'utiliser.


0

J'utilise personnellement le logiciel DataMelt pour l'enseignement des statistiques. C'est très bien documenté, il a des tutoriels, des livres et beaucoup d'exemples à regarder. Ce qui est également important, c'est que l'on peut rechercher n'importe quel exemple, et vous pouvez obtenir une réponse raisonnable (dans Javadoc et des extraits de code). Les étudiants peuvent apprendre non seulement Python (qui est le langage de programmation par défaut), mais aussi comment coder des méthodes statistiques en Java. À mon avis, c'est une force importante: les étudiants n'ont pas besoin d'apprendre un langage "statistique" très spécialisé, comme le R-stat. Ils peuvent également apprendre Java en même temps, ce qui peut ouvrir de nombreuses opportunités s'ils décident de se lancer dans l'industrie.


-1

Il existe un nouveau logiciel appelé Rguroo qui est une application web. Il est très pratique à utiliser, car il ne nécessite ni téléchargement ni installation. Rguroo a un moteur R, mais son utilisation ne nécessite pas de codage R car il vous permet d'utiliser la puissance de R en utilisant une interface graphique pointer-cliquer. Chaque analyse est enregistrable et reproductible. Nous utilisons ce logiciel pour nos cours d'introduction et de statistiques intermédiaires au cours des trois dernières années. À ce stade, il est gratuit et vous pouvez créer un compte sur www.Rguroo.com. D'après les informations dont je dispose, il restera gratuit pour toutes les facultés et il y aura un abonnement annuel raisonnable, entre 10 et 20 dollars, pour les étudiants.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.