Quand j’enseignais les statistiques de deuxième cycle, je disais à mes étudiants: "Je me moque du paquet que vous utilisez, et vous pouvez utiliser n’importe quoi pour vos devoirs, car je m'attends à ce que vous fournissiez des explications de fond, et vous enlèverez des points si je voir tr23y5m
noms de variables dans vos soumissions. Je peux très bien soutenir votre apprentissage à Stata et raisonnablement bien à R. Avec SAS, vous êtes seul, car vous affirmez avoir suivi un cours. Avec SPSS ou Minitab, Dieu vous bénisse ". J'imagine que les employeurs raisonnables penseraient la même chose. Ce qui compte, c’est votre productivité en termes de résultats du projet. Si vous pouvez atteindre l’objectif de R avec 40 heures de travail, tant mieux. vous pouvez y arriver en C ++ en 40 heures de travail, c'est bien; si vous savez comment faire cela en R en 40 heures, mais que votre superviseur vous demande de le faire en SAS, vous devez passer 60 heures pour apprendre les bases. et là où vont les points-virgules, cela ne peut être que sage dans le contexte de la grande image du reste du code en SAS ... et ensuite le responsable n’a pas été très sage d’avoir embauché un programmeur R.
Dans cette perspective du coût total, "gratuit" R est un mythe extrêmement démesuré. Tout projet sérieux nécessite un code personnalisé, ne serait-ce que pour la saisie de données et le formatage de la sortie, ce qui représente un coût non nul en temps professionnel. Si cette entrée de données et ce formatage nécessitent 10 heures de code SAS et 20 heures de code R, R est un logiciel plus coûteux à la marge , comme le dirait un économiste, c'est-à-dire en termes de coût supplémentaire pour la production d'une fonctionnalité donnée. . Si un grand projet nécessite 200 heures de temps de programmeur R et 100 heures de temps de programmeur Stata pour fournir une fonctionnalité identique, Stata est globalement moins cher., même en tenant compte de la licence de 1 000 USD que vous devez acheter. Il serait intéressant de voir de telles comparaisons directes; J'ai été impliqué dans la réécriture d'un énorme désordre de 2 Mo de code SPSS qui aurait été accumulé pendant environ 10 années-personnes en environ 150 000 code Stata qui a fonctionné à peu près aussi vite, peut-être un peu plus vite; c'était environ un projet d'une année-personne. Je ne sais pas si ce rapport d'efficacité de 10: 1 est typique des comparaisons SPSS: Stata, mais je ne serais pas surpris s'il en était ainsi. Pour moi, travailler avec R est toujours une grosse dépense à cause des coûts de recherche: je dois déterminer lequel des cinq paquets avec des noms similaires fait ce que je dois faire, et jauger s'il est suffisamment fiable pour que je puisse l'utiliser mon travail. Cela signifie souvent qu'il est moins coûteux pour moi d'écrire mon propre code Stata en moins de temps que je passerais à trouver comment faire fonctionner R dans une tâche donnée. Il faut comprendre que ceci est mon idiosyncrasie personnelle; la plupart des gens sur ce site sont de meilleurs utilisateurs que moi.
C'est drôle que votre prof préfère Stata ou GAUSS à R parce que "R n'a pas été écrit par des économistes". Stata et GAUSS non plus. ils sont écrits par des informaticiens utilisant des outils informatiques. Si votre prof a des idées sur la programmation de CodeAcademy.com, c'est mieux que rien, mais le développement de logiciels de niveau professionnel est aussi différent de taper dans la zone de texte de CodeAcademy.com que conduire un camion de fret est différent du vélo. (Stata a été lancé par un économiste du travail reconverti en informaticien, mais il ne fait plus cette activité d'économétrie du travail depuis environ 25 ans maintenant.)
Mise à jour : Comme AndyW l'a commenté ci-dessous, vous pouvez écrire du code déplorable dans n'importe quelle langue. La question du coût devient alors, quelle langue est plus facile à déboguer. Pour moi, cela ressemble à une combinaison de précision et d’information du résultat, et de simplicité et de transparence de la syntaxe, et je n’ai bien sûr pas de bonne réponse à cela. Par exemple, Python applique l'indentation du code, ce qui est une bonne idée. Stata et le code R peuvent être repliés entre les crochets, et cela ne fonctionnera pas avec SAS. L'utilisation de sous-routines est une arme à double tranchant: l'utilisation de s *apply()
ad-hoc function
dans R est évidemment très efficace, mais plus difficile à déboguer. De la même manière, Stata local
peut masquer presque tout, et le fait de choisir une chaîne vide, même s’il est utile, peut également entraîner des erreurs difficiles à détecter.