Beaucoup de gens utilisent un outil principal comme Excel ou une autre feuille de calcul, SPSS, Stata ou R pour leurs besoins en statistiques. Ils peuvent se tourner vers un logiciel spécifique pour des besoins très spécifiques, mais beaucoup de choses peuvent être réalisées avec un simple tableur, un logiciel de statistiques général ou un environnement de programmation de statistiques.
J'ai toujours aimé Python en tant que langage de programmation, et pour des besoins simples, il est facile d'écrire un programme court qui calcule ce dont j'ai besoin. Matplotlib me permet de le tracer.
Est-ce que quelqu'un a complètement changé de, disons R, à Python? R (ou tout autre progiciel de statistiques) a de nombreuses fonctionnalités spécifiques aux statistiques et des structures de données vous permettant de réfléchir aux statistiques que vous souhaitez effectuer et moins à la représentation interne de vos données. Python (ou un autre langage dynamique) a l'avantage de me permettre de programmer dans un langage familier de haut niveau et d'interagir par programmation avec des systèmes du monde réel dans lesquels les données résident ou à partir desquelles je peux prendre des mesures. Mais je n'ai trouvé aucun package Python qui me permette d'exprimer des choses avec une "terminologie statistique" - des statistiques descriptives simples aux méthodes multivariées plus complexes.
Que pouvez-vous recommander si je voulais utiliser Python comme "atelier de statistiques" pour remplacer R, SPSS, etc.?
Que devrais-je gagner et perdre en fonction de votre expérience?