Si vous pouviez remonter dans le temps et vous dire de lire un livre spécifique au début de votre carrière de statisticien, de quel livre s'agirait-il?
Si vous pouviez remonter dans le temps et vous dire de lire un livre spécifique au début de votre carrière de statisticien, de quel livre s'agirait-il?
Réponses:
En voici deux à mettre sur la liste:
Tufte. L'affichage visuel d'informations quantitatives
Tukey. L'analyse exploratoire des données
Les éléments d'apprentissage statistique de Hastie, Tibshirani et Friedman http://www-stat.stanford.edu/~tibs/ElemStatLearn/ devraient figurer dans la bibliothèque de tout statisticien!
Je ne suis pas statisticien et je n'ai pas beaucoup lu sur le sujet, mais peut-être
Lady Tasting Tea: Comment les statistiques ont révolutionné la science au vingtième siècle
devrait être mentionné? Ce n'est pas un manuel, mais mérite d'être lu.
Ce n'est pas un livre, mais j'ai récemment découvert un article de Jacob Cohen dans American Psychologist intitulé "Ce que j'ai appris (jusqu'à présent)". Il est disponible en pdf ici .
Il y a bien longtemps, la petite monographie de Jack Kiefer "Introduction à l'inférence statistique" a dévoilé le mystère de nombreuses statistiques classiques et m'a aidé à commencer avec le reste de la littérature. J'y fais toujours référence et le recommande vivement aux étudiants les plus solides qui suivent les cours de statistiques de deuxième année.
Je ne dirais pas que l'un ou l'autre devrait être considéré comme "le livre le plus influent ... pour les statisticiens [s]", mais pour ceux qui commencent tout juste à en apprendre davantage sur le sujet, deux livres utiles sont:
Le livre de William Cleveland "The Elements of Graphing Data" ou son livre "Visualizing Data"
Je pense que tous les statisticiens devraient lire l’ histoire de la statistique de Stigler : La mesure de l’incertitude avant 1900
Il est magnifiquement écrit, complet et ce n’est pas la perspective d’un historien, mais celle d’un mathématicien, elle n’évite donc pas les détails techniques.
Je dis l' affichage visuel d'informations quantitatives par Tufte et Freakonomics pour quelque chose d'amusant.
Les recommandations de livre intéressantes d'Andrew Gelman sont ici:
http://thebrowser.com/interviews/andrew-gelman-on-statistics
En plus de "The History of Statistics" suggéré par Graham, un autre livre de Stigler qui mérite d'être lu est
Statistiques sur la table: l'histoire des concepts et des méthodes statistiques
Côté mathématiques / fondements: les méthodes mathématiques de statistique de Harald Cramér .
Pour une présentation claire de ce qui devrait figurer dans les articles de revues de sciences sociales (aide si vous écrivez ou évaluez par des pairs), j’aime le Guide du réviseur sur les méthodes quantitatives en sciences sociales . En particulier, j’aime la table desideratra comme un résumé du minimum qu’un article (article, thèse, mémoire) doit contenir. Les chapitres sont séparés par une technique d'analyse, ce qui est agréable. Je pense que le livre a des applications plus larges que "uniquement" les sciences sociales, car les techniques abordées sont utilisées dans de nombreux domaines.
Très tôt, alors que la question ne couvrait peut-être pas, j'ai été présenté à Introduction aux méthodes statistiques et à l'analyse des données d' Ott par Ott . C'est assez cher, mais c'est une ressource merveilleuse pour montrer les modèles statistiques sous-jacents pour diverses méthodes de GLM. Je rêve du jour où les revues exigent que les articles contiennent la formule du modèle statistique testé.
Pour vérifier les hypothèses de test, examiner les effets de différentes options au sein d’un test, etc., c’est le livre que j’aurais aimé avoir pendant mes études . J'ai l'édition précédente et c'est l'une des meilleures ressources générales que j'ai achetées en raison de la manière claire et cohérente dont les informations sur les tests sont présentées. Il contient de beaux exemples illustrant le (s) test (s) et n'exige pas du lecteur qu'il dispose d'un logiciel de statistiques particulier pour pouvoir suivre les expositions.
Trompé par le hasard par Taleb
Taleb est professeur à Columbia et négociateur d'options. Il a gagné environ 800 millions de dollars en 2008 en pariant contre le marché. Il a également écrit Black Swan. Il discute de l'absurdité d'utiliser la distribution normale pour modéliser des marchés et philosophe sur notre capacité à utiliser l'induction.
Si vous êtes intéressé, j'ai consulté à la fois sur Amazon et sur http://www.integrativestatistics.com/favorites.htm.
J'ai lu les recommandations ci-dessus et j'ai été surpris de constater que la plupart des personnes qui ont répondu à la question étaient des personnes qui n'étaient pas des statisticiens. À deux ou trois exceptions près ... En tant que statisticien industriel qui travaillait également avec des spécialistes des sciences sociales et des professionnels de la santé, je dirais que si je ne pouvais emporter qu'un seul livre sur une île déserte, ce serait George EP Box, Statistics for Experimenters. (Wiley) Dans son style humoristique et lucide inimitable, il explique l'essence et la philosophie de la construction de modèles mathématiques pour des données réelles. La pensée rigoureuse, pas de frivolités mathématiques, pas de bêtises, nous apprend à penser statistiquement, à tracer et à visualiser tout ce que vous pouvez. Un chef-d'œuvre d'un scientifique appliqué compétent (ingénieur chimiste devenu statisticien). Toujours amusant de relire.
Beaucoup de bons livres déjà suggérés. Mais en voici un autre: "Reckoning With Risk" de Gerd Gigerenzer, car il est plus important de comprendre comment les statistiques affectent les décisions que de bien comprendre toutes les théories. En fait, le péché numéro un des statisticiens ne parvient pas à communiquer clairement. Son livre parle des conséquences d'une mauvaise communication et des moyens de l'éviter.
Je vais aller de l'avant et proposer un manuel standard sur le terrain. Je parle de Probabilité et Statistiques de Degroot et Schervish, publiées pour la première fois en 1975.
Ce livre a servi de manuel à de nombreux étudiants et est considéré comme un classique, à juste titre, à mon avis. Il couvre des sujets tels que la combinatoire, les distributions, les statistiques bayésiennes, l'inférence de vraisemblance et l'analyse de régression. Pour autant que je sache, aucun autre manuel n’est aussi complet, je pense donc que c’est un must.
J'ai beaucoup appris de la Bible des statistiques bayésiennes:
Le guide essentiel sur la taille des effets: puissance statistique, méta-analyse et interprétation des résultats de recherche par Paul D. Ellis
Ce livre est un "must" pour tous ceux qui mènent des recherches scientifiques, en particulier celles qui ne proviennent pas uniquement de statistiques / mathématiques. Le livre ci-dessous étend le premier concernant les intervalles de confiance.
Comprendre les nouvelles statistiques: tailles d'effet, intervalles de confiance et méta-analyse par Geoff Cumming
"Le plus influent" est une notion très différente de "tout le monde devrait lire". Je ne suis pas qualifié pour répondre à la première question - vous auriez besoin d'un historien des statistiques - mais pour la seconde, en voici quelques-unes:
Les statistiques en tant qu'argument de principe de Robert Abelson devraient être lues par tous ceux qui utilisent ou utilisent des statistiques pour la science, les sciences humaines, etc.
Les deux livres de William S. Cleveland sur les graphiques: Les éléments de données graphiques et Visualizing Data . Pour les statisticiens, je les mettrais même avant le travail de Tufte, parce que Tufte n’en valait pas la peine, mais parce que a) Cleveland écrivait avec les statisticiens comme son public cible et b) Cleveland avait fondé ses recommandations sur des données expérimentales sur la façon dont les gens percevaient les graphiques, plutôt que de l'intuition.
Analyse exploratoire des données par John Tukey. C'est daté mais précieux - vous pouvez faire beaucoup avec un crayon, du papier et un cerveau (du moins, si votre cerveau est aussi bon que celui de Tukey!)
Ce serait probablement l'analyse de données bayésienne par Gelman ou Deep Learning with Python . Mais c'est un peu comme prendre la streptomycine au moyen âge. Celles-ci n'avaient pas été écrites au début de ma carrière et de nombreuses choses dans les livres auraient été une grande nouvelle à l'époque. Certaines des choses les plus influentes que tout le monde devrait savoir ne se trouvent cependant pas dans une source unique (elles devraient peut-être l'être, mais ...).
Le Guide de l'économétrie de Kennedy contient une mine de conseils pratiques sur un large éventail d'analyses statistiques. C'est à la fois incroyablement dense en informations et facile à lire, et j'apprends toujours quelque chose de nouveau chaque fois que je le prends.
L’ introduction à l’économétrie de Wooldridge présente également de nombreux éléments de ce type, mais en tant que manuel d’introduction, il est plus autonome. J'aurais aimé avoir un cours basé sur ça.