Existe-t-il des manuels de statistiques gratuits?
Existe-t-il des manuels de statistiques gratuits?
Réponses:
Les livres en ligne incluent
Mise à jour: je peux maintenant ajouter mon propre manuel de prévision
Les éléments d'apprentissage statistique de Hastie, Tibshirani et Friedman est un texte standard pour les statistiques et l'exploration de données. Il est désormais gratuit:
https://web.stanford.edu/~hastie/ElemStatLearn/
Aussi disponible ici .
Il existe un superbe livre de probabilités ici: http://www.dartmouth.edu/~chance/teaching_aids/books_articles/probability_book/book.html que vous pouvez également acheter en version papier .;
J'ai souvent trouvé le manuel de statistiques d'ingénierie utile. On peut le trouver ici .
Bien que je ne l'aie jamais lu moi-même, j'entends Introduction à la probabilité et aux statistiques. L'utilisation de R est très bonne. C'est un ebook complet d'environ 400 pages (également disponible sous forme de livre). En prime, il vous apprend aussi R, ce que vous voulez bien sûr apprendre de toute façon.
J'aime beaucoup Le petit manuel de pratique statistique de Gerard E. Dallal
Voici une fraîche: Introduction aux probabilités et statistiques à l' aide R . C'est spécifique à R, cependant, mais c'est un excellent. Je ne l'ai pas encore lu, mais ça semble aller jusqu'à présent ...
Hastie, Tibshirani et Friedman, Les éléments de l’apprentissage statistique , parmi les manuels les plus populaires , si ce n’est le plus populaire , sont entièrement disponibles en ligne (dixième impression actuellement). Il est comparable portée par exemple à Bishop Recognition Pattern et ML ou Murphy ML , mais ces livres ne sont pas libres, tout en anglais langue seconde est.
Hastie et Tibshirani ont également co-écrit gratuitement une introduction à l’apprentissage statistique, avec applications en R, qui est une version simplifiée de The Elements et est centrée sur R.
En 2015, Hastie et Tibshirani ont co-rédigé un nouveau manuel intitulé Apprentissage statistique avec parcimonie: le lasso et les généralisations , également disponible en ligne. Celui-ci est un peu plus court et se concentre spécifiquement sur le lasso.
Un autre manuel d’apprentissage automatique complet et librement disponible est le Bayaisian Reasoning and Machine Learning de David Barber . Je ne l'ai pas utilisé moi-même, mais il est largement considéré comme un excellent livre.
Passons maintenant à des sujets plus spécialisés:
Rasmussen & Williams Processus gaussiens pour l'apprentissage automatique , qui est un livre sur les processus gaussiens.
Le manuel très attendu de Goodfellow, Bengio et Courville Deep Learning qui est sur le point d'être publié par MIT Press. Il n'est pas encore publié, mais le livre est déjà disponible en ligne. Sur le site officiel, vous pouvez le visualiser dans un navigateur, mais vous ne pouvez pas le télécharger (comme convenu avec l'éditeur), mais il est facile de trouver un fichier PDF combiné, par exemple ici sur github .
Csaba Szepesvári, Algorithms for Reinforcement Learning , un livre concis sur RL. Sutton & Barto, Apprentissage par le renforcement: une introduction, est un manuel classique, beaucoup plus détaillé mais un peu daté, qui est également disponible gratuitement en ligne, mais uniquement dans un format HTML encombrant.
Boyd et Vandenberghe, Optimisation convexe .
Norman Matloff a écrit un manuel de statistiques mathématiques gratuit pour les étudiants en informatique. Une sorte de marché de niche, je suppose. Pour ce que ça vaut, je ne l'ai pas lu, mais Matloff a un doctorat. en statistique mathématique, travaille pour un département d’informatique et a écrit un très bon livre R, que je recommande aux personnes qui souhaitent passer à la prochaine étape de la programmation R mieux (au lieu d’adapter simplement des modèles avec des fonctions prédéfinies).
Statistiques OpenIntro
http://www.openintro.org/stat/textbook.php
Des exemplaires de poche peu coûteux sont également disponibles sur Amazon.
Une nouvelle vision des statistiques par Will G. Hopkins est géniale! Il est conçu pour vous aider à comprendre comment comprendre les résultats des analyses statistiques et non à prouver des théorèmes statistiques.
Pas de statistiques spécifiques, mais une bonne ressource est: http://www.reddit.com/r/mathbooks De plus, George Cain de Georgia Tech maintient une liste de textes de maths librement disponibles comprenant certains textes statistiques. http://people.math.gatech.edu/~cain/textbooks/onlinebooks.html
J'aime beaucoup ces deux livres de Daniel McFadden de Berkeley:
http://elsa.berkeley.edu/users/mcfadden/e240a_sp98/e240a.html
http://elsa.berkeley.edu/users/mcfadden/e240b_f01/e240b.html
Pour entrer dans les processus stochastiques et les SDE, les notes de cours de Tom Kurtz sont difficiles à battre. Il commence par un examen décent de la probabilité et de certains résultats de convergence, puis plonge directement dans les processus stochastiques temporels continus dans un langage assez clair et compréhensible. En général, c'est l'un des meilleurs livres sur le sujet - gratuit ou non - que j'ai trouvé.
" Une introduction à l'apprentissage statistique avec des applications en langage R " http://www-bcf.usc.edu/~gareth/ISL/ par deux des 3 auteurs du célèbre article " Les éléments de l'apprentissage statistique " et deux autres auteurs . Une introduction à l’apprentissage statistique avec applications en R est écrite à un niveau plus introductif avec moins de connaissances mathématiques que les éléments de l’apprentissage statistique, utilise R (contrairement aux éléments de l’apprentissage statistique) et a été publiée pour la première fois en 2013, quelques années après que ce fil ait commencé.
Cosma Shalizi, gourou de la CMUs ML, met occasionnellement à jour un brouillon d’un livre de statistiques publié prochainement par Cambridge Press et intitulé Analyse avancée des données d’un point de vue élémentaire . Je ne saurais trop le recommander ...
Voici la table des matières:
I. Regression and Its Generalizations
Regression Basics
The Truth about Linear Regression
Model Evaluation
Smoothing in Regression
Simulation
The Bootstrap
Weighting and Variance
Splines
Additive Models
Testing Regression Specifications
Logistic Regression
Generalized Linear Models and Generalized Additive Models
Classification and Regression Trees
II. Distributions and Latent Structure
Density Estimation
Relative Distributions and Smooth Tests of Goodness-of-Fit
Principal Components Analysis
Factor Models
Nonlinear Dimensionality Reduction
Mixture Models
Graphical Models
III. Dependent Data
Time Series
Spatial and Network Data
Simulation-Based Inference
IV. Causal Inference
Graphical Causal Models
Identifying Causal Effects
Causal Inference from Experiments
Estimating Causal Effects
Discovering Causal Structure
Appendices
Data-Analysis Problem Sets
Reminders from Linear Algebra
Big O and Little o Notation
Taylor Expansions
Multivariate Distributions
Algebra with Expectations and Variances
Propagation of Error, and Standard Errors for Derived Quantities
Optimization
chi-squared and the Likelihood Ratio Test
Proof of the Gauss-Markov Theorem
Rudimentary Graph Theory
Information Theory
Hypothesis Testing
Writing R Functions
Random Variable Generation
Le manuel de statistiques électroniques de Statsoft ("La seule ressource Internet recommandée par l'Encyclopedia Britannica sur les statistiques") mérite d'être consulté.
Quelques notes téléchargeables sur les probabilités, qui semblent intéressantes: http://www.math.harvard.edu/~knill/teaching/math19b_2011/handouts/chapters1-19.pdf
Probabilité appliquée: http://www.acsu.buffalo.edu/~bialas/EAS305/docs/EAS305%20NOTES%202005.pdf
http://www.ma.huji.ac.il/~razk/Teaching/LectureNotes/LectureNotesProbability.pdf
Je sais que d’autres auteurs ont eu du mal à mettre leurs livres à la disposition du public ici en échange de piles. Springer et Google ont récemment commencé à le vendre (livre uniquement) sous forme de livre électronique PDF (sans logiciel) sur les sites Springer et Google au prix de 79 $.
Nous sommes ravis de pouvoir offrir GRATUITEMENT la version PDF de l’eBook (édition 2002) aux utilisateurs de stackexchange à l’adresse suivante:
http://www.mathstatica.com/book/bookcontents.html
Ceci est une version PDF complète de l'édition imprimée originale de 2002. Bien qu'aucun logiciel ne soit inclus (ni Mathematica ni mathStatica ), les méthodes, théorèmes, tableaux de synthèse, exemples, exercices, théorèmes, etc. sont tous utiles et pertinents ... même comme texte de référence pour les personnes qui ne possèdent même pas Mathematica .
On peut soit télécharger:
le livre entier en tant que fichier de téléchargement unique ... avec table des matières cliquable en direct, etc., ... ou
chapitre par chapitre.
Installation d'iBooks
Pour installer en tant qu'iBook:
Télécharger le livre en entier en un seul fichier PDF
Ensuite, faites-le glisser dans iBooks (sous la section: fichiers PDF).
installation d'iPad
Pour installer sur un iPad:
Tout d'abord l'installer comme un iBook (comme ci-dessus)
Ouvrez iTunes. sélectionnez votre iPad; cliquez sur Livres: sélectionnez le livre et synchronisez-le sur votre iPad.
Il est agréable de voir des universitaires distribuer librement leurs travaux. Voici une mine de livres gratuits ML / Stats en PDF:
Apprentissage machine
Probabilité / Stats
Algèbre Linéaire / Optimisation
Algorithme génétique
Une rédaction de didacticiels de probabilité et de casse-tête associés avec le code R pour l’apprentissage. J'espère que ça aide
Il ne s'agit pas d'un manuel complet, mais la quatrième partie de Mathématiques pour l'informatique traite de la probabilité et des variables aléatoires.
http://www.probabilitycourse.com/ est un site Web hébergeant un manuel gratuit de probabilités et de statistiques en ligne. Il comporte également des fonctionnalités supplémentaires telles que des outils graphiques et des vidéos de conférences.
Voici également un excellent livre gratuit de Marden sur les statistiques multivariées, principalement consacré au modèle linéaire normal lié à cette page:
Ce n'est pas un manuel, mais Bayesian Methods dans la recherche du MH370 est une excellente introduction aux filtres à particules.
Un manuel numérique sur les probabilités et les statistiques de M. Taboga est disponible à l’ adresse https://www.statlect.com. Le niveau est intermédiaire. Il contient des centaines d'exercices et d'exemples résolus, ainsi que des preuves pas à pas de tous les résultats présentés.