Bonnes ressources (en ligne ou livre) sur les fondements mathématiques de la statistique


17

Avant de poser ma question, permettez-moi de vous donner un aperçu de ce que je sais sur les statistiques afin que vous ayez une meilleure idée des types de ressources que je recherche.

Je suis un étudiant diplômé en psychologie, et en tant que tel, j'utilise des statistiques presque tous les jours. À l'heure actuelle, je connais un assez large éventail de techniques, principalement lorsqu'elles sont mises en œuvre dans le cadre général de modélisation des équations structurelles. Cependant, ma formation a été dans l'utilisation de ces techniques et l'interprétation des résultats - je n'ai pas beaucoup de connaissances sur les fondements mathématiques formels de ces techniques.

Cependant, de plus en plus, j'ai dû lire des articles de statistiques proprement dites. J'ai trouvé que ces articles supposent souvent une connaissance pratique des concepts mathématiques que je ne connais pas beaucoup, comme l'algèbre linéaire. J'ai donc acquis la conviction que si je souhaite faire plus que d'utiliser aveuglément les outils qui m'ont été enseignés, il serait utile pour moi d'apprendre certaines des bases mathématiques de la statistique.

J'ai donc deux questions connexes:

  1. Quelles techniques mathématiques me seraient utiles pour savoir si je veux approfondir les fondements mathématiques de la statistique? J'ai rencontré l'algèbre linéaire assez souvent, et je suis sûr que l'apprentissage de la théorie des probabilités serait utile, mais y a-t-il d'autres domaines de mathématiques qui me seraient utiles?
  2. Quelles ressources (en ligne ou sous forme de livre) pouvez-vous me recommander en tant que personne qui veut en savoir plus sur les fondements mathématiques de la statistique?

Quelles mathématiques connaissez-vous déjà?
Peter Flom - Réintègre Monica

Très peu. Je connais une algèbre linéaire légère dans le cadre de l'apprentissage des extensions multivariées du GLM. La plupart de ma formation en statistique a été à un niveau conceptuel, cependant - elle visait à me faire comprendre comment utiliser et interpréter les résultats, pas nécessairement pour comprendre pourquoi un certain résultat (tel que le CLT) est vrai.
Patrick S.Forscher

2
Algèbre linéaire, au moins quelques calculs de base, au moins un cours de base sur les probabilités, algèbre linéaire, un peu de simulation informatique, une théorie statistique et peut-être une algèbre linéaire. Bien que non critique, une programmation de base serait un atout. En fait, les questions générées ici par les étudiants ont tendance à suggérer une grande partie du type de contexte nécessaire.
Glen_b -Reinstate Monica

Réponses:


12

Mathématiques:

Grinstead & Snell, Introduction to Probability (c'est gratuit)

Strang, Introduction à l'algèbre linéaire

Strang, Calculus

Consultez également Strang sur MIT OpenCourseWare.

Théorie statistique (c'est plus que des mathématiques):

Cox, principes d'inférence statistique

Cox & Hinkley, Statistiques théoriques

Geisser, Modes d'inférence statistique paramétrique

Et j'appuie Casella & Berger d'Andre.


Merci, Scortchi. Cela ressemble à une grande liste, et c'était exactement le genre de chose que je cherchais (+1).
Patrick

Bien. Les trois premiers sont presque tous les mathématiques que je connais. Et le quatrième devrait être lu avec Casella & Berger - des accents très différents.
Scortchi - Réintégrer Monica

3


0

Le SEM est (à mon avis) très éloigné de la théorie des probabilités traditionnelle et de certaines techniques statistiques de base qui en découlent facilement (comme l'estimation ponctuelle, la théorie des grands échantillons et les statistiques bayésiennes). Je pense que SEM est le résultat d'une grande abstraction de ces méthodes. Je pense en outre que la raison pour laquelle de telles abstractions étaient nécessaires était due à la demande écrasante de mieux comprendre l' inférence causale .

Je pense qu'un livre qui serait parfait pour quelqu'un de votre milieu serait la causalité de Judea Pearl . Ce livre aborde spécifiquement SEM ainsi que les statistiques multivariées, développe une théorie de la causalité et de l'inférence, et est très philosophiquement solide. Ce n'est pas un livre mathématique, mais s'appuie fortement sur la logique et les contrefactuels, et développe un langage très précis pour défendre les modèles statistiques.

Je peux dire d'un point de vue mathématique que ces résultats sont très solides et ne nécessitent pas une compréhension approfondie du calcul. Je pense aussi qu'il est irréaliste pour quelqu'un de votre pedigree de rattraper les mathématiques nécessaires lorsque vous êtes déjà étudiant diplômé, c'est pourquoi il y a des statisticiens!


1
Merci, cela ressemble à une ressource utile. Cependant, il semble que ce ne soit pas tout à fait écrit au niveau que je souhaite. J'ai déjà une abondance de ressources sur la façon de tirer des conclusions appropriées à partir des données. Ce qui me manque, c'est une compréhension des mathématiques sous-jacentes. Par exemple, je sais en général que l'estimation ML trouve les valeurs des paramètres qui maximisent la probabilité d'observer les données, mais je ne comprends pas vraiment comment on trouve ces valeurs de paramètres ou pourquoi différentes méthodes de ML fonctionnent.
Patrick S.Forscher

Cela nécessite un calcul: différenciation multivariée, intégration et séquence et série infinies. De plus, vous aurez besoin d'une algèbre linéaire. Une fois que vous avez cela sous votre ceinture, vous pouvez utiliser n'importe lequel des textes théoriques de base de première année en probabilité et inférence. La plus courante est Casella, "l'inférence statistique" de Berger. Il s'agit d'un engagement de 3 ans au moins pour obtenir les mathématiques requises au-delà de l'algèbre universitaire. Vous ne pouvez pas "obtenir le calcul" sans calcul.
AdamO

Quel niveau de connaissances en calcul est requis? J'ai fait du calcul au lycée, mais je ne l'ai plus utilisé depuis.
Patrick S.Forscher

Ce seraient tous les mêmes prérequis que celui d'un programme d'ingénierie. La différenciation, l'intégration et la série / séquence infinie constituent une année de calcul d'introduction. Après quoi, vous avez besoin d'une algèbre linéaire de base.
AdamO
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.