Il est très difficile d'écrire une réponse à la question
Quelles ont été les principales contributions statistiques de Ronald Fisher?
car il existe déjà de nombreux excellents ouvrages sur ce sujet, créés par d'excellents écrivains, y compris de grands statisticiens, par exemple:
- Hotelling, 1951, L'impact de RA Fisher sur les statistiques
- Savage, 1976, sur la relecture de RA Fisher
- Yates, 1964, Sir Ronald Fisher et la conception des expériences
- Yates, 1962, Sir Ronald Aylmer Fisher (1890-1962)
- Pearce, 1979, Conception expérimentale: RA Fisher et certains rivaux modernes
- Efron, 1998, RA Fisher au 21e siècle
Ces travaux sont très difficiles à faire correspondre en quelques lignes simples sur un tableau de questions / réponses sur Internet. En plus de cela, il n'est pas très facile de saisir l'intégralité des idées de Fisher, comme Efron l'a écrit dans son travail sur Fisher:
Une difficulté pour évaluer l'importance des statistiques des pêcheurs est qu'il est difficile de dire ce que c'est. Fisher avait un nombre incroyable d'idées importantes et certaines d'entre elles, comme l'inférence de randomisation et la conditionnalité, sont contradictoires. C'est un peu comme si en économie Marx, Adam Smith et Keynes s'avéraient être la même personne.
Fisher était un pionnier
Wikipédia est déjà une source simple, mais très bonne, de la contribution de Fisher. La simple lecture de l'article sur l' histoire des statistiques (ou vous pouvez utiliser n'importe quel autre texte) vous donnera un aperçu du montant et de l'importance des contributions de Fisher.
Vous verrez également que c'est en partie le temps, l'emplacement et la chance qui ont fait de Fisher un grand contributeur. Fisher était un statisticien important et influent au début du XXe siècle lorsque les fondements de base des statistiques appliquées ont été créés et que le domaine était relativement restreint (comparable à la période des XVIIIe et XIXe siècles en mathématiques).
Le premier journal de statistiques et le premier département de statistiques d'une université venaient de démarrer lorsque Fisher est entré en scène. Avant le début du 20e siècle, il existait principalement des méthodes de régression et plusieurs idées sur la distribution des termes résiduels et des erreurs, utilisées dans des domaines tels que l'astronomie.
Concepts d'erreurs de mesure et probabilité de résultats. Ce type de mathématiques et de logique (plus proche des mathématiques pures, et ... considéré comme plus noble et moins condamné par les mathématiciens sérieux de l'époque), est devenu plus largement appliqué aux domaines de prédilection de Fisher: génétique, évolution, biologie, agriculture . Depuis que Fisher, un excellent mathématicien, a apporté une contribution majeure à ces premiers développements (ou peut même être considéré comme le principal moteur de ces développements), son travail a été placé à une position importante dans l'histoire des statistiques.
Concepts et outils de base
Si vous regardez les sujets d'un livre d'introduction sur les statistiques (en particulier les concepts mathématiques ou l'inférence), vous pourriez considérer Fisher comme le contributeur dominant. C'est également Fisher qui a écrit la première et la plus influente introduction aux livres de statistiques :
- Méthodes statistiques pour les chercheurs (1925)
- The Design of Experiments (1935) (en utilisant l'expérience de la tasse de thé pour expliquer, entre autres, la randomisation, l'utilisation des carrés latins, l'hypothèse nulle, la signification, la sensibilité / puissance, et essentiellement tout; Yates fournit un contexte historique à ce travail)
Notez que les versions en ligne de ces livres existent SMRW et partiellement DE (voir les lectures du 29 octobre b) .
De 1912 à 1925, Fisher:
- contribué à améliorer le test du chi carré (où Pearson et d'autres se trompaient sur le nombre de degrés de liberté pendant de nombreuses années),
- fourni un test exact pour calculer la valeur de p pour la qualité de l'ajustement avec un faible nombre d'observations (qui a été nommé d'après lui comme test exact de Fisher ),
- N−1N
- développé l'analyse de la variance et de la distribution F (également nommé d'après lui), et
- (une autre "petite" chose qu'il a faite en tant qu'étudiant de premier cycle) était de développer les bases et les concepts de la vraisemblance maximale ( RA Fisher d' Aldrich et la réalisation de la vraisemblance maximale ).
Donc, grosso modo, cela couvre la plupart des outils d'inférence de base que les textes d'introduction actuels utilisent. En faisant ce travail sur les statistiques, Fisher a abordé des problèmes majeurs en génétique qui font que des gens comme Richard Dawkins l'admirent tellement.
Terminologie
L2L1L2L1«variance» (dans son article de 1920 Une observation mathématique des méthodes de détermination de la précision de l'observation par l'erreur moyenne et l'erreur quadratique moyenne ).
Fondations
Dans l'article de 1922 sur les fondements mathématiques des statistiques théoriques, Fisher fournit un bref aperçu simple des principaux concepts, pour ne nommer que la liste des définitions: «centre de localisation», «cohérence», «distribution», «efficacité», « estimation »,« précision intrinsèque »,« régions isostatistiques »,« vraisemblance »,« emplacement »,« optimal »,« mise à l'échelle »,« spécification »,« suffisance »,« validité » . Cela demande à un historien de voir ce que Fisher a apporté ici dans le sens d'être à l'origine de concepts, et cela se rapporte également à la déclaration d'Efron. Il est difficile de saisir exactement ce qui est apporté par qui.
Dans cet article, Fisher commence à mentionner le problème de l'application de termes tels que «moyenne» et «variance» à la fois à la vraie valeur de distribution ainsi qu'à la valeur estimée.
(J'essaierai d'éviter de placer Fisher quelque part dans une «école» telle que fréquentiste ou bayésienne. Je dirais qu'il était juste «suffisamment» pratique pour toutes les questions posées).
Concepts avancés
Dans ses travaux ultérieurs, Fisher a développé les premiers concepts de l' analyse discriminante linéaire :
X=λ1x1+λ2x2+λ3x3+λ4x4
L'utilisation de mesures multiples dans les problèmes taxonomiques, 1936
et le concept d'estimation par probabilité que Fisher a exploré plus avant, et a deux concepts nommés d'après lui, l' information de Fisher et le score de Fisher . Voir Théorie de l'estimation statistique, 1925 , Deux nouvelles propriétés de vraisemblance mathématique, 1934 , et La logique de l'inférence inductive, 1935 .
Plus de liens:
- RA Fisher Guide , par John Aldrich. Une énorme source, sinon la plus grande, d'informations sur Fisher, avec de nombreuses autres références.
- Réponse de Michael Hardy sur Mathoverflow à une question sur les plus grands mathématiciens: /mathpro//a/173374
Écrit par StackExchangeStrike