Quelles ont été les principales contributions statistiques de Ronald Fisher?

Richard Dawkins a décrit Ronald Fisher comme "le père des statistiques modernes et de la conception expérimentale", une ligne qui est citée dans la biographie Wikipedia de Fisher . Et aussi Anders Hald l'a appelé "un génie qui a presque à lui seul créé les bases de la science statistique moderne" dans son livre A History of Mathematical Statistics .

Je me demande juste ce qu'il a fait exactement pour que les gens lui donnent une si haute évaluation?

history ronald-fisher

— WCMC
source

Ce serait un excellent article pour HSM .

— Antoni Parellada

@Antoni Je pense qu'à un moment donné à l'avenir, alors que HSM continue de croître et de prospérer, HSM pourrait devenir un meilleur foyer pour les questions d'histoire statistique. Mais il y a une telle base d'expertise sur le CV, avec de nombreux utilisateurs qui ont un réel intérêt pour les aspects historiques, que le CV est sans doute le meilleur endroit pour l'instant. (Je pense qu'à long terme, CV continuera probablement d'être le meilleur endroit pour les questions d'histoire plus "conceptuelles".)

— Silverfish

Je ne pense pas que la nature potentiellement «basée sur l'opinion» de cette question soit la question. Je suis d'accord avec @AntoniParellada: si cette question n'appartient pas au site History of Science and Mathematics SE, ce n'est pas clair. Nous devons à nos collègues SE de le migrer là-bas. Le cadrage d'origine était parfaitement fin.

— gung - Rétablir Monica

Je suis d'accord, "belle question", mais peut-être pas ici. Le travail de Fisher a déjà été rassemblé dans un joli volume Contributions à la statistique mathématique qui peut être facilement obtenu dans n'importe quel magasin de livres d'occasion. Pour une critique de livre, voir: jstor.org/stable/2332332 Personnellement, je ne suis pas capable d'ajouter de meilleurs mots et je ne peux que me référer à Efron jstor.org/stable/2676745 Ce qui serait effectivement intéressant et l'ajout d'informations est une vue des historiens. (ou philosophes, car les différentes vues statistiques sont une question bien pensée et je ne la comprends pas vraiment, c'est-à-dire que je les utilise toutes)

— Sextus Empiricus

@MatthewDrury Nous avons une balise [historique] relativement populaire. Les questions d'histoire sont sur le sujet sur notre site. Si quelque chose est sur le sujet ici, nous devrions à mon humble avis ne pas le migrer même s'il est sur le sujet ailleurs.

— amibe dit Réintégrer Monica

Réponses:

Il est très difficile d'écrire une réponse à la question

Quelles ont été les principales contributions statistiques de Ronald Fisher?

car il existe déjà de nombreux excellents ouvrages sur ce sujet, créés par d'excellents écrivains, y compris de grands statisticiens, par exemple:

Ces travaux sont très difficiles à faire correspondre en quelques lignes simples sur un tableau de questions / réponses sur Internet. En plus de cela, il n'est pas très facile de saisir l'intégralité des idées de Fisher, comme Efron l'a écrit dans son travail sur Fisher:

Une difficulté pour évaluer l'importance des statistiques des pêcheurs est qu'il est difficile de dire ce que c'est. Fisher avait un nombre incroyable d'idées importantes et certaines d'entre elles, comme l'inférence de randomisation et la conditionnalité, sont contradictoires. C'est un peu comme si en économie Marx, Adam Smith et Keynes s'avéraient être la même personne.

Fisher était un pionnier

Wikipédia est déjà une source simple, mais très bonne, de la contribution de Fisher. La simple lecture de l'article sur l' histoire des statistiques (ou vous pouvez utiliser n'importe quel autre texte) vous donnera un aperçu du montant et de l'importance des contributions de Fisher.

Vous verrez également que c'est en partie le temps, l'emplacement et la chance qui ont fait de Fisher un grand contributeur. Fisher était un statisticien important et influent au début du XXe siècle lorsque les fondements de base des statistiques appliquées ont été créés et que le domaine était relativement restreint (comparable à la période des XVIIIe et XIXe siècles en mathématiques).

Le premier journal de statistiques et le premier département de statistiques d'une université venaient de démarrer lorsque Fisher est entré en scène. Avant le début du 20e siècle, il existait principalement des méthodes de régression et plusieurs idées sur la distribution des termes résiduels et des erreurs, utilisées dans des domaines tels que l'astronomie.

Concepts d'erreurs de mesure et probabilité de résultats. Ce type de mathématiques et de logique (plus proche des mathématiques pures, et ... considéré comme plus noble et moins condamné par les mathématiciens sérieux de l'époque), est devenu plus largement appliqué aux domaines de prédilection de Fisher: génétique, évolution, biologie, agriculture . Depuis que Fisher, un excellent mathématicien, a apporté une contribution majeure à ces premiers développements (ou peut même être considéré comme le principal moteur de ces développements), son travail a été placé à une position importante dans l'histoire des statistiques.

Concepts et outils de base

Si vous regardez les sujets d'un livre d'introduction sur les statistiques (en particulier les concepts mathématiques ou l'inférence), vous pourriez considérer Fisher comme le contributeur dominant. C'est également Fisher qui a écrit la première et la plus influente introduction aux livres de statistiques :

Méthodes statistiques pour les chercheurs (1925)
The Design of Experiments (1935) (en utilisant l'expérience de la tasse de thé pour expliquer, entre autres, la randomisation, l'utilisation des carrés latins, l'hypothèse nulle, la signification, la sensibilité / puissance, et essentiellement tout; Yates fournit un contexte historique à ce travail)

Notez que les versions en ligne de ces livres existent SMRW et partiellement DE (voir les lectures du 29 octobre b) .

De 1912 à 1925, Fisher:

contribué à améliorer le test du chi carré (où Pearson et d'autres se trompaient sur le nombre de degrés de liberté pendant de nombreuses années),
fourni un test exact pour calculer la valeur de p pour la qualité de l'ajustement avec un faible nombre d'observations (qui a été nommé d'après lui comme test exact de Fisher ),
$N-1$ $N$
développé l'analyse de la variance et de la distribution F (également nommé d'après lui), et
(une autre "petite" chose qu'il a faite en tant qu'étudiant de premier cycle) était de développer les bases et les concepts de la vraisemblance maximale ( RA Fisher d' Aldrich et la réalisation de la vraisemblance maximale ).

Donc, grosso modo, cela couvre la plupart des outils d'inférence de base que les textes d'introduction actuels utilisent. En faisant ce travail sur les statistiques, Fisher a abordé des problèmes majeurs en génétique qui font que des gens comme Richard Dawkins l'admirent tellement.

Terminologie

$L_2$ $L_1$ $L_2$ $L_1$ «variance» (dans son article de 1920 Une observation mathématique des méthodes de détermination de la précision de l'observation par l'erreur moyenne et l'erreur quadratique moyenne ).

Fondations

Dans l'article de 1922 sur les fondements mathématiques des statistiques théoriques, Fisher fournit un bref aperçu simple des principaux concepts, pour ne nommer que la liste des définitions: «centre de localisation», «cohérence», «distribution», «efficacité», « estimation »,« précision intrinsèque »,« régions isostatistiques »,« vraisemblance »,« emplacement »,« optimal »,« mise à l'échelle »,« spécification »,« suffisance »,« validité » . Cela demande à un historien de voir ce que Fisher a apporté ici dans le sens d'être à l'origine de concepts, et cela se rapporte également à la déclaration d'Efron. Il est difficile de saisir exactement ce qui est apporté par qui.

Dans cet article, Fisher commence à mentionner le problème de l'application de termes tels que «moyenne» et «variance» à la fois à la vraie valeur de distribution ainsi qu'à la valeur estimée.

(J'essaierai d'éviter de placer Fisher quelque part dans une «école» telle que fréquentiste ou bayésienne. Je dirais qu'il était juste «suffisamment» pratique pour toutes les questions posées).

Concepts avancés

Dans ses travaux ultérieurs, Fisher a développé les premiers concepts de l' analyse discriminante linéaire :

$X=\lambda_1 x_1 + \lambda_2 x_2 + \lambda_3 x_3 + \lambda_4 x_4$

L'utilisation de mesures multiples dans les problèmes taxonomiques, 1936

et le concept d'estimation par probabilité que Fisher a exploré plus avant, et a deux concepts nommés d'après lui, l' information de Fisher et le score de Fisher . Voir Théorie de l'estimation statistique, 1925 , Deux nouvelles propriétés de vraisemblance mathématique, 1934 , et La logique de l'inférence inductive, 1935 .

Plus de liens:

RA Fisher Guide , par John Aldrich. Une énorme source, sinon la plus grande, d'informations sur Fisher, avec de nombreuses autres références.
Réponse de Michael Hardy sur Mathoverflow à une question sur les plus grands mathématiciens: /mathpro//a/173374

Écrit par StackExchangeStrike

— Sextus Empiricus
source

Merci @Martijn! J'ai parcouru votre réponse et fait de petites modifications ici et là, principalement pour rendre le formatage plus clair et pour corriger certaines fautes de frappe. J'espère que cela ne vous dérangera pas. Je suis heureux d'accorder ma générosité à cette réponse; très bonne contribution. C'est particulièrement bien d'avoir toutes ces références.

— amibe dit Reinstate Monica

Pas du tout, de grandes modifications, c'est pourquoi je l'ai fait wiki communautaire. C'est une grande question à laquelle répondre. Même si je suis un grand fan de Fisher et que j'ai parcouru plusieurs de ses articles, je sentais que je n'aurais pas dû répondre à cette question (chargée).

— Sextus Empiricus

J'ai annoncé votre réponse dans notre chat et maintenant je vois qu'elle est devenue la plus votée de ce fil. Je pense que c'est bien mérité.

— amibe dit Réintégrer Monica

Quelques concepts qu'il a inventés: suffisance, efficacité, ANOVA, ancillarité, valeur p et probablement une foule d'autres (surtout conception d'expériences).

La fonction de vraisemblance et les mle avaient des précurseurs, mais ont été popularisés par lui.

— kjetil b halvorsen
source

+1 Alors que Fisher devrait certainement obtenir un crédit à cet égard, le concept de la valeur de p semble avoir existé, au moins de manière informelle, avant le travail de FIsher. Pearson calcule clairement les valeurs de p dans son article de 1900 sur le test de qualité d'ajustement du chi carré, et traite ce qu'il calcule (ne serait-ce que décrit en passant), comme s'il s'agissait d'une chose évidente et acceptée à faire. On a l'impression qu'il n'a pas été vu comme un nouveau concept introduit dans cet article. Bien sûr, des choses similaires pourraient être dites de nombreux concepts ... ils sont souvent "autour" pendant un certain temps avant que quelqu'un ne les formalise.

— Glen_b -Reinstate Monica

Sir Ronald Aylmer Fisher est reconnu pour de nombreux aspects de la conception expérimentale et de la théorie et de la pratique statistiques modernes. Certaines de ses contributions les plus importantes comprennent les tests de signification (Bandyopadhyay et Cherry 2011), l'estimation du maximum de vraisemblance (MLE), les distributions de permutation (ré-échantillonnage), la suffisance, la théorie de l'optimalité asymptotique (Efron 1998), et les composants de conception expérimentale, y compris la randomisation, la réplication, le blocage, la confusion et l'analyse de la variance (ANOVA). Il convient également de noter son affirmation concernant l'expérience de l'usine de pois de Mendel. Il a affirmé que c'était "trop beau pour être vrai".

Pensez à lire ce document d'Efron (1998), "RA Fisher au 21e siècle". Permettez-moi de citer le résumé:

Fisher est la figure la plus importante des statistiques du 20e siècle. Cet exposé examine son influence sur la pensée statistique moderne, essayant de prédire comment Fisherian nous pouvons nous attendre à ce que le 21e siècle soit. La philosophie de Fisher se caractérise par une série de compromis astucieux entre les points de vue bayésien et fréquentiste, augmentés par certaines caractéristiques uniques qui sont particulièrement utiles dans les problèmes appliqués. Plusieurs sujets de recherche actuels sont examinés en tenant compte de l'influence des pêcheurs, ou de son absence, et de ce que cela laisse présager pour les futurs développements statistiques. Basé sur la conférence Fisher de 1996, l'article suit de près le texte de cette conférence.

Les références

Bandyopadhyay, Prasanta S. et Steve Cherry. "Probabilités élémentaires et statistiques: une introduction." Philosophie des statistiques 7 (2011): 53.
Efron, Bradley. " RA Fisher au 21e siècle ." Science statistique (1998): 95-114.

— Jessica Burnett
source

Sa version des tests de signification était une inférence fiduciaire qui a été controversée et n'a pas été acceptée comme la théorie de Neyman-Pearson. D'autres contributions étaient monumentales et faisaient partie des fondements des statistiques.

— Michael R. Chernick

Eh bien, l'inférence fiduciaire semble trouver des fans maintenant. Je note que personne n'a encore mentionné Fisher Information, ni de directives utiles comme «Vous analysez comme votre randomisation».

— Björn

Bjorn - oui, certainement manqué la partie Information Fisher. Probablement parce que j'ai copié ce texte à partir d'un document que je rédige concernant les informations sur les pêcheurs. Ha!

— Jessica Burnett