Pourquoi les statistiques paramétriques seraient-elles jamais préférées aux données non paramétriques?


60

Quelqu'un peut-il m'expliquer pourquoi quelqu'un choisirait-il une méthode statistique paramétrique plutôt qu'une méthode statistique non paramétrique pour le test d'hypothèses ou l'analyse de régression?

Dans mon esprit, c'est comme opter pour le rafting et choisir une montre qui ne résiste pas à l'eau, car il se peut que vous ne l' ayez pas mouillé. Pourquoi ne pas utiliser l'outil qui fonctionne à chaque occasion?


21
C'est introduire un biais inductif dans le processus d'inférence statistique. C’est une façon élégante de dire: si vous savez quelque chose, donnez-lui un indice. Cette indication peut prendre des formes telles que fournir la forme fonctionnelle de vraisemblance ou une distribution préalable des paramètres. Si votre indice est bon, le résultat est meilleur que sans indice, et s'il est mauvais, le résultat est pire.
Cagdas Ozgenc

6
Pas nécessairement. Fondamentalement, vous recherchez quelque chose sur un très grand dessert. Si quelqu'un vous dit que ce que vous recherchez est confiné sur un territoire donné, vos chances de le trouver s'améliorent. Mais s'ils vous induisent en erreur avec des informations erronées, peu importe le nombre de recherches effectuées sur ce territoire, vous ne les trouverez pas.
Cagdas Ozgenc

17
En tant que menuisier, j'aime l'analogie à la fin. Les maisons et les meubles bien construits et résistants sont construits à l'aide d'outils spécialisés. Les outils à usage général sont parfaits pour les propriétaires et les professionnels qui ont besoin de travailler rapidement ou qui utilisent un outil brut ou inapproprié ne feront pas une différence de qualité dont n'importe qui se soucie. Les artisans, cependant, obtiennent les meilleurs résultats en utilisant le bon outil, et certaines choses ne peuvent tout simplement pas être accomplies sans lui. Par exemple, personne n'a jamais fait une bonne queue d'aronde avec une scie à main polyvalente.
whuber

3
Que vous creusiez un fossé avec une pelle ou une cuillère à thé, vous vous retrouvez avec un fossé. C'est juste que si vous avez utilisé la cuillère à thé, vous êtes aussi plus vieux.
conjugateprior

Réponses:


25

Rarement, si jamais, un test paramétrique et un test non paramétrique ont réellement la même valeur nulle. Le test paramétrique teste la moyenne de la distribution, en supposant que les deux premiers moments existent. Le test de somme des rangs de Wilcoxon ne suppose aucun moment et teste plutôt l’égalité des distributions. Son paramètre implicite est une fonction bizarre des distributions, la probabilité que l'observation d'un échantillon soit inférieure à l'observation de l'autre. Vous pouvez en quelque sorte parler de comparaisons entre les deux tests sous le null complètement spécifié de distributions identiques ... mais vous devez reconnaître que les deux tests testent des hypothèses différentes.t

Les informations fournies par les tests paramétriques et leur hypothèse permettent d’améliorer la puissance des tests. Bien entendu, ces informations ont intérêt à être exactes, mais il n’existe que très peu de domaines de la connaissance humaine de nos jours où de telles informations préliminaires n’existent pas. Une exception intéressante qui dit explicitement "je ne veux rien présumer" est la salle d'audience où les méthodes non paramétriques continuent d'être très populaires - et cela est parfaitement logique pour l'application. Il y a probablement une bonne raison, Phillip Good, que Phillip Good soit l'auteur de bons livres sur les statistiques non paramétriques et les statistiques d'audience .

Il existe également des situations de test où vous n'avez pas accès aux microdonnées nécessaires au test non paramétrique. Supposons que l'on vous demande de comparer deux groupes de personnes pour déterminer si l'un est plus obèse que l'autre. Dans un monde idéal, vous aurez des mesures de la taille et du poids pour tout le monde et vous pourrez former un test de permutation par stratification en fonction de la hauteur. Dans un monde moins qu'idéal (c.-à-d. Réel), vous pouvez n'avoir que la taille moyenne et le poids moyen de chaque groupe (ou certaines plages ou variations de ces caractéristiques au-dessus de la moyenne de l'échantillon). Votre meilleur choix est alors de calculer l’IMC moyen pour chaque groupe et de les comparer si vous n’avez que les moyens; ou supposons une normale à deux variables pour la taille et le poids si vous avez des moyennes et des variances (vous devrez probablement prendre une corrélation à partir de données externes si elles ne venaient pas avec vos échantillons),


3
Je comprends que dans le cas des tests, vous n’avez pas le même null, bien que je ne sois pas sûr qu’il soit logique de dire qu’un nul vaut mieux qu’un autre nul. Mais qu'en est-il du cas de la prédiction? Une histoire complètement différente, toujours un dilemme paramétrique vs non paramétrique.
en1

22

Comme d'autres l'ont écrit: si les conditions préalables sont remplies, votre test paramétrique sera plus puissant que le test non paramétrique.

Dans votre analogie de montre, le non-résistant à l'eau serait beaucoup plus précis, sauf si elle est mouillée. Par exemple, votre montre résistante à l'eau pourrait être décalée d'une heure dans les deux sens, alors que la montre non résistante à l'eau serait précise ... et vous devez prendre un bus après votre sortie en rafting. Dans un tel cas, il pourrait être judicieux d'emporter avec vous la montre non résistante à l'eau et de vous assurer qu'elle ne soit pas mouillée.


Point bonus: les méthodes non paramétriques ne sont pas toujours faciles. Oui, une alternative de test de permutation à at test est simple. Mais une alternative non paramétrique à un modèle linéaire mixte avec de multiples interactions bidirectionnelles et des effets aléatoires imbriqués est un peu plus difficile à configurer qu’un simple appel à nlme(). Je l’ai fait en utilisant des tests de permutation et, d’après mon expérience, les valeurs p des tests paramétriques et des tests de permutation ont toujours été assez proches les unes des autres, même si les résidus du modèle paramétrique étaient relativement anormaux. Les tests paramétriques sont souvent étonnamment résistants aux écarts par rapport à leurs conditions préalables.


Il semble que l’opinion courante selon laquelle les méthodes paramétriques sont plus puissantes lorsque leurs hypothèses sont remplies. Mais si tel est le cas, alors pourquoi avons-nous des valeurs prédictives pour évaluer les résultats des deux approches? Je veux dire si un test paramétrique rejette une hypothèse nulle avec une probabilité d'au moins 99%, en quoi est-il préférable d'un test non paramétrique qui rejette une hypothèse nulle avec une probabilité de 99%? La probabilité de 0,99 est-elle différente dans chaque cas? Cela n'aurait aucun sens.
en1

1
Les hypothèses nulles sont différentes entre un test paramétrique et son équivalent non paramétrique. En particulier, l'hypothèse nulle d'un test paramétrique contient une hypothèse paramétrique spécifique sur la distribution de la statistique de test (qui sera généralement également calculée de manière différente pour les deux tests) - c'est pourquoi on l'appelle "paramétrique", après tout! Les deux valeurs p ont donc le même nom, mais sont calculées en fonction de différentes statistiques de test, qui ont des distributions différentes sous différentes hypothèses nulles.
S. Kolassa - Réintégrer Monica le


3
@StephanKolassa, j'ai effectivement commencé à écrire un commentaire sur votre réponse et je me suis emporté :)
StasK

12

Bien que je convienne que dans de nombreux cas, les techniques non paramétriques sont favorables, il existe également des situations dans lesquelles les méthodes paramétriques sont plus utiles.

Concentrons-nous sur la discussion "test t à deux échantillons versus test de somme des rangs de Wilcoxon" (sinon nous devons écrire un livre entier).

  1. Avec des groupes minuscules de 2-3, seul le test t peut théoriquement atteindre des valeurs p inférieures à 5%. En biologie et en chimie, les groupes de ce type ne sont pas rares. Bien sûr, il est délicat d’utiliser un test t dans un tel contexte. Mais peut-être que c'est mieux que rien. (Ce point est lié au fait que, dans des circonstances parfaites, le test t a plus de puissance que le test de Wilcoxon).
  2. Avec des tailles de groupe énormes, un test t peut également être considéré comme non paramétrique grâce au théorème de la limite centrale.
  3. Les résultats du test t correspondent à l'intervalle de confiance de Student pour la différence moyenne.
  4. Si les écarts varient fortement d’un groupe à l’autre, la version du test t de Welch tente de prendre cela en compte, tandis que le test de Wilcoxon peut échouer si les moyennes doivent être comparées (par exemple, une probabilité d’erreur du premier type très différente du niveau nominal). ).

2
Je ne suis pas d'accord avec 1. Utiliser simplement une procédure parce que cela vous permet de prendre une décision n'est pas vraiment une bonne raison, surtout quand vous n'avez aucune raison de vous attendre à ce que cette procédure soit valide. Si vous avez peu ou pas de données, alors faites votre jugement et ne prétendez pas que cela repose sur la rigueur.
Dsaxton

5
Je suis d'accord avec toi. C'est clairement l'une des raisons pour lesquelles les résultats ne sont souvent pas reproductibles, même s'ils sont publiés dans les revues les mieux classées. Mais quelles options avez-vous en tant que chercheur si le budget ne permet que des échantillons de petite taille?
Michael M

1
En ce qui concerne le problème 4 et les problèmes d'application de Wilcoxon-Mann-Whitney lorsqu'il existe des variances inégales entre les groupes, il existe des méthodes non paramétriques qui permettent l'hétéroscédasticité: il me semble rappeler le test de Cliff ou le test de Brunner-Munzel, par exemple. (Je ne pense pas que nous ayons beaucoup d'informations à leur sujet sur ce site.)
Silverfish

@ Silverfish: J'utilise fréquemment les méthodes de Brunner et je pense que vous avez raison. Mais je doute qu'ils comparent réellement les moyens sauf en partant de fortes hypothèses de répartition.
Michael M

1
@MichaelM Oui bien sûr - cela nous ramène à la question des méthodes paramétriques et non paramétriques ayant différentes hypothèses, je suppose.
Silverfish

9

Dans les tests d'hypothèses, les tests non paramétriques testent souvent différentes hypothèses, ce qui explique pourquoi on ne peut pas toujours substituer un test non paramétrique à un test paramétrique.

yXFFF(X)=Σj=1pβjXj


Oui, et cela ajoute un biais de modèle. Qu'est-ce que cela dit à propos des rapports p-chercheurs rapportés?
Cagdas Ozgenc

@dsaxton dit ce que vous dites à propos du test de différentes hypothèses, mais les gens les interprètent toujours de la même manière. Il y a aussi la régression, où les informations que vous obtenez entre analyses non paramétriques et paramétriques sont à peu près les mêmes.
en1

@ cagdas-ozgenc Il vous indique que les valeurs p sont conditionnelles au modèle. Mais on ne sait pas comment les choses pourraient être autrement ...
conjugateprior

3
+1 pour noter que nous n'avons aucune chance d'estimer quoi que ce soit de valeur dans une régression sans quelques hypothèses sur la fonction de régression.
conjugateprior

9

Les modèles semi-paramétriques présentent de nombreux avantages. Ils proposent des tests tels que le test de Wilcoxon comme cas particulier, mais permettent d’estimer les ratios d’effet, les quantiles, les moyennes et les probabilités de dépassement. Ils s'étendent aux données longitudinales et censurées. Ils sont robustes dans l'espace Y et invariants de la transformation, sauf pour l'estimation des moyennes. Voir http://biostat.mc.vanderbilt.edu/rms un lien vers la documentation du cours pour un exemple détaillé / une étude de cas.

tYYXX1X2. Les exemples incluent le modèle de probabilité proportionnelle (cas particulier: Wilcoxon et Kruskal-Wallis) et le modèle de risque proportionnel (cas particulier: le test log-rank et le test log-rank stratifié).

Y


1
J'ai eu du mal avec celui-ci un peu. Considérez-vous que le test t est semi-paramétrique ou non paramétrique? D’une part, j’ai toujours supposé que le «principe» des semi-paramétriques était le suivant: prendre un modèle de probabilité «fonctionnel» pour les données, estimer les paramètres de cette distribution, que la distribution soit correcte ou non, et améliorer l’estimation de l’erreur tenir compte de l'incertitude. (Donc, les erreurs basées sur les sandwichs pour les solutions aux équations du score de Gauss seraient un test t semi-paramétrique). Cependant, les semi-paramétriques impliquent presque toujours la partialisation / conditionnement, comme avec les modèles de Cox.
AdamO

Je vais ajouter plus de description à ma réponse pour traiter de cela.
Frank Harrell

6

Parmi la multitude de réponses fournies, je voudrais également attirer l'attention sur les statistiques bayésiennes. Certains problèmes ne peuvent pas être résolus uniquement par des probabilités. Un Frequentist utilise un raisonnement contrefactuel dans lequel la "probabilité" fait référence à des univers alternatifs et un cadre d'univers alternatifs n'a pas de sens pour inférer l'état d'un individu, tel que la culpabilité ou l'innocence d'un criminel, ou le goulot d'étranglement de la fréquence des gènes les espèces exposées à un changement environnemental massif ont conduit à son extinction. Dans le contexte bayésien, la probabilité est une "croyance" et non une fréquence, qui peut être appliquée à celle qui a déjà précipité.

Maintenant, la majorité des méthodes bayésiennes nécessitent de spécifier pleinement des modèles de probabilité pour le précédent et le résultat. Et, la plupart de ces modèles de probabilité sont paramétriques. Conformément à ce que disent d'autres personnes, il n'est pas nécessaire que ces informations soient exactement correctes pour produire des résumés significatifs des données. "Tous les modèles sont faux, certains modèles sont utiles."

Il existe bien sûr des méthodes bayésiennes non paramétriques. Celles-ci ont beaucoup de rides statistiques et, en général, nécessitent une utilisation précise de données démographiques complètes.


6

La seule raison pour laquelle je réponds malgré toutes les bonnes réponses ci-dessus est que personne n’a attiré l’attention sur la première raison pour laquelle nous utilisons des tests paramétriques (du moins dans l’analyse des données de physique des particules). Parce que nous connaissons la paramétrisation des données. Duh! C'est un gros avantage. Vous résumez vos centaines, milliers et millions de points de données dans les quelques paramètres qui vous intéressent et décrivez votre distribution. Celles-ci vous indiquent la physique sous-jacente (ou tout ce que la science vous communique).

Bien sûr, si vous n’avez aucune idée de la densité de probabilité sous-jacente, vous n’avez pas le choix: utilisez des tests non paramétriques. Les tests non paramétriques ont l'avantage de ne comporter aucun parti pris préconçu, mais peuvent être plus difficiles à mettre en œuvre - parfois beaucoup plus difficiles.


5

La statistique non paramétrique a ses propres problèmes! L’un d’eux est l’accent mis sur les tests d’hypothèses, nous avons souvent besoin d’estimations et d’intervalles de confiance, et leur utilisation dans des modèles compliqués avec des paramètres non paramétriques est - compliquée. Il existe un très bon article sur ce blog, avec discussion, à l' adresse http://andrewgelman.com/2015/13/13/dont-do-the-wilcoxon/. La discussion mène à cet autre article, http: // notstatschat. tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-test , recommandé pour un point de vue très différent sur Wilcoxon. La version courte est la suivante: le test de Wilcoxon (et d’autres tests de rangs) peut entraîner une non-transitivité.


4
Je ne suis pas sûr que la transitivité soit la fin en soi. Et vous pouvez inverser le test de Wilcoxon pour obtenir un intervalle de confiance très robuste et utile pour les estimateurs de localisation.
Frank Harrell

2
La non-transitivité a ses points forts dans la modélisation causale, mais pour de simples tests d'association sur deux échantillons, je ne pense pas que ce soit vraiment un problème. De plus, je ne vois pas les différences entre les méthodes de test / estimation / estimation / intervalle de confiance des hypothèses entre les méthodes non paramétriques et paramétriques. Parfois, avec une estimation robuste, vous utilisez un modèle de probabilité de travail de sorte que l'estimation paramétrique correspondante fournisse un résumé significatif des données (même s'il ne s'agit pas du modèle de probabilité approprié en soi). Peut-être que vous pouvez développer cette réponse?
AdamO

2
En règle générale, le test de Wilcoxon contient certaines hypothèses supplémentaires, telles que la dominance stochastique d'un groupe par rapport à l'autre, qui, si elles sont vraies, permettent de rétablir la transitivité.
Scortchi - Réintégrer Monica

3

Je dirais que les statistiques non paramétriques sont plus généralement applicables en ce sens qu'elles supposent moins d'hypothèses que les statistiques paramétriques.

Néanmoins, si l’on utilise une statistique paramétrique et que les hypothèses sous-jacentes sont remplies, les statistiques paramatriques seront alors plus puissantes que les statistiques non paramétriques.


2

Les statistiques paramétriques sont souvent des moyens d’incorporer des connaissances externes [aux données]. Par exemple, vous savez que la distribution des erreurs est normale et que cette connaissance provient d'une expérience antérieure ou d'une autre considération et non de l'ensemble de données. Dans ce cas, en supposant une distribution normale, vous intégrez cette connaissance externe à vos estimations de paramètres, ce qui doit améliorer vos estimations.

Sur votre analogie montre. De nos jours, presque toutes les montres sont résistantes à l'eau, à l'exception des pièces spéciales avec des bijoux ou des matériaux inhabituels comme le bois. La raison pour les porter est précisément cela: ils sont spéciaux. Si vous voulez dire résistant à l'eau, de nombreuses montres habillées ne le sont pas. La raison de les porter est encore une fois leur fonction: vous ne porteriez pas une montre de plongée avec une suite et une cravate. De plus, ces dernières années, de nombreuses montres se sont ouvertes afin que vous puissiez regarder le mouvement à travers le cristal. Naturellement, ces montres ne sont généralement pas étanches.


1
J'aime cette métaphore! Je me souviens qu'un professeur nous a dit que nous devrions essayer différentes méthodes statistiques sur la même chose pour voir si nous pouvons obtenir les mêmes résultats.
Deep North

2

Ce n'est pas un scénario de test d'hypothèse, mais il peut constituer un bon exemple pour répondre à votre question: considérons l'analyse en grappes. Il existe de nombreuses méthodes de clustering "non paramétriques" telles que le clustering hiérarchique, K-means, etc., mais le problème est toujours de savoir si votre solution de clustering est "meilleure" que d'autres solutions possibles (et il existe souvent de multiples solutions possibles). . Chaque algorithme vous donne le meilleur qu’il peut obtenir, mais comment savoir s’il n’ya rien de mieux ..? Maintenant, il existe également des approches paramétriques de la mise en grappe, dite de la mise en grappe basée sur un modèle, comme les modèles de mélange finis. Avec FMM, vous construisez un modèle statistique décrivant la distribution de vos données et l’adaptez-vous à ces données. Lorsque vous avez votre modèle, vous pouvez évaluer la probabilité de vos données avec ce modèle, vous pouvez utiliser des tests de rapport de vraisemblance, comparer les AIC et utiliser plusieurs autres méthodes pour vérifier l'ajustement du modèle et la comparaison de modèles. Les algorithmes de classification non paramétriques ne font que regrouper des données en utilisant des critères de similarité, tandis que l'utilisation de FMM vous permet de décrire et de comprendre vos données, de vérifier son exactitude, de faire des prédictions ... Dans la pratique, les approches non paramétriques sont simples: travaillez bien que bien que les FMM soient problématiques, les approches basées sur des modèles fournissent souvent des résultats plus riches.


2

Les prévisions et les prévisions basées sur de nouvelles données sont souvent très difficiles, voire impossibles, pour les modèles non paramétriques. Par exemple, je peux prévoir le nombre de demandes de garantie pour les 10 prochaines années à l'aide d'un modèle de survie Weibull ou Lognormal, mais cela n'est pas possible avec le modèle de Cox ou Kaplan-Meier.

Edit: Laissez-moi être un peu plus clair. Si une entreprise a un produit défectueux, elle est souvent intéressée par la projection du taux de demande de garantie futur et du CDF en fonction des demandes de garantie actuelles et des données de vente. Cela peut les aider à décider si un rappel est nécessaire ou non. Je ne sais pas comment vous faites cela en utilisant un modèle non paramétrique.


7
Je ne suis pas d'accord. Vous pouvez utiliser un modèle de Cox pour estimer les quantiles, la moyenne (si la valeur Y la plus élevée n'est pas censurée) et toutes sortes de probabilités. Ne pas être en mesure de prévoir au-delà de la plage des données est un problème (comme vous l'avez mentionné), mais vous pourriez être en train d'extrapoler dangereusement.
Frank Harrell

@ FrankHarrell Oui bon point, il faut toujours faire attention lors de l'extrapolation.
Glen

Qu'en est-il de Random Forest, Deep Learning ou SVM? Ils ont battu la plupart, sinon toutes les méthodes paramétriques pour la prédiction.
en1

2
Sauf essayer et faire un arbre de décision apprendre une frontière diagonale
bill_e

1

Je crois honnêtement qu'il n'y a pas de bonne réponse à cette question. À en juger par les réponses données, le consensus est que les tests paramétriques sont plus puissants que les équivalents non paramétriques. Je ne contesterai pas ce point de vue, mais je le vois davantage comme un point de vue hypothétique que factuel, car ce n’est pas enseigné explicitement dans les écoles et aucun relecteur ne vous dira jamais "votre article a été rejeté parce que vous avez utilisé des tests non paramétriques". Cette question concerne un sujet auquel le monde des statistiques est incapable de répondre clairement, mais qu’il tient pour acquis.

Mon opinion personnelle est que la préférence de paramétrique ou non paramétrique a plus à voir avec la tradition qu'autre chose (faute d'un meilleur terme). Les techniques paramétriques de test et de prédiction existaient en premier et ont une longue histoire. Il n'est donc pas facile de les ignorer complètement. Prediction, en particulier, propose d’impressionnantes solutions non paramétriques qui sont largement utilisées de nos jours comme outil de premier choix. Je pense que c'est l'une des raisons pour lesquelles les techniques d'apprentissage automatique telles que les réseaux de neurones et les arbres de décision, qui ne sont pas paramétriques par nature, sont devenues très populaires ces dernières années.


3
3/π95%

«Consensus» signifie «accord général», pas mon point de vue personnel.
Digio

2
Je ne faisais pas allusion à la question de savoir si la déclaration reflétait votre point de vue personnel ou la sagesse collective des autres, mais souligniez que la déclaration n’est correcte que si les conditions nécessaires à un test paramétrique sont vraies . Lorsque les conditions ne sont pas remplies, il se peut que "les tests paramétriques ne soient pas plus puissants que les tests non paramétriques" et que l'inverse puisse être le cas (parfois avec une très grande marge).
Silverfish

Touché! ..... +1
Digio

0

C'est une question de puissance statistique. Les tests non paramétriques ont généralement une puissance statistique inférieure à celle de leurs homologues paramétriques.


6
Les tests paramétriques auront plus de puissance lorsque leurs hypothèses seront satisfaites. Lorsque leurs hypothèses ne sont pas satisfaites, les tests non paramétriques peuvent être plus puissants.
gung - Rétablir Monica

3
Cette réponse est très courte, et le pouvoir a été discuté dans les réponses précédentes. Souhaitez-vous envisager de l'élargir un peu?
Scortchi - Réintégrer Monica

4
Le gain de puissance résultant des tests paramétriques est minime par rapport à la perte de puissance qu’ils subissent lorsque leurs hypothèses ne sont pas respectées.
Frank Harrell

Frank, cela dépend du test, certains tests sont plus robustes aux violations de leurs hypothèses.
Modèle caché de Markov

0

Beaucoup de bonnes réponses déjà, mais il y a des raisons que je n'ai pas vu mentionnées:

  1. Familiarité. Selon votre public cible, le résultat paramétrique peut être beaucoup plus familier qu'un résultat non paramétrique à peu près équivalent. Si les deux donnent des conclusions similaires, la familiarité est bonne.

  2. Simplicité. Parfois, le test paramétrique est plus simple à réaliser et à rapporter. Certaines méthodes non paramétriques sont très gourmandes en ordinateur. Bien sûr, les ordinateurs sont devenus beaucoup plus rapides et les algorithmes se sont également améliorés, mais ... les données sont devenues "plus volumineuses".

    1. Parfois, ce qui est généralement un inconvénient du test paramétrique est en fait un avantage, bien que cela soit spécifique à des paires de tests particulières. Par exemple, je suis généralement un partisan de la régression quantile car elle repose sur moins d'hypothèses que les méthodes habituelles. Mais parfois, vous devez vraiment estimer la moyenne plutôt que la médiane.
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.