Existe-t-il un test statistique paramétrique et non paramétrique? Cette question a été posée par un panel d'entrevues. Est-ce une question valable?
Existe-t-il un test statistique paramétrique et non paramétrique? Cette question a été posée par un panel d'entrevues. Est-ce une question valable?
Réponses:
Il est fondamentalement difficile de dire exactement ce que l'on entend par "test paramétrique" et "test non paramétrique", bien qu'il existe de nombreux exemples concrets où la plupart conviendront si un test est paramétrique ou non paramétrique (mais jamais les deux) . Une recherche rapide a donné ce tableau , qui, j'imagine, représente une distinction pratique courante dans certains domaines entre les tests paramétriques et non paramétriques.
Juste au-dessus du tableau auquel il est fait référence, il y a une remarque:
"... les données paramétriques ont une distribution normale sous-jacente ... Tout le reste est non paramétrique."
Il peut être un critère accepté dans certains domaines que soit nous supposons la normalité et utilisons l'ANOVA, et c'est paramétrique, soit nous n'assumons pas la normalité et n'utilisons pas d'alternatives non paramétriques.
Ce n'est peut-être pas une très bonne définition, et ce n'est pas vraiment correct à mon avis, mais c'est peut-être une règle pratique. Principalement parce que le but ultime des sciences sociales, par exemple, est d'analyser les données, et à quoi sert-il de pouvoir formuler un modèle paramétrique basé sur une distribution non normale et ensuite de ne pas pouvoir analyser les données?
Une autre définition consiste à définir les "tests non paramétriques" comme des tests qui ne reposent pas sur des hypothèses de distribution et des tests paramétriques comme autre chose.
La première ainsi que la dernière définition présentées définissent une classe de tests, puis définissent l'autre classe comme le complément (toute autre chose). Par définition, cela exclut qu'un test puisse être aussi bien paramétrique que non paramétrique.
La vérité est que cette dernière définition est également problématique. Que se passe-t-il s'il existe certaines hypothèses naturelles «non paramétriques», telles que la symétrie, qui peuvent être imposées? Cela transformera-t-il une statistique de test qui ne repose autrement sur aucune hypothèse de distribution en un test paramétrique? La plupart diraient non!
Il existe donc des tests dans la classe des tests non paramétriques qui sont autorisés à faire des hypothèses de distribution tant qu'ils ne sont pas «trop paramétriques». La frontière entre les tests "paramétriques" et "non paramétriques" est devenue floue, mais je pense que la plupart des gens soutiendront que soit un test est paramétrique, soit non paramétrique, peut-être ne peut-il être ni l'un ni l'autre, mais en disant qu'il est à la fois n'a pas de sens.
Dans une optique différente, de nombreux tests paramétriques sont (équivalents à) des tests de rapport de vraisemblance. Cela rend possible une théorie générale et nous avons une compréhension unifiée des propriétés distributionnelles des tests de rapport de vraisemblance dans des conditions de régularité appropriées. Les tests non paramétriques ne sont pas, au contraire, équivalents aux tests de rapport de vraisemblance en soi il n'y a pas de probabilité - et sans la méthodologie unificatrice basée sur la probabilité que nous devons dériver des résultats de distribution au cas par cas. La théorie de la vraisemblance empiriquedéveloppé principalement par Art Owen à Stanford est cependant un compromis très intéressant. Il offre une approche statistique basée sur la probabilité (un point important pour moi, car je considère la probabilité comme un objet plus important qu'une valeur , par exemple) sans avoir besoin d'hypothèses de distribution paramétriques typiques. L'idée fondamentale est une utilisation intelligente de la distribution multinomiale sur les données empiriques, les méthodes sont très "paramétriques" mais valables sans restreindre les hypothèses paramétriques.
Les tests basés sur la vraisemblance empirique ont, à mon humble avis, les vertus des tests paramétriques et la généralité des tests non paramétriques, donc parmi les tests auxquels je peux penser, ils se rapprochent le plus pour être paramétriques et non paramétriques, même si je le ferais pas utiliser cette terminologie.
Paramétrique est utilisé dans (au moins) deux sens: A - Pour déclarer que vous supposez la famille de la distribution du bruit jusqu'à ses paramètres. B - Pour déclarer que vous supposez la relation fonctionnelle spécifique entre les variables explicatives et le résultat.
Quelques exemples:
Le terme "semi-paramétrique" se réfère généralement au cas B et signifie que vous n'assumez pas toute la relation fonctionnelle, mais plutôt que vous avez des hypothèses plus douces telles que "additif dans une certaine transformation en douceur des prédicteurs".
Vous pouvez également avoir des hypothèses plus douces sur la distribution du bruit, telles que "tous les moments sont finis", sans spécifier spécifiquement la forme de la distribution. À ma connaissance, il n'y a pas de terme pour ce type d'hypothèse.
Notez que la réponse se rapporte aux hypothèses sous-jacentes au processus de génération de données. Quand on dit "test a-paramétrique", on se réfère généralement à non-paramétrique dans le sens A. Dans ce que vous vouliez dire, je répondrais "non". Il serait impossible d'être paramétrique et non paramétrique dans le même sens en même temps.
Je suppose que cela dépend de ce qu'ils entendent par «paramétrique et non paramétrique»? En même temps exactement les deux, ou un mélange des deux?
Beaucoup considèrent le modèle de risques proportionnels de Cox comme semi-paramétrique, car il n'évalue pas paramétriquement le danger de base.
Ou vous pouvez choisir d'afficher de nombreuses statistiques non paramétriques comme réellement paramétriques massivement.
Bradley, dans ses tests statistiques sans distribution classiques (1968, p. 15-16 - voir cette question pour une citation) clarifie la différence entre les tests sans distribution et les tests non paramétriques , qui, selon lui, sont souvent confondus et donne une exemple d'un test paramétrique sans distribution comme test de signe pour la médiane. Ce test ne fait aucune hypothèse sur la distribution sous-jacente de la population échantillonnée de valeurs variables, il est donc sans distribution . Cependant, si la médiane sélectionnée est correcte, les valeurs au-dessus et en dessous devraient être sélectionnées à probabilité égale, en testant des échantillons aléatoires à partir de
Mise à jour