Il peut être inutile de lutter contre les changements de langage. Mais
paramètre ne signifie pas variable
En statistique classique, qui dans ce cas commence précisément par RA Fisher qui a utilisé le terme avec cette signification pour la première fois, un paramètre est une constante inconnue à estimer, par exemple une moyenne de population ou une corrélation. En mathématiques, il existe des significations liées mais non identiques, comme lorsqu'une courbe est donnée de manière paramétrique. Dans de nombreuses sciences, paramètre est simplement un autre mot pour une mesure (elle-même un terme dense de sens mathématique), propriété ou variable, par exemple longueur, conductivité ou porosité ou vertu, selon le cas. Naturellement, la longueur ou la vertu d'un individu est inconnue avant d'être mesurée. mais les personnes qui ont une conscience statistique peuvent être déroutées par son utilisation pour un ensemble de telles mesures. En langage ordinaire ou vulgaire, paramètres(presque toujours pluriel) signifient souvent les limites de quelque chose, disons une relation personnelle ou une politique politique, résultant peut-être d'une confusion originale avec le périmètre . Avec une forte probabilité préalable, il est à présumer que les Bayésiens parleront pour eux-mêmes selon leurs propres usages (clin d'œil reconnaissant à @conjugateprior).
biaisé ne veut pas dire partial
Depuis un siècle ou plus, l'asymétrie a eu un sens statistique spécifique de se référer à l'asymétrie des distributions, qu'elle soit évaluée graphiquement, mesurée numériquement ou supposée théoriquement comme une affaire de foi ou d'espoir. Pendant bien plus longtemps, on peut le deviner, parti pris signifiait se tromper en moyenne, ce qui - tant que nous connaissons la vérité, signifie une valeur vraie ou correcte - peut être quantifié comme une erreur systématique. Tracé dans le langage ordinaire a le sens commun d’être déformé ou déformé, et donc d’être incorrect, erroné et donc également biaisé. Ce sens (pour autant que je l’ai remarqué, ce n’est que récemment) a commencé à filtrer dans les discussions statistiques, de sorte que la signification initiale de l’asymétrie risque d’être floue ou submergée.
corrélation ne signifie pas accord
y=a+bx1−1b≠0y=xa=0,b=1
unique ne signifie pas distinct
Il est assez fréquent de parler des valeurs distinctes de données comme uniques , mais unique , est toujours idéalement mieux préservé en ce sens se produit une seule fois. Je pense que le blâme découle en partie de l'utilitaire Unix [sic] uniq
et de ses imitateurs, qui réduisent les valeurs éventuellement répétées à un ensemble dans lequel chaque valeur est vraiment unique. L'utilisation, sur cette hypothèse, confond l'entrée et la sortie d'un programme. (Inversement, si nous parlons de doublons dans les données, nous nous limitons rarement aux doubletons qui se produisent exactement deux fois. Le terme répliqueaurait plus de sens sur le plan linguistique mais a été préempté pour une réplication délibérée des contrôles dans des expériences; les valeurs de réponse obtenues ne sont généralement pas du tout identiques, ce qui est très utile.)
les échantillons sont rarement répétés
En statistique, un échantillon comprend plusieurs valeurs, et l'échantillonnage répété est une grande vertu théorique, mais rarement pratiquée, sauf par simulation, terme couramment utilisé pour désigner n'importe quel type de falsification in silico . Dans de nombreuses sciences, un échantillon est un objet unique, constitué d’une bosse, d’un morceau d’eau, de sol, de sédiment, de roche, de sang, de tissus ou d’autres substances allant d’attirantes à bénignes à dégoûtantes; loin d’être exceptionnel, la prise de nombreux échantillons peut être indispensable à toute analyse sérieuse. Ici, la terminologie de chaque domaine est parfaitement logique pour ses employés, mais une traduction est parfois nécessaire.
erreur ne signifie généralement pas erreur; comme Harold Jeffreys l'a souligné, le sens premier est erratique, pas erroné.
Néanmoins, nous devrions nous méfier de nos propres péchés ou de nos bizarreries de terminologie:
la régression ne va pas en arrière
stationnaire ne signifie pas immobile ou fixe
la confiance n'a rien à voir avec l'état mental ou psychologique de quiconque
la signification n'a que parfois son sens quotidien
exact est souvent un terme honorifique, faisant référence à une solution ou à un calcul facilement traitable plutôt qu’à un calcul approprié au problème
Les distributions asymétriques vers la droite sont souvent très asymétriques vers la gauche, et inversement
le lognormal est appelé ainsi parce que c'est une normale exponentielle
mais le lognormal est plus normal que la normale
le gaussien a été découvert par De Moivre
Poisson n'a pas découvert le Poisson , encore moins la régression de Poisson
le bootstrap ne vous aidera pas avec vos chaussures
le jackknife ne coupe pas
kurtosis n'est pas une condition médicale
les diagrammes de tiges et de feuilles ne font pas référence aux plantes
une variable muette est utile, pas inutile ou stupide
qui sur Terre (ou n'importe où ailleurs) pense que l' hétéroscédasticité est vraiment un terme préférable à une variabilité inégale ?
robust a maintenant au moins deux significations techniques majeures pour différents groupes, aucun des deux n'empêchant son utilisation fréquente, même dans les discussions techniques, de signifier simplement quelque chose comme "s'estime bien se comporter"
IV a maintenant au moins deux significations principales pour différents groupes
facteur a maintenant au moins deux significations principales pour différents groupes
normaliser et normaliser ont d'innombrables significations (nous devons vraiment normaliser là-bas)
par rapport à décrire un graphique signifie variable verticale par rapport à variable horizontale , sauf si cela signifie le contraire
et (last but not least, pour forger une phrase) les statistiques ont au moins trois significations principales.
Remarques:
Malgré les apparences contraires, je pense que la question est bonne et sérieuse.
Les modes changent. Bien avant le XXe siècle, il semble que beaucoup de gens (pas de nom, pas de foret, mais on pourrait citer Karl Pearson) ne pourraient inventer des termes qu'en cherchant leurs dictionnaires grec et latin. (Il serait injuste de ne pas lui attribuer le mérite du nuage de points .) Cependant, RA Fisher a détourné de nombreux mots anglais préexistants, notamment variance , suffisance , efficacité et vraisemblance . Plus récemment, JW Tukey était un expert dans l'utilisation de termes simples, mais peu de gens devraient ressentir de la détresse devant le fait que sploms et badmandments n'aient pas fait leur chemin .
Un commentaire est basé sur le souvenir de "La vie est [...] multiplicative plutôt qu'additive: la distribution log-normale est plus normale que la normale". Anon 1962. Règles de travail de Bloggins. In Good, IJ (Ed.) Le scientifique spécule: une anthologie d’idées mi-cuites. Londres: Heinemann, 212-213 (citation p.213).