Dans des exemples comme le vôtre lorsque les données diffèrent simplement de manière additive, c'est-à-dire que nous ajoutons une constante à tout, alors que vous signalez que l'écart-type est inchangé, la moyenne est modifiée exactement par cette constante, et donc le coefficient de variation change de to , ce qui n'est ni intéressant ni utile.σ / μ σ / ( μ + k )kσ/ μσ/ (μ+k)
C'est le changement multiplicatif qui est intéressant et où le coefficient de variation a une certaine utilité. Car tout multiplier par une constante implique que le coefficient de variation devient , c'est-à-dire qu'il reste le même qu'auparavant. Le changement d'unités de mesure en est un exemple, comme dans les réponses de @Aksalal et @Macond.k σ / k μkk σ/ kμ
Comme le coefficient de variation est sans unité, il en est de même sans dimension, car toutes les unités ou dimensions possédées par la variable sous-jacente sont éliminées par la division. Cela fait du coefficient de variation une mesure de la variabilité relative , de sorte que la variabilité relative des longueurs peut être comparée à celle des poids, etc. Un domaine où le coefficient de variation a trouvé une utilisation descriptive est la morphométrie de la taille des organismes en biologie.
En principe et dans la pratique, le coefficient de variation n'est défini complètement et pas du tout utile pour les variables entièrement positives. Par conséquent, en détail, votre premier échantillon avec une valeur de n'est pas un exemple approprié. Une autre façon de voir cela est de noter que si la moyenne était toujours nulle, le coefficient serait indéterminé et si la moyenne était toujours négative, le coefficient serait négatif, en supposant dans ce dernier cas que l'écart-type est positif. Dans les deux cas, la mesure deviendrait inutile en tant que mesure de la variabilité relative, voire à toute autre fin. 0
Une déclaration équivalente est que le coefficient de variation n'est intéressant et utile que si les logarithmes sont définis de la manière habituelle pour toutes les valeurs, et en effet, l'utilisation de coefficients de variation équivaut à examiner la variabilité des logarithmes.
Bien que cela puisse sembler incroyable aux lecteurs ici, j'ai vu des publications climatologiques et géographiques dans lesquelles les coefficients de variation des températures en degrés Celsius ont intrigué les scientifiques naïfs qui notent que les coefficients peuvent exploser lorsque les températures moyennes approchent de C et deviennent négatives pour températures moyennes inférieures à zéro. Encore plus bizarrement, j'ai vu des suggestions que le problème est résolu en utilisant Fahrenheit à la place. Inversement, le coefficient de variation est souvent mentionné correctement comme une mesure récapitulative définie si et seulement si les échelles de mesure sont qualifiées d'échelle de rapport. En l'occurrence, le coefficient de variation n'est pas particulièrement utile même pour des températures mesurées en degrés kelvin, mais pour des raisons physiques plutôt que mathématiques ou statistiques.0∘
Comme dans le cas des exemples bizarres de climatologie, que je laisse sans référence car les auteurs ne méritent ni le crédit ni la honte, le coefficient de variation a été sur-utilisé dans certains domaines. Il y a parfois une tendance à le considérer comme une sorte de mesure récapitulative magique qui résume à la fois l'écart moyen et l'écart type. Il s'agit d'une pensée naturellement primitive, car même lorsque le rapport est logique, la moyenne et l'écart-type ne peuvent pas être récupérés.
En statistique, le coefficient de variation est un paramètre assez naturel si la variation suit le gamma ou la log-normale, comme on peut le voir en examinant la forme du coefficient de variation pour ces distributions.
Bien que le coefficient de variation puisse être d'une certaine utilité, dans les cas où il s'applique, l'étape la plus utile consiste à travailler à l'échelle logarithmique, soit par transformation logarithmique, soit en utilisant une fonction de lien logarithmique dans un modèle linéaire généralisé.
EDIT: Si toutes les valeurs sont négatives, alors nous pouvons considérer le signe comme juste une convention qui peut être ignorée. De manière équivalente dans ce cas,est en fait un jumeau identique de coefficient de variation.σ/ | μ |