Les réponses de Robert et Bey donnent une partie de l'histoire (c'est-à-dire que les moments ont tendance à être considérés comme des propriétés de base des distributions, et l'écart-type conventionnel est défini en termes de deuxième moment central plutôt que l'inverse), mais dans quelle mesure ces les choses sont vraiment fondamentales dépend en partie de ce que nous entendons par le terme.
Il n'y aurait pas de problème insurmontable, par exemple, si nos conventions allaient dans l'autre sens - rien ne nous empêche de définir conventionnellement une autre séquence de quantités à la place des moments habituels, disons pour (notez que s'inscrit à la fois dans la séquence des moments et celle-ci en tant que premier terme) puis définissez les moments - et toutes sortes de calculs par rapport à moments - en termes d'entre eux. Notez que ces quantités sont toutes mesurées dans les unités d'origine, ce qui est un avantage par rapport aux moments (qui sont en puissances des unités d'origine, et donc plus difficiles à interpréter). Cela ferait de l'écart type de la population la quantité et la variance définies en fonction de celui-ci.E[ ( X- μ )p]1 / pp = 1 , 2 , 3 , . . .μp
Cependant, cela rendrait les quantités comme la fonction de génération de moment (ou un équivalent relatif aux nouvelles quantités définies ci-dessus) moins "naturelles", ce qui rendrait les choses un peu plus gênantes (mais certaines conventions sont un peu comme ça). Il y a des propriétés pratiques du MGF qui ne seraient pas aussi pratiques dans l'autre sens.
Plus fondamental, à mon avis (mais en relation avec lui), il existe un certain nombre de propriétés de variance de base qui sont plus pratiques lorsqu'elles sont écrites en tant que propriétés de variance que lorsqu'elles sont écrites en tant que propriétés d'écart type (par exemple, la variance des sommes d'indépendant variables aléatoires est la somme des variances).
Cette additivité est une propriété qui n'est pas partagée par d'autres mesures de dispersion et elle a un certain nombre de conséquences importantes.
[Il existe des relations similaires entre les autres cumulants, c'est donc un sens dans lequel nous pourrions vouloir définir les choses par rapport aux moments plus généralement.]
Toutes ces raisons sont sans doute soit conventionnelles, soit pratiques, mais dans une certaine mesure, c'est une question de point de vue (par exemple, à certains points de vue, les moments sont des quantités assez importantes, d'autres ne le sont pas du tout). Il se peut que le bit "à un niveau profond" soit destiné à n'impliquer rien de plus que celui de kjetil "lors du développement de la théorie".
Je suis d'accord avec l'argument de kjetil que vous avez soulevé dans votre question; dans une certaine mesure, cette réponse est simplement une discussion à la main.