La question que je veux poser est la suivante: comment la proportion d'échantillons à moins de 1 écart-type de la moyenne d'une distribution normale varie-t-elle à mesure que le nombre de variables augmente?
(Presque) tout le monde sait que dans une distribution normale unidimensionnelle, 68% des échantillons se trouvent dans un écart-type de la moyenne. Et en 2, 3, 4, ... dimensions? Je sais que ça devient moins ... mais de combien (précisément)? Il serait pratique d'avoir un tableau montrant les chiffres pour 1, 2, 3 ... 10 dimensions, ainsi que 1, 2, 3 ... 10 SD. Quelqu'un peut-il pointer vers une telle table?
Un peu plus de contexte - j'ai un capteur qui fournit des données sur jusqu'à 128 canaux. Chaque canal est soumis à un bruit électrique (indépendant). Lorsque je sens un objet d'étalonnage, je peux faire la moyenne d'un nombre suffisant de mesures et obtenir une valeur moyenne sur les 128 canaux, ainsi que 128 écarts-types individuels.
MAIS ... en ce qui concerne les lectures instantanées individuelles, les données ne répondent pas autant à 128 lectures individuelles qu'à une seule lecture d'une quantité vectorielle (jusqu'à) 128 dimensonales. C'est certainement la meilleure façon de traiter les quelques lectures critiques que nous prenons (généralement 4-6 sur 128).
Je veux avoir une idée de ce qui est une variation "normale" et de ce qui est "aberrant" dans cet espace vectoriel. Je suis sûr d'avoir vu un tableau comme celui que j'ai décrit qui s'appliquerait à ce genre de situation - quelqu'un peut-il en indiquer un?