Quelles sont les techniques statistiques pour créer un ensemble d'échantillons représentatif de l'ensemble de la population (avec un niveau de confiance connu)?
Aussi,
- Comment valider, si l'échantillon correspond à l'ensemble de données global?
- Est-ce possible, sans analyser l'ensemble de données entier (qui pourrait être des milliards d'enregistrements)?