Ces valeurs sont pour les bases de données. Il y a longtemps et la plupart des bases de données, la plupart des bases de données allouaient un nombre fixe de chiffres aux données à valeurs entières. Un nombre comme -999 est le plus petit qui peut être stocké dans quatre caractères, -9999 en cinq caractères, etc.
(Il va sans dire que, par définition, un champ numérique ne peut pas stocker de caractères alphanumériques tels que "NA". Un code numérique doit être utilisé pour représenter des données manquantes ou non valides.)
Pourquoi utiliser le nombre le plus négatif qui puisse être stocké pour indiquer une valeur manquante? Parce que si vous le traitez par erreur comme un nombre valide, vous voulez que les résultats soient radicalement incorrects. Plus vos codes pour les valeurs manquantes deviennent réalistes, plus vous êtes en sécurité, car une entrée extrêmement erronée déforme généralement la sortie. (Les méthodes statistiques robustes sont des exceptions notables!)
Comment une telle erreur pourrait-elle arriver? Cela se produit tout le temps lorsque les données sont échangées entre les systèmes. Un système qui suppose que -9999 représente une valeur manquante l’affiche automatiquement lorsque vous écrivez les données dans la plupart des formats, tels que CSV. Le système qui lit ce fichier CSV peut ne pas "savoir" (ou ne pas être "informé") pour traiter de telles valeurs comme manquantes.
Une autre raison est que de bonnes données statistiques et des plates-formes informatiques reconnaissent de nombreux types de valeurs manquantes: NaN, véritablement valeurs manquantes, débordements, débordements, non-réponses, etc., en consacrant les valeurs les plus négatives possibles (telles que -9999, - 9998, -9997, etc.), vous facilitez l’interrogation de toutes les valeurs manquantes dans une table ou un tableau.
Une autre encore est que de telles valeurs apparaissent généralement dans les affichages graphiques comme des valeurs extrêmes extrêmes. Parmi toutes les valeurs que vous pouvez choisir de distinguer dans un graphique, la plus négative possible présente les plus grandes chances de vous éloigner de vos données.
Il y a des implications et des généralisations utiles:
−10303
Adoptez une règle standard de ce type pour faciliter l’invention des codes NoData dans de nouvelles circonstances (lorsque vous concevez votre propre logiciel de base de données).
Concevez vos logiciels et vos systèmes de manière à ce qu’ils échouent de manière dramatique. Les pires insectes sont ceux qui sont intermittents, aléatoires ou minuscules, car ils peuvent rester non détectés et être difficiles à traquer.