Les analyses chimiques d'échantillons environnementaux sont souvent censurées ci-dessous aux limites de déclaration ou à diverses limites de détection / quantification. Ces dernières peuvent varier, généralement proportionnellement aux valeurs des autres variables. Par exemple, un échantillon avec une concentration élevée d'un composé pourrait devoir être dilué pour l'analyse, ce qui entraînerait une inflation proportionnelle des limites de censure pour tous les autres composés analysés en même temps dans cet échantillon. Comme autre exemple, parfois la présence d'un composé peut modifier la réponse du test à d'autres composés (une «interférence matricielle»); lorsque cela est détecté par le laboratoire, il gonfle ses limites de déclaration en conséquence.
Je cherche un moyen pratique d'estimer la matrice variance-covariance pour de tels ensembles de données, en particulier lorsque de nombreux composés subissent une censure supérieure à 50%, ce qui est souvent le cas. Un modèle de distribution conventionnel est que les logarithmes des (vraies) concentrations sont distribués multinormalement, et cela semble bien cadrer dans la pratique, donc une solution à cette situation serait utile.
(Par "pratique", j'entends une méthode qui peut être codée de manière fiable dans au moins un environnement logiciel généralement disponible comme R, Python, SAS, etc., d'une manière qui s'exécute assez rapidement pour prendre en charge des recalculs itératifs tels que ceux qui se produisent lors d'une imputation multiple, et qui est raisonnablement stable [c'est pourquoi je suis réticent à explorer une implémentation de BUGS, bien que les solutions bayésiennes en général soient les bienvenues].)
Merci d'avance pour vos réflexions à ce sujet.