Tout en apprenant à calculer les matrices de covariance et de corrélation et leurs inverses en VB et T-SQL il y a quelques années, j'ai appris que les différentes entrées ont des propriétés intéressantes qui peuvent les rendre utiles dans les bons scénarios d'exploration de données. Un exemple évident est la présence de variances sur les diagonales des matrices de covariance; quelques exemples moins évidents que je n'ai pas encore utilisés, mais qui pourraient être utiles à un moment donné, sont les facteurs d'inflation de la variance dans les matrices de corrélation inverse et les corrélations partielles dans les matrices de covariance inverse.
Une chose que je n'ai pas encore vu directement abordée dans la littérature, cependant, est de savoir comment interpréter les déterminants de ces matrices. Étant donné que les déterminants sont souvent calculés pour d'autres types de matrices, je m'attendais à trouver une multitude d'informations à leur sujet, mais je me suis très peu retrouvé dans les recherches occasionnelles à la fois sur les forums StackExchange et sur le reste d'Internet. La plupart des mentions que j'ai rencontrées tournent autour de l'utilisation des déterminants comme une seule étape dans le processus de calcul d'autres tests et algorithmes statistiques, tels que l'analyse des composants principaux (ACP) et l'un des tests de Hotelling; aucun ne traite directement de la façon d'interpréter ces déterminants, par eux-mêmes. Y a-t-il une raison pratique pour laquelle elles ne sont pas souvent discutées dans la littérature sur l'exploration de données? Plus important, Fournissent-ils des informations utiles de manière autonome et si oui, comment pourrais-je interpréter les déterminants de chacun? Je me rends compte que les déterminants sont un type de volume signé induit par une transformation linéaire, donc je soupçonne que les déterminants de ces déterminants particuliers pourraient signifier une sorte de mesure volumétrique de covariance ou de corrélation, etc. sur un ensemble entier, ou quelque chose à cet effet ( par opposition à la covariance et à la corrélation ordinaires, qui sont entre deux attributs ou variables). Cela soulève également la question du type de volume que leurs inverses représenteraient. Je ne suis pas assez familier avec le sujet ou les mathématiques des matrices lourdes impliquées pour spéculer davantage, mais je suis capable de coder les quatre types de matrices et leurs déterminants. Ma question n'est pas pressante, mais à long terme, je devrai prendre des décisions sur l'opportunité d'inclure régulièrement ces matrices et leurs déterminants dans mes processus d'exploration de données. Il est moins cher de simplement calculer la covariance et la corrélation de manière individuelle et bivariée dans ces langues particulières, mais je vais faire un effort supplémentaire et mettre en œuvre des calculs déterminants si je peux obtenir des informations plus approfondies qui justifient les dépenses en termes de ressources de programmation. Merci d'avance. Je vais aller plus loin et mettre en œuvre des calculs déterminants si je peux en tirer des informations plus approfondies qui justifient les dépenses en termes de ressources de programmation. Merci d'avance. Je vais aller plus loin et mettre en œuvre des calculs déterminants si je peux en tirer des informations plus approfondies qui justifient les dépenses en termes de ressources de programmation. Merci d'avance.