Pourquoi les statisticiens ont-ils défini des matrices aléatoires?


18

J'ai étudié les mathématiques il y a dix ans, j'ai donc une formation en mathématiques et en statistiques, mais cette question me tue.

Cette question est encore un peu philosophique pour moi. Pourquoi les statisticiens ont-ils développé toutes sortes de techniques pour travailler avec des matrices aléatoires? Je veux dire, un vecteur aléatoire n'a-t-il pas résolu le problème? Sinon, quelle est la moyenne des différentes colonnes d'une matrice aléatoire? Anderson (2003, Wiley) considère un vecteur aléatoire comme un cas particulier d'une matrice aléatoire avec une seule colonne.

Je ne vois pas l'intérêt d'avoir des matrices aléatoires (et je suis sûr que c'est parce que je suis ignorant). Mais, restez avec moi. Imaginez que j'ai un modèle avec 20 variables aléatoires. Si je veux calculer la fonction de probabilité conjointe, pourquoi devrais-je les représenter comme une matrice au lieu d'un vecteur?

Qu'est-ce que je rate?

ps: je suis désolé pour la question mal taguée, mais il n'y avait pas de tags pour random-matrix et je ne peux pas en créer un pour le moment!

modifier: changé la matrice en matrices dans le titre


1
Je pense que vous êtes bien en train de penser conceptuellement à cela comme un vecteur aléatoire qui a été réorganisé de sorte qu'il soit matriciel.
Matthew Gunn du


9
Vous pourriez tout aussi bien vous demander pourquoi les matrices sont intéressantes. Il est parfaitement naturel de considérer comme aléatoire toute matrice utilisée pour représenter un phénomène observé ou mesuré dans le monde réel. Il en résulte une pléthore de types et de modèles possibles pour les matrices aléatoires, allant des matrices d'adjacence des graphiques aléatoires aux échantillons de matrices de covariance et plus encore.
whuber

2
@Aksakal Je pense que le point du PO est quand est-il utile d'analyser quelque chose comme des matrices aléatoires. Par exemple, dans la classification d'images, vous transformez généralement vos matrices d'images en vecteurs. Il n'y a pas d '«analyse» de matrice. le commentaire de whuber est la meilleure réponse à ce jour: par exemple, une matrice de covariance doit être semi-définie positive - si vous voulez simuler des matrices de covariance aléatoires, il est plus facile de travailler avec une spécification de matrice qu'un vecteur.
seanv507

2
Les matrices aléatoires ne sont qu'un cas particulier des tenseurs aléatoires.
Anony-Mousse -Reinstate Monica

Réponses:


23

Cela dépend du domaine dans lequel vous vous trouvez, mais l'une des grandes poussées initiales pour l'étude des matrices aléatoires est sortie de la physique atomique et a été lancée par Wigner. Vous pouvez trouver un bref aperçu ici . Plus précisément, ce sont les valeurs propres (qui sont les niveaux d'énergie en physique atomique) des matrices aléatoires qui ont généré des tonnes d'intérêt parce que les corrélations entre les valeurs propres ont donné un aperçu du spectre d'émission des processus de désintégration nucléaire.

Plus récemment, il y a eu une forte résurgence dans ce domaine, avec l'avènement de la distribution / s de Tracy-Widom pour les plus grandes valeurs propres des matrices aléatoires, ainsi que des connexions étonnantes à des domaines apparemment sans rapport, tels que la théorie du carrelage , la physique statistique, intégrable systèmes , phénomènes KPZ , combinatoire aléatoire et même l' hypothèse de Riemann . Vous pouvez trouver d'autres exemples ici .

Pour des exemples plus terre à terre, une question naturelle à poser sur une matrice de vecteurs de ligne est de savoir à quoi pourraient ressembler ses composants PCA. Vous pouvez obtenir des estimations heuristiques pour cela en supposant que les données proviennent d'une certaine distribution, puis en examinant les valeurs propres de la matrice de covariance, qui seront prédites à partir de l' universalité de la matrice aléatoire : quelle que soit (dans des limites raisonnables) la distribution de vos vecteurs, la distribution limite de la les valeurs propres s'approcheront toujours d'un ensemble de classes connues. Vous pouvez considérer cela comme une sorte de CLT pour les matrices aléatoires. Voir cet article pour des exemples.


Merci pour votre réponse. Je soupçonnais que cela pouvait être lié à certaines technicités mathématiques. Mais maintenant, tout cela a du sens, la physique a toujours été autour des mathématiques et l'inverse aussi.
Eduardo

Le papier de Wigner était au milieu des années 50, le papier de Wishart était à la fin des années 20. Il est donc difficile de prétendre que Wigner a donné le premier coup de pouce, à mon avis.
Aksakal

13

Vous semblez à l'aise avec les applications de vecteurs aléatoires. Par exemple, je traite quotidiennement ce type de vecteurs aléatoires: les taux d'intérêt de différents ténors. La Federal Reserve Bank a la série H15 , regardez les bons du Trésor à 4 semaines, 3 mois, 6 mois et 1 an. Vous pouvez considérer ces 4 taux comme un vecteur à 4 éléments. C'est aussi aléatoire, regardez les valeurs historiques sur le graphique ci-dessous.

entrez la description de l'image ici

Comme pour tout nombre aléatoire, nous pouvons nous demander: quelle est la covariance entre eux? Vous obtenez maintenant une matrice de covariance 4x4. Si vous l'estimez sur des données quotidiennes d'un mois, vous obtenez 12 matrices de covariance différentes chaque année, si vous voulez qu'elles ne se chevauchent pas. L'échantillon de matrice de covariance de séries aléatoires est lui-même un objet aléatoire, voir l'article de Wishart "LA DISTRIBUTION DU MOMENT DE PRODUITS GÉNÉRALISÉ DANS DES ÉCHANTILLONS PROVENANT D'UNE POPULATION MULTIVARIATE NORMALE". ici . Il y a une distribution qui porte son nom.

C'est une façon d'accéder à des matrices aléatoires. Il n'est pas étonnant que la théorie de la matrice aléatoire (RMT) soit utilisée en finance, comme vous pouvez le voir maintenant.


1
Vous mentionnez l'estimation sur "des données d'un mois", voulez-vous dire "la valeur d'un mois de données quotidiennes"?
John

1
@John, dans cet exemple particulier, oui, quotidiennement. Cependant, certaines séries sont mesurées à l'intérieur d'une journée, comme les cours des actions. Si vous avez un portefeuille d'actions, vous pouvez obtenir des matrices de covariance intra-journalière à des fréquences très élevées.
Aksakal

3
+1. Paraphrasant ici, mais je pense qu'une façon de motiver les matrices aléatoires est que dans ces cas, nous sommes souvent intéressés par la relation entre (et pas seulement à l'intérieur) des vecteurs aléatoires. Cela motive naturellement la réflexion sur les matrices plutôt que sur les vecteurs.
Cliff AB

@Aksakal Les données que vous mentionnez sont mensuelles et quotidiennes. J'ai trouvé cela déroutant avant de réviser le message, car il ne serait pas logique d'estimer une matrice de covariance en utilisant un mois de données mensuelles.
John

@John, vous pouvez estimer la matrice de covariance sur des données mensuelles ou hebdomadaires, chevauchantes ou non chevauchantes, etc. Il n'y a pas une seule bonne façon de procéder.
Aksakal

8

En physique théorique, les matrices aléatoires jouent un rôle important pour comprendre les caractéristiques universelles des spectres énergétiques des systèmes ayant des symétries particulières.

Mon expérience en physique théorique peut m'amener à présenter ici un point de vue légèrement biaisé, mais j'irais même jusqu'à suggérer que la popularité de la théorie des matrices aléatoires (RMT) provient de son application réussie en physique.

Sans trop entrer dans les détails, par exemple, les spectres énergétiques en mécanique quantique peuvent être obtenus en calculant les valeurs propres des systèmes hamiltoniens - qui peuvent être exprimées comme une matrice hermitienne. Souvent, les physiciens ne sont pas intéressés par des systèmes particuliers, mais veulent savoir quelles sont les propriétés générales des systèmes quantiques qui ont des propriétés chaotiques, ce qui conduit les valeurs de la matrice hamiltonienne hermitienne à remplir l'espace matriciel de manière ergodique lors de la variation de l'énergie ou d'autres paramètres ( par exemple conditions aux limites). Cela motive le traitement d'une classe de systèmes physiques comme des matrices aléatoires et l'examen des propriétés moyennes de ces systèmes. Je recommande la littérature sur la conjecture de Bohigas-Gianonni-Schmidt si vous voulez plonger dans ce plus profond.

En bref, on peut par exemple montrer que les niveaux d'énergie des systèmes qui ont une symétrie d'inversion temporelle se comportent universellement différemment des niveaux d'énergie des systèmes qui n'ont pas de symétrie d'inversion temporelle (ce qui se produit par exemple si vous ajoutez un champ magnétique). En fait, un calcul assez court utilisant des matrices aléatoires gaussiennes peut montrer que les niveaux d'énergie ont tendance à être différemment proches dans les deux systèmes.

Ces résultats peuvent être étendus et ont aidé à comprendre également d'autres symétries, qui ont eu un impact majeur sur différents domaines, comme la physique des particules ou la théorie du transport mésoscopique et plus tard même sur les marchés financiers.


1
c'est pourquoi j'ai quitté la physique :) trop de "lésions cérébrales"
Aksakal

Des statisticiens comme Wishart étaient devant les physiciens atomiques.
kjetil b halvorsen

5

Une carte linéaire est une carte entre des espaces vectoriels. Supposons que vous ayez une carte linéaire et que vous ayez choisi des bases pour ses espaces de domaine et de plage. Ensuite, vous pouvez écrire une matrice qui code la carte linéaire. Si vous voulez considérer des cartes linéaires aléatoires entre ces deux espaces, vous devriez trouver une théorie des matrices aléatoires. La projection aléatoire est un exemple simple d'une telle chose.

En outre, il existe des objets à matrice / tensor en physique. Le tenseur visqueux des contraintes en est un (parmi un véritable zoo). Dans des matériaux viscoélastiques presque homogènes, il peut être utile de modéliser les déformations (élastiques, visqueuses, et al.) Et donc les contraintes ponctuellement comme un tenseur aléatoire avec une petite variance. Bien qu'il y ait un sens de "carte linéaire" à cette contrainte / déformation, il est plus honnête de décrire cette application de matrices aléatoires comme randomisant quelque chose qui était déjà une matrice.


4

La détection compressive en tant qu'application dans le traitement d'image repose sur des matrices aléatoires en tant que mesures combinées d'un signal 2D. Les propriétés spécifiques de ces matrices, à savoir la cohérence , sont définies pour ces matrices et jouent un rôle dans la théorie.

Grossièrement simplifié, il s'avère que minimiser la norme L1 d'un certain produit d'une matrice gaussienne et d'un signal d'entrée clairsemé vous permet de récupérer beaucoup plus d'informations que vous ne le pensez.

La première recherche la plus notable dans ce domaine que je connaisse est le travail de l'Université Rice: http://dsp.rice.edu/research/compressive-sensing/random-matrices

La théorie des produits matriciels en tant que «mesures d'un signal» remonte au moins à la Seconde Guerre mondiale. Comme un ancien professeur à moi me l'a raconté, tester individuellement chaque enrôlé de l'armée pour, disons, la syphilis, était prohibitif. Le mélange systématique de ces échantillons (en mélangeant des parties de chaque échantillon de sang et en les testant) réduirait le nombre de fois qu'un test devait être effectué. Cela pourrait être modélisé comme un vecteur binaire aléatoire multiplié par une matrice clairsemée.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.