Cette question traite de l'estimation du maximum de vraisemblance restreint (REML) dans une version particulière du modèle linéaire, à savoir:
où est une matrice ( ) paramétrée par , tout comme . est un vecteur inconnu de paramètres de nuisance; l'intérêt est d'estimer , et on a . L'estimation du modèle par maximum de vraisemblance n'est pas un problème, mais je veux utiliser REML. Il est bien connu, voir par exemple LaMotte , que la vraisemblance , où est une matrice semi-orthogonale telle que peut s'écrire
lorsque est le rang de colonne complet .
Mon problème est que pour certains parfaitement raisonnables et scientifiquement intéressants, la matrice X ( α ) n'est pas de plein rang de colonne. Toutes les dérivations que j'ai vues de la probabilité restreinte ci-dessus utilisent des égalités déterminantes qui ne sont pas applicables lorsque | X ′ X | = 0 , à savoir qu'ils assument rang de la colonne complète de X . Cela signifie que la probabilité restreinte ci-dessus n'est correcte que pour mon réglage sur des parties de l'espace des paramètres, et n'est donc pas ce que je souhaite optimiser.
Question: Y a-t-il des probabilités restreintes plus générales, dérivées, dans la littérature statistique ou ailleurs, sans l'hypothèse que soit le rang complet des colonnes? Si oui, à quoi ressemblent-ils?
Quelques observations:
- Dériver la partie exponentielle n'est pas un problème pour tout et elle peut être écrite en termes de l'inverse de Moore-Penrose comme ci-dessus
- Les colonnes de sont une base orthonormée (quelconque) pour C ( X ) ⊥
- Pour connu , la probabilité pour A ′ Y peut facilement être écrite pour chaque α , mais bien sûr le nombre de vecteurs de base, c'est-à-dire de colonnes, dans A dépend du rang de colonne de X
Si quelqu'un intéressé par cette question croit que le paramétrage exact de aiderait, faites-le moi savoir et je les noterai. À ce stade, je suis surtout intéressé par un REML pour un X général des dimensions correctes.
Une description plus détaillée du modèle suit ici. Soit une autorégression vectorielle de premier ordre r- dimensionnelle [VAR (1)] où v t i i d ∼ N ( 0 , Ω ) . Supposons que le processus démarre à une valeur fixe y 0 au temps t = 0 .
Définissez . Le modèle peut être écrit sous la forme du modèle linéaire Y = X β + ε en utilisant les définitions et la notation suivantes:
où désigne un T - vectoriel de dimension de uns et de e 1 , T le premier vecteur de base de type R T .
Notons . Notez que si A n'est pas un rang complet, alors X ( α ) n'est pas un rang complet de colonne. Cela inclut, par exemple, les cas où l'une des composantes de y t ne dépend pas du passé.
L'idée d'estimer les VAR en utilisant REML est bien connue, par exemple, dans la littérature sur les régressions prédictives (voir par exemple Phillips et Chen et les références qui y sont contenues).
Il peut être utile de préciser que la matrice n'est pas une matrice de conception au sens habituel, elle tombe juste hors du modèle et à moins qu'il n'y ait une connaissance a priori de A, il n'y a, pour autant que je sache , aucun moyen de reparamétrer que ce soit complet.
J'ai posté une question sur math.stackexchange qui est liée à celle-ci dans le sens où une réponse à la question mathématique peut aider à dériver une probabilité qui répondrait à cette question.