Qu'est-ce qu'une estimation impartiale du carré R de la population?

Je souhaite obtenir une estimation non biaisée de $R^2$ dans une régression linéaire multiple.

À la réflexion, je peux penser à deux valeurs différentes qu'une estimation non biaisée de pourrait essayer de faire correspondre. $R^2$

Hors échantillon : $R^2$ le carré r qui serait obtenu si l'équation de régression obtenue à partir de l'échantillon (c'est-à-dire ) était appliquée à une quantité infinie de données externes à l'échantillon mais à partir des mêmes données processus de génération. $\hat{\beta}$
Population : $R^2$ Le carré r qui serait obtenu si un échantillon infini était obtenu et le modèle ajusté à cet échantillon infini (c.-à-d. ) ou alternativement juste le carré R impliqué par le processus de génération de données connu. $\beta$

Je comprends que ajusté $R^2$ est conçu pour compenser le sur-ajustement observé dans l'échantillon . Néanmoins, il n'est pas clair si ajusté est réellement une estimation sans biais de , et s'il s'agit d'une estimation sans biais, laquelle des deux définitions de ci-dessus il vise à estimer. $R^2$ $R^2$ $R^2$ $R^2$

Ainsi, mes questions:

Qu'est-ce qu'une estimation impartiale de ce que j'appelle ci-dessus sur l'échantillon $R^2$ ?
Qu'est-ce qu'une estimation impartiale de ce que j'appelle au-dessus de la population ? $R^2$
Y a-t-il des références qui fournissent une simulation ou une autre preuve de l'impartialité?

— Jeromy Anglim
source

La question de savoir quelle formule pour adj. R ^ 2 est moins biaisé a été relevé par exemple ici .

— ttnphns

Merci. Je lis maintenant la référence que vous mentionnez: Yin, P., & Fan, X. (2001). Estimation du retrait en régression multiple: comparaison de différentes méthodes analytiques. The Journal of Experimental Education, 69 (2), 203-224.

R^{2}

$R^2$

— Jeromy Anglim

Évaluation des ajustements analytiques au carré R

$R^2$

$\rho^2$
$\rho_c^2$

Leurs résultats sont résumés dans l'abstrait:

$R^2$ $\rho^2$ $\rho^2$ $\rho_c^2$

$\rho^2$

{\hat{R}}^{2} = 1 - \frac{(N - 3) (1 - R^{2})}{(N - p - 1)} [1 + \frac{2 (1 - R^{2})}{N - p - 2.3}]

$\hat{R}^2=1 - \frac{(N-3)(1 - R^2)}{(N-p-1)} \left[ 1 + \frac{2(1-R^2)}{N-p-2.3} \right]$

où N est la taille de l'échantillon et p est le nombre de prédicteurs.

Estimations empiriques des ajustements du carré R

$R^2$ $\rho^2$ $\rho_c^2$ $\rho^2$

Les références

Kromrey, JD et Hines, CV (1995). Utilisation d'estimations empiriques du retrait dans les régressions multiples: une mise en garde. Mesures éducatives et psychologiques, 55 (6), 901-925.
$R^2$

— Jeromy Anglim
source