La question est difficile à répondre, car elle est tellement révélatrice d'une confusion générale et d'un état de choses confus dans une grande partie de la littérature méta-analytique (le PO n'est pas à blâmer ici - c'est la littérature et la description des méthodes , modèles et hypothèses qui est souvent un gâchis).
Mais pour faire court: non, si vous voulez combiner un ensemble d'estimations (qui quantifient une sorte d'effet, un degré d'association ou un autre résultat jugé pertinent) et qu'il est judicieux de combiner ces chiffres, alors vous pourriez simplement prendre leur moyenne (non pondérée) et ce serait parfaitement bien. Rien de mal à cela et selon les modèles que nous supposons généralement lorsque nous effectuons une méta-analyse, cela vous donne même une estimation non biaisée (en supposant que les estimations elles-mêmes sont non biaisées). Donc, non, vous n'avez pas besoin des variances d'échantillonnage pour combiner les estimations.
Alors, pourquoi la pondération par variance inverse est-elle presque synonyme de faire une méta-analyse? Cela a à voir avec l'idée générale que nous accordons plus de crédibilité aux grandes études (avec des variances d'échantillonnage plus petites) qu'aux études plus petites (avec des variances d'échantillonnage plus importantes). En fait, selon les hypothèses des modèles habituels, l'utilisation de la pondération de variance inverse conduit à l' estimateur sans biais de variance minimale uniforme(UMVUE) - enfin, en quelque sorte, en supposant à nouveau des estimations non biaisées et en ignorant le fait que les variances d'échantillonnage ne sont en fait souvent pas exactement connues, mais sont estimées elles-mêmes et dans les modèles à effets aléatoires, nous devons également estimer la composante de variance pour l'hétérogénéité, mais ensuite nous l'avons traité comme une constante connue, ce qui n'est pas tout à fait correct non plus ... mais oui, nous obtenons en quelque sorte l'UMVUE si nous utilisons la pondération à variance inverse si nous plissons les yeux très fort et ignorons certains d'entre eux problèmes.
C'est donc l'efficacité de l'estimateur qui est en jeu ici, et non l'impartialité elle-même. Mais même une moyenne non pondérée ne sera souvent pas beaucoup moins efficace que l'utilisation d'une moyenne pondérée à variance inverse, en particulier dans les modèles à effets aléatoires et lorsque le degré d'hétérogénéité est important (auquel cas le schéma de pondération habituel conduit à des poids presque uniformes en tous cas!). Mais même dans les modèles à effets fixes ou avec peu d'hétérogénéité, la différence n'est souvent pas écrasante.
Et comme vous le mentionnez, on peut également facilement envisager d'autres schémas de pondération, tels que la pondération par taille d'échantillon ou une fonction de celui-ci, mais encore une fois, ce n'est qu'une tentative pour obtenir quelque chose de proche des poids de variance inverse (puisque les variances d'échantillonnage sont, pour dans une large mesure, déterminée par la taille de l'échantillon d'une étude).
Mais en réalité, on peut et doit «découpler» complètement la question des poids et des écarts. Ce sont vraiment deux pièces distinctes auxquelles il faut penser. Mais ce n'est tout simplement pas ainsi que les choses sont généralement présentées dans la littérature.
Cependant, le point ici est que vous devez vraiment penser aux deux. Oui, vous pouvez prendre une moyenne non pondérée comme estimation combinée et ce serait, en substance, une méta-analyse, mais une fois que vous voulez commencer à faire des inférences basées sur cette estimation combinée (par exemple, effectuer un test d'hypothèse, construire un intervalle de confiance ), vous devez connaître les variances d'échantillonnage (et le degré d'hétérogénéité). Pensez-y de cette façon: si vous combinez un tas d'études de petite taille (et / ou très hétérogènes), votre estimation ponctuelle sera beaucoup moins précise que si vous combinez le même nombre de très grandes (et / ou homogènes) études - quelle que soit la façon dont vous avez pondéré vos estimations lors du calcul de la valeur combinée.
En fait, il existe même des moyens de ne pas connaître les variances d'échantillonnage (et la quantité d'hétérogénéité) lorsque nous commençons à faire des statistiques inférentielles. On peut envisager des méthodes basées sur le rééchantillonnage (par exemple, bootstrap, tests de permutation) ou des méthodes qui produisent des erreurs standard cohérentes pour l'estimation combinée même lorsque nous spécifions mal des parties du modèle - mais la façon dont ces approches peuvent fonctionner doit être soigneusement évaluée sur un au cas par cas.