Contexte:
Une méta-analyse typique en psychologie pourrait chercher à modéliser la corrélation entre deux variables X et Y. L'analyse impliquerait généralement d'obtenir un ensemble de corrélations pertinentes à partir de la littérature ainsi que la taille des échantillons. Des formules peuvent ensuite être appliquées pour calculer une corrélation moyenne pondérée. Ensuite, des analyses peuvent être effectuées pour voir si les corrélations varient d'une étude à l'autre plus que ne le laisseraient supposer les simples effets d'un échantillonnage aléatoire.
De plus, les analyses peuvent être beaucoup plus complexes. Les estimations peuvent être ajustées pour la fiabilité, la restriction de plage, etc. Les corrélations peuvent être utilisées en combinaison pour explorer la modélisation d'équations méta structurelles ou la méta régression, etc.
Cependant, toutes ces analyses sont effectuées à l'aide de statistiques sommaires (par exemple, corrélations, rapports de cotes, différences moyennes normalisées) comme données d'entrée. Cela nécessite l'utilisation de formules et de procédures spéciales acceptant des statistiques sommaires.
Approche alternative à la méta-analyse
Ainsi, je réfléchissais à une approche alternative à la méta-analyse, où les données brutes sont utilisées en entrée. C'est-à-dire que pour une corrélation, les données d'entrée seraient les données brutes utilisées pour former la corrélation. De toute évidence, dans la plupart des méta-analyses, plusieurs sinon la plupart des données brutes réelles ne sont pas disponibles. Ainsi, une procédure de base pourrait ressembler à ceci:
- Contactez tous les auteurs publiés à la recherche de données brutes et, le cas échéant, utilisez des données brutes réelles .
- Pour les auteurs qui ne fournissent pas de données brutes, simulez les données brutes afin qu'elles aient des statistiques récapitulatives identiques à celles rapportées. Ces simulations pourraient également incorporer toute connaissance acquise à partir des données brutes (par exemple, si une variable est connue pour être biaisée, etc.).
Il me semble qu'une telle approche pourrait avoir plusieurs avantages:
- Des outils statistiques qui utilisent des données brutes en entrée pourraient être utilisés pour des analyses
- En obtenant au moins des données brutes réelles, les auteurs de méta-analyses seraient obligés de prendre en compte les problèmes liés aux données réelles (par exemple, valeurs aberrantes, distributions, etc.).
Question
- Existe-t-il des problèmes avec la réalisation d'études de méta-analyse sur une combinaison de vraies données brutes et de données simulées pour avoir des statistiques sommaires identiques aux études publiées existantes?
- Une telle approche serait-elle supérieure aux méthodes existantes pour effectuer des méta-analyses sur des statistiques sommaires?
- Existe-t-il une documentation existante discutant, préconisant ou critiquant cette approche?