Je connais le concept de variables catégorielles et le codage des variables fictives respectif qui nous permet d'ajuster un niveau comme ligne de base afin d'éviter la colinéarité. Je suis également familier avec la façon d'interpréter les estimations de paramètres à partir de ces modèles: le changement prévu dans le résultat pour un niveau ajusté donné du prédicteur catégoriel, par rapport à la catégorie de référence.
Ce que je ne sais pas, c'est comment interpréter un ensemble de variables indépendantes qui sont des proportions qui se résument à un . Nous avons à nouveau la colinéarité si nous ajustons toutes les proportions dans le modèle, donc nous devrions probablement laisser une catégorie de côté. Je suppose également que je regarderais le SS de type III pour le test global de la signification de cette variable. Cependant, comment interprétons-nous les estimations des paramètres pour ces niveaux qui correspondent au modèle par rapport à ceux jugés de référence?
Un exemple : Au niveau du code postal, la variable indépendante est la proportion de roches métamorphiques, ignées et sédimentaires. Comme vous le savez peut-être, ce sont les trois principaux types de roches, et toutes les roches sont classées parmi celles-ci. En tant que tel, les proportions dans les trois sont égales à 1. Le résultat est le niveau moyen de radon dans un code postal respectif.
Si je devais ajuster, disons, les proportions métamorphiques et ignées en tant que prédicteurs dans le modèle, en laissant les sédiments comme ligne de base, un test global de type III SS F des deux niveaux ajustés signifierait si le type de roche, dans son ensemble, est un important prédicteur du résultat (niveau moyen de radon). Ensuite, j'ai pu examiner les valeurs p individuelles (basées sur la distribution t ) pour déterminer si un ou les deux types de roches étaient significativement différents de la ligne de base.
Cependant, en ce qui concerne les estimations des paramètres, mon cerveau continue de vouloir les interpréter uniquement comme le changement prévu dans le résultat entre les groupes (types de roches), et je ne comprends pas comment incorporer le fait qu'ils correspondent à des proportions .
Si l' estimation du métamorphisme était, disons, de 0,43, l'interprétation n'est pas simplement que le niveau de radon moyen prévu augmente de 0,43 unités lorsque la roche est métamorphique par rapport aux sédiments. Cependant, l'interprétation n'est pas non plus simplement pour une sorte d'augmentation d'unité (disons 0,1) dans la proportion de type de roche métamorphique, car cela ne reflète pas le fait qu'elle est également relative à la ligne de base ( sédimentaire ), et, en outre, ce changement la proportion de métamorphique change par nature la proportion de l'autre niveau de roche ajusté dans le modèle, igné .
Quelqu'un at-il une source qui fournit l'interprétation d'un tel modèle, ou pourriez-vous fournir un bref exemple ici sinon?