Variables dépendantes phylogénétiques: ANOVA?


13

Je comprends que dériver une matrice de covariance à partir de données phylogénétiques pour faire pour deux variables sur lesquelles vous effectuez une régression. Mais que se passe-t-il si vous avez une variable continue, que vous avez précédemment montrée comme dépendante de la phylogénie, et une variable ordinale? Ce dernier étant ordinale, je ne sais pas comment relier cela à la manière dont la dépendance phylogénétique entraîne des statistiques de test biaisées.cov(X,Oui)=0

Est-il utile de calculer les contrastes phylogénétiques indépendants de Felsenstein sur votre variable continue et de les utiliser pour votre ANOVA?

La valeur PIC est:

Cjej=(Xje-Xj)jej

est X pour l'espèce i , X j est X pour l'espèce j et d i j est la distance par paire entre les espèces i et j sur l'arbre phylogénétique.XjeXje,XjXjjejjej


1
Il y a suffisamment de statisticiens appliqués chez CrossValidated pour que nous puissions envisager de migrer cela vers le site de statistiques.
Daniel Standage

2
Je recommanderais la liste de diffusion r-sig-phylo ( stat.ethz.ch/mailman/listinfo/r-sig-phylo ). Même si vous n'utilisez pas R pour votre analyse, vous obtiendrez de très bonnes réponses à votre question.
kmm

Réponses:


1

La première étape que je recommanderais est d'introduire une variable fictive pour chacune des classes ordinales (voir les commentaires sur https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta edu / faculté / kunovich / Soci5304_Handouts / sujet% 25208_Dummy% 2520Variables.doc & cd = 2 & ved = 0CCAQFjAB & usg = AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ & sig2 = 9hkDU6Y2mpKcGzBTIK8jog ) et tracer les moyens respectifs de l'analyse de régression de la variable factice. Vous pouvez également tester une tendance dans les variables factices elles-mêmes. Vous pouvez également réorganiser la catégorie de variables ordinales en fonction de la magnitude estimée respective des variables fictives pour une analyse ultérieure s'il existe une justification préalable (pour voir les données actuelles) à le faire.

En supposant que l'analyse antérieure manque un effet de tendance croissante (pas nécessairement linéaire) et l'incorporation de tout ordre supportable dans la variable ordinale elle-même, une approche intéressante qui traite également des problèmes de normalité possibles, consiste à effectuer une analyse de régression dans laquelle toutes les variables se voient attribuer des rangs, y compris la variable ordinale. Une justification de cette folie, pour citer Wikipédia sur le coefficient de corrélation de rang de Spearman (lien: http://en.m.wikipedia.org/wiki/Spearman's__rank_correlation_coefficient ):

"Le coefficient de Spearman, comme tout calcul de corrélation, est approprié pour les variables continues et discrètes, y compris les variables ordinales. [1] [2]"

Wikipédia présente un exemple et plusieurs façons d'évaluer l'erreur standard de la corrélation de rang calculée pour les tests. Notez que si elle n'est pas statistiquement différente de zéro, alors une version mise à l'échelle, comme dans une régression calculée basée sur les rangs, n'est pas non plus significative.

Je normaliserais davantage ces rangs (en divisant par le nombre d'observations), donnant une possible interprétation quantile de l'échantillon (notez, il y a des raffinements possibles dans la construction de la distribution empirique pour les données en question). Je voudrais également effectuer une simple corrélation entre y et une variable ordinale transformée donnée afin que la direction de votre classement sélectionné (par exemple, 1 à 4 contre 4 à 1), produise un signe pour la corrélation de rang qui a une signification intuitive dans le contexte de votre étude.

[Modifier] Veuillez noter que les modèles ANOVA peuvent être présentés sous forme de régression avec la matrice de conception appropriée, et avec le modèle de régression standard que vous étudiez, le thème central est une analyse basée sur la moyenne de Y étant donné X. Cependant, dans certaines disciplines comme l'écologie, une focalisation différente sur les relations de régression impliquées à divers quantiles, y compris la médiane, s'est avérée fructueuse. Apparemment, en écologie, les effets moyens peuvent être faibles, mais pas nécessairement aux autres quantiles. Ce champ est appelé régression quantile. Je vous suggère de l'utiliser pour compléter votre analyse actuelle. Comme référence, vous pouvez trouver le document 213-30, «Une introduction à la régression quantile et à la procédure QUANTREG» de Colin (Lin) Chen au SAS Institute utile.

Voici également une source sur l'utilisation des transformées de rang: "The Use of Rank Transforms in Regression" de Ronald L. Iman et WJ Conover, publié dans Technometrics, Vol 21, No. 4, novembre 1979. L'article note que les régressions L'emploi de transformations de rang semble fonctionner assez bien sur les données monotones. Cette opinion est également partagée par les professionnels de la fiabilité, qui déclarent sur un magazine en ligne, de citer: "La méthode d'estimation de la régression de rang est assez bonne pour les fonctions qui peuvent être linéarisées". Source: "Reliability Hotwire, numéro 10, décembre 2010.


un utilisateur anonyme a tenté d'apporter des modifications (IMO) assez étendues à votre message. Si vous n'êtes pas d'accord avec eux, vous pouvez les annuler en cliquant sur le lien "édité __ il y a", en recherchant la dernière version que vous préférez et en cliquant sur "annuler".
gung - Réintégrer Monica

0

Un test phylogénétique ANOVA a été développé par Garland et al. (1993) , et est implémenté dans la phy.anovafonction du geigerpackage. La méthode produit des valeurs de p corrigées pour la non-indépendance phylogénétique en générant une distribution nulle basée sur la simulation de l'évolution sur la phylogénie.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.