La fréquence allélique observée est-elle significativement inférieure à celle prédite?


10

Question : Comment puis-je construire un test pour déterminer si la fréquence des allèles "montagne" observée (Fig 1) est significativement plus basse dans les montagnes du centre au sud que celle prédite (Fig 2) par le modèle de sélection écologique ( voir ci-dessous pour plus de détails )?

Problème : Ma pensée initiale était de régresser les résidus du modèle par rapport à la latitude: longitude et altitude (ce qui se traduit uniquement par l'interaction entre latitude et longitude comme significative). Le problème est que les résidus (figure 3) peuvent refléter une variation non expliquée par le modèle et / ou que leur phénomène est quelque chose de biologique, par exemple l'allèle n'a pas eu le temps de se propager vers le sud à son potentiel ou il existe une certaine barrière au flux génétique. Si vous comparez les fréquences observées (figure 1) et les fréquences attendues (figure 2) des allèles de montagne, il y a une différence évidente, en particulier dans les montagnes du centre au sud de la Suède et de la Norvège. J'accepte que le modèle ne puisse pas expliquer toute la variation, mais puis-je trouver un test raisonnable pour explorer l'idée que l'allèle de montagne n'a pas atteint son potentiel dans les montagnes du centre au sud?

Contexte: J'ai un marqueur AFLP bi-allélique dont la distribution de fréquence semble être associée aux habitats de montagne (et latitude: longitude) par rapport aux habitats de plaine de la péninsule scandinave (Fig 1). L'allèle "de montagne" est presque fixe dans le nord, qui est montagneux. Il est quasiment absent ou figé pour l'allèle "des plaines" au sud, qui manque de montagnes. Au fur et à mesure que l'on se déplace du nord au sud dans les montagnes, l'allèle "montagne" se produit en fréquence plus faible. Cette différence dans la fréquence des allèles "de montagne" du nord au sud peut simplement être due à la phylogéographie ou aux processus historiques, car la région a été colonisée à la fois par le nord et le sud. Par exemple, si l'allèle de montagne provient de la population du nord, il n'a peut-être pas eu le temps de s'étendre pleinement à la population du sud,

Mon hypothèse de travail est que la fréquence des allèles "montagne" est le résultat d'une sélection écologique (l'hypothèse nulle est une sélection neutre).

Pour mon modèle de sélection écologique, j'ai utilisé un modèle additif généralisé (GAM) avec la fréquence des allèles binomiaux comme variable de réponse (129 sites échantillonnés à travers la Fennoscandinavie avec généralement 10 à 20 individus échantillonnés sur chaque site) et plusieurs variables climatiques et de saison de croissance comme les variables prédictives. Les résultats du modèle sont les suivants (TMAX04-06 = température maximale en avril-juin, Phen_NPPMN = productivité moyenne de la végétation pendant la saison de croissance, PET_HE_YR = évapotranspiration potentielle annuelle, Dist_Coast = distance de la côte):

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

entrez la description de l'image ici

Figure 1. Fréquence des allèles "montagne" observée pour le marqueur AFLP bi-allélique. Lignes de contour 0,1 intervalles de fréquence, l'ombrage des couleurs est l'altitude avec les bleus pour les plus bas et les rouges les plus élevés.

entrez la description de l'image ici

Figure 2. Fréquence allélique "montagne" prévue pour le marqueur AFLP bi-allélique. Lignes de contour 0,1 intervalles de fréquence, l'ombrage des couleurs est l'altitude avec les bleus pour les plus bas et les rouges les plus élevés.

entrez la description de l'image ici

Figure 3. Résidus du modèle de sélection écologique (utilisant le GAM) ventilés par l'ensemble de la zone d'étude (Fennoscandinavia) et séparément pour la Norvège, la Suède et la Finlande. Les lignes pointillées rouges représentent une zone de contact secondaire entre les populations du nord et du sud déduite d'autres marqueurs AFLP et une analyse isotopique stable des plumes cultivées sur leurs aires d'hivernage distinctes en Afrique. La fine ligne pointillée noire est le centre de la zone.


1
Merci pour la grande quantité de détails. Comment le modèle nul entre-t-il en jeu? Il semble que seul le modèle de sélection écologique soit important pour comparer les observations observées aux attentes.
gui11aume

Quelles sont vos données réelles ici? La sortie du modèle indique "n = 129", mais s'agit-il de 129 individus, ou 129 emplacements à chacun desquels vous avez des fréquences alléliques, ou ...?
onestop

Désolé, je voulais vous fournir le plus d'informations possible pour vous permettre à tous de mieux comprendre la logique (ou l'illogisme) de mon approche pour le manuscrit que je développe. Ma question est au sommet, je voudrais trouver une raison pour déterminer si la différence entre observé et attendu est significativement différente. Cela pourrait m'informer si l'allèle se propage toujours ou s'il y a un obstacle à atteindre la valeur attendue. Quant au "N = 129", comme il s'agit d'une fréquence allélique, cela signifie 129 sites avec typiquement entre 10 et 20 individus échantillonnés à chaque site.
Keith Larson

Vous mentionnez que les individus semblent panmictiques pour les loci maternels et automsomaux. Avez-vous accès à ces données? Comment avez-vous évalué la panmixie?
Sameer

Réponses:


1

Cette question est peut-être morte, mais les graphiques ici sont magnifiques, et la réponse ici semble intuitivement évidente. Si vous êtes à la recherche d'un allèle «montagne», le choix évident serait d'utiliser l'altitude (ou un substitut) comme prédicteur. Si cela montrait une association significative avec la fréquence des allèles, cela fournirait une preuve solide de votre hypothèse.

Vous pouvez ajouter plus de variables prédictives décrivant d'autres aspects de la montagne que son altitude - par exemple, la "rugosité" du terrain ou le type de végétation - qui sont uniquement montagneuses et peuvent également être associées à la fréquence des allèles.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.