J'étudie les perturbations causées par le trafic maritime à un petit oiseau de mer. J'ai observé des animaux focaux pendant un certain temps et j'ai noté s'ils volaient ou non de l'eau pendant l'observation. Cet oiseau particulier ne vole pas à des probabilités élevées lorsqu'il n'est pas dérangé (environ 10% du temps). Post hoc, j'ai ajouté la distance du navire le plus proche à chaque observation (les navires d'intérêt avaient des localisateurs GPS enregistrant un point toutes les 5 secondes).
J'ai tracé la fonction de distribution cumulative pour TOUTES les observations et pour les observations où l'oiseau s'est envolé de l'eau en fonction de la distance jusqu'au navire le plus proche. Comme prévu, la majorité des observations dans lesquelles l'oiseau a volé ont été observées lorsque le navire était proche.
Puis-je utiliser le test de Kolmogorov-Smirnov pour tester s'il existe une différence statistique dans la distribution des observations de vol et des observations totales? Ma pensée est que si ces deux distributions sont différentes, cela suggérerait que la distance du navire a une influence sur le vol. Je m'inquiète car ces fonctions de distribution ne sont pas indépendantes car les observations de vol sont un sous-ensemble des observations totales.
Pensées?
Après avoir lu un peu plus loin sur ce site je pense pouvoir tester la distribution des observations dans lesquelles le vol s'est produit (F) par rapport à la distribution des observations dans lesquelles il ne s'est pas produit (NF) car elles sont indépendantes. Si ces distributions sont les mêmes F = NF, alors nous pouvons supposer que la distribution de (F) et (TOT = toutes les observations) sont les mêmes que nous savons que la distribution de (F) est égale à elle-même et (F) + (T) = (TOT). Droite?
MISE À JOUR: 2/12/14
Suite aux suggestions de @Scortchi, j'ai étudié la relation entre l'incidence du vol et la distance au navire le plus proche dans un cadre de régression logistique. Il y avait une légère relation présente (pente négative) mais la valeur de p n'était pas significative, suggérant que la vraie pente pourrait être nulle. Sur la base des statistiques de descente (y compris les parcelles ecdf), je soupçonnais que l'effet des navires proches était noyé par les nombreuses observations lorsque le navire n'affectait pas le comportement. J'ai ensuite utilisé le package R segmenté ( http://cran.r-project.org/web/packages/segmented/segmented.pdf) pour essayer de trouver un point d'arrêt dans le modèle. Le programme a révélé que la rupture des données à 2,6 km du navire et l'ajustement de deux coefficients distincts étaient meilleurs que le modèle à coefficient unique. Le coefficient de pente des approches rapprochées des navires était négatif et suggère que les navires affectent la réponse en vol jusqu'à environ 2,6 km (valeur p <0,001). Le coefficient de la deuxième pente était légèrement positif, mais la valeur de p n'était pas significative au niveau de 0,05 alpha (valeur de p = 0,11). Donc, en résumé, la ligne de régression segmentée a pu détecter une différence de seuil à laquelle la probabilité de vol augmente. L'estimation de la probabilité de vol lorsque le navire fait plus de 2,6 km est de 0,11. À juste titre, j'ai observé 79 oiseaux quand aucun navire n'était même dans la baie d'étude (>
Merci pour toutes les suggestions. J'espère que cette question ainsi que les suggestions et réponses aideront les autres.