Spécimens de musée de géoréférencement avec de mauvaises descriptions de localité

Je collabore actuellement une liste de spécimens de bases de données de divers musées d'histoire naturelle pour des recherches plus approfondies. Cependant, un problème bien connu associé à la majorité des données historiques est le manque de latitude et de longitude appropriées, ce qui empêche d'utiliser ces données.

Il y a eu des moyens de surmonter ces données - comme dessiner un tampon autour d'une région et fournir une gamme d'incertitude associée à cet emplacement.

Par exemple, la fonction - biogéomancien du package «spatial» dans R, automatise le processus de géoréférencement, à condition qu'il existe quelques descriptions textuelles telles que «2 miles à l'ouest de XYZ». Voir la documentation ici.

Cependant, ma principale préoccupation est d'utiliser un tel protocole pour des régions de 200 km2. Existe-t-il un moyen de surmonter ce problème? Je serais ravi d'utiliser ce riche trésor de données muséales, à condition de pouvoir gérer l'incertitude associée à son emplacement.

Un exemple de quelques spécimens dans mon jeu de données est montré ci-dessous. Veuillez noter que beaucoup d'entre eux sont accompagnés de mentions d'élévation, mais la plupart des enregistrements sont très vagues.

ÉDITER

Dans la section des commentaires, l'un d'entre vous a mentionné le but de cette question et ce que j'ai tendance à en tirer.
1. Je voudrais savoir comment une fois peut réduire le rayon d'incertitude d'une région polygonale vraiment large à un rayon d'incertitude plus petit (si possible).
2. Ces informations m'aideront à réaliser de futures analyses spatiales telles que la modélisation de la répartition des espèces / modélisation de l'occupation par exemple.

r coordinates buffer georeferencing

— Vijay Ramesh
source

Avez-vous entendu parler du GBIF? gbif.org Il a peut-être déjà ce que vous cherchez.

— GISKid

@GISKid Yup, ce sont les données du GBIF. Malheureusement, la majorité de ces données ne sont pas bien géoréférencées.

— Vijay Ramesh

Question interessante! Cependant, ce que vous espérez faire n'est pas clair - les éléments sont déjà géoréférencés dans la mesure où ils contiennent des informations de localisation, même pour les régions polygonales. Pourriez-vous modifier et développer la façon dont vous espérez «traiter» le problème des grands polygones? Est-ce pour aider à une analyse spatiale?

— Simbamangu

Quelle méthode utilisez-vous pour votre SDM? Et quelle zone d'étude de taille? En fonction de ces deux - je pense qu'une grande zone d'incertitude réduirait l'utilité d'un SDM, personnellement. J'éliminerais plutôt les données qui ont un grand polygone d'incertitude et je m'en tiendrai à des occurrences qui sont «plus précises». Surtout si le nombre d'occurrences n'est pas un problème

— GISKid

Il semble que vous pourriez être en mesure d'affiner, au cas par cas , certaines données de localité - par exemple en utilisant des données d'altitude raster de 3500 '± 250' pour masquer dans le polygone de Santhapara. Sans utiliser de «compétences de détective» et de données supplémentaires, vous êtes coincé avec la prise du centroïde du polygone - et (parlant d'expérience) c'est dangereux! Pourquoi? Vous avez maintenant ce qui ressemble à des données ponctuelles précises, mais ce n'est pas le cas, et cela peut se perdre pendant le partage ou les étapes de l'analyse.

— Simbamangu

Tenez compte des dates des événements et essayez d'obtenir (construction, géoréférencement) une carte des routes, des voies ferrées, des ponts et des villes (villages, gares) connues ou disponibles à cette époque pour la région, car le naturaliste part généralement de un village connu et utiliser au moins partiellement une route ou un chemin de fer existant pour se rendre dans les zones où ils ont obtenu les spécimens. Parfois, cela réduit vraiment la zone probable de collecte / d'occurrence. S'il y a plus d'informations écologiques sur l'espèce, vous pouvez exclure des zones, par exemple. terres ouvertes vs forêts, zones humides vs zones sèches, avec également quelques informations auxiliaires sur la distribution historique de ces écosystèmes.

Bien que je n'utiliserais définitivement pas ces emplacements pour entraîner le modèle sdm, vous pouvez utiliser les résultats du modèle pour réduire l'incertitude de l'emplacement de ces occurrences mal géoréférencées en combinaison avec les données mentionnées ci-dessus.

Certains articles récents traitent de l'effet de biais de ces emplacements incertains et, si l'utilisation de données environnementales résumées peut être utilisée pour compenser cet emplacement flou:

Où l'incertitude de position est-elle un problème pour la modélisation de la distribution des espèces? https://onlinelibrary.wiley.com/doi/pdf/10.1111/j.1600-0587.2013.00205.x

Quantifier le degré de biais lié à l'utilisation de données à l'échelle du comté dans la modélisation de la répartition des espèces: l'augmentation de la taille de l'échantillon ou l'utilisation de données environnementales moyennes par comté peut-elle réduire la sur-prédiction de distribution? https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5551104/

— Priscilla Minotti
source

Merci pour ta réponse Priscilla. J'essaie actuellement d'obtenir des cartes et des données historiques sur la couverture terrestre qui fournissent des informations sur les routes et les cantons. L'espoir est de croiser ces informations avec des étiquettes de spécimens de musées historiques pour mieux les géoréférencer. Bien que l'aspect SDM ne soit pas un problème majeur, je voudrais vraiment les géoréférencer avec précision car je veux échantillonner ces spécimens pour l'analyse génétique. Des réflexions sur ce dernier?

— Vijay Ramesh