J'ai besoin de sous-définir les données d'un NetCDF à l'aide d'un fichier de formes spécifique. Les données sont la température de la surface de la mer et la couleur de l'océan à une résolution de 1/4 degré. J'ai 4 polygones décrivant les États-Unis. Grand écosystème marin du plateau continental nord-est et ses sous-composants que je dois utiliser pour extraire les données. Je travaille avec des fichiers composites mensuels de 1982 à 2014, donc cette routine d'extraction de données doit être automatisée. Les fichiers sont déjà classés dans la grille de la zone de travail approximative de [35, 45, -80, -60].
Auparavant, nous convertissions les fichiers de données HDF5 en rasters dans R et les traitions de cette façon, mais cette méthode est vraiment inefficace et je suis sûr qu'il existe une meilleure solution en Python en utilisant les fichiers NetCDF actuels.
Jusqu'à présent, j'ai utilisé GDAL et Fiona pour lire les fichiers de formes et NetCDF4 pour charger les fichiers de données. Je ne sais pas comment procéder pour sous-définir les données. J'ai trouvé ça:
GDAL pour Python: extraire des sous-domaines du fichier NetCDF?
Mais je n'ai pas la moindre idée de la façon de sous-définir un fichier NetCDF en utilisant autre chose qu'une simple boîte englobante, ce que ces polygones ne sont certainement pas.
Le point dans les routines polygonales prendrait probablement une éternité pour fonctionner, mais je pourrais peut-être sous-définir les données en utilisant un cadre de délimitation plus petit qui est tourné pour s'adapter à ces formes comme ceci comme point de départ initial, puis faire une recherche point par point:
Des idées?
EDIT 1:
Je viens de découvrir le package OpenClimateGIS qui semble pouvoir parfaitement convenir ... J'essaierai avec cela pour voir si je peux le faire fonctionner: http://ncpp.github.io/ocgis/examples. html # advanced-subsetting