La pente moyenne ressemble à une quantité naturelle mais c'est plutôt une chose étrange. Par exemple, la pente moyenne d'une plaine horizontale plate est nulle, mais lorsque vous ajoutez un tout petit peu de bruit aléatoire nul à un DEM de cette plaine, la pente moyenne ne peut que monter. D'autres comportements étranges sont la dépendance de la pente moyenne de la résolution DEM, que j'ai documentée ici , et sa dépendance de la façon dont le DEM a été créé. Par exemple, certains DEM créés à partir de cartes de contours sont en fait légèrement en terrasses - avec de minuscules sauts brusques où se trouvent les lignes de contour - mais sinon, ils sont des représentations précises de la surface dans son ensemble. Ces sauts brusques, s'ils reçoivent trop ou trop peu de poids dans le processus de calcul de la moyenne, peuvent modifier la pente moyenne.
L'augmentation de la pondération est pertinente car, en fait, une moyenne harmonique (et d'autres moyens) pondère différemment les pentes. Pour comprendre cela, considérons la moyenne harmonique de seulement deux nombres positifs x et y . Par définition,
Harmonic mean(x,y) = 1 / ((1/x + 1/y)/2) = x (y/(x+y)) + y (x/(x+y)) = a x + b y
où les poids sont a = y / (x + y) et b = x / (x + y). (Ceux-ci méritent d'être appelés "poids" car ils sont positifs et totalisent l'unité. Pour la moyenne arithmétique, les poids sont a = 1/2 et b = 1/2). Évidemment, le poids attaché à x , égal à y / (x + y), est grand quand x est petit comparé à y . Ainsi, l'harmonique signifie surpondérer les petites valeurs.
Cela peut aider à élargir la question. La moyenne harmonique fait partie d'une famille de moyennes paramétrées par une valeur réelle p . Tout comme la moyenne harmonique est obtenue en faisant la moyenne des inverses de x et y (puis en prenant l'inverse de leur moyenne), en général, nous pouvons faire la moyenne des pth puissances de x et y (puis prendre la puissance 1 / pth du résultat ). Les cas p = 1 et p = -1 sont respectivement les moyennes arithmétique et harmonique. (Nous pouvons définir une moyenne pour p = 0 en prenant des limites et ainsi obtenir la moyenne géométrique en tant que membre de cette famille.) Comme pdiminue à partir de 1, les valeurs les plus petites sont de plus en plus fortement pondérées; et lorsque p augmente à partir de 1, les valeurs les plus élevées sont de plus en plus fortement pondérées. Il s'ensuit que la moyenne ne peut augmenter que lorsque p augmente et doit diminuer lorsque p diminue. (Cela est évident dans la deuxième figure ci-dessous, dans laquelle les trois lignes sont soit plates soit croissantes de gauche à droite.)
En adoptant une vision pratique de la question, nous pourrions plutôt étudier le comportement de divers moyens de pente et ajouter ces connaissances à notre boîte à outils analytiques: lorsque nous nous attendons à ce que les pentes entrent en relation de telle manière que les pentes plus petites devraient recevoir plus de une influence, on pourrait choisir une moyenne avec p inférieur à 1; et inversement, nous pourrions augmenter p au-dessus de 1 afin de souligner les pentes les plus importantes. À cette fin, considérons différentes formes de profils de drainage au voisinage d'un point.
Pour montrer ce qui pourrait continuer, j'ai considéré trois terrains locaux qualitativement différents : l'un est où toutes les pentes sont égales (ce qui fait une bonne référence); une autre est l'endroit où nous nous situons localement au fond d'un bol: autour de nous les pentes sont nulles, mais augmentent progressivement et finalement, autour du bord, deviennent arbitrairement grandes. L'inverse de cette situation se produit lorsque les pentes proches sont modérées mais se stabilisent ensuite loin de nous. Cela semblerait couvrir un large éventail réaliste de comportements.
Voici des tracés pseudo-3D de ces trois types de formes de drainage:
Ici, j'ai calculé la pente moyenne de chacun - avec le même codage couleur - en fonction de p , en laissant p aller de -1 (moyenne harmonique) à 2.
Bien sûr, la ligne bleue est horizontale: quelle que soit la valeur de p , la moyenne d'une pente constante ne peut être autre que cette constante (qui a été fixée à 1 pour référence). Les hautes pentes autour du bord le plus éloigné du bol rouge influencent fortement les pentes moyennes car p varie: remarquez à quel point elles deviennent grandes une fois que p dépasse 1. Le bord horizontal dans la troisième surface (or-vert) provoque la moyenne harmonique (p = - 1) à zéro.
Il est à noter que les positions relatives des trois courbes changent à p = 0 (la moyenne géométrique): pour p supérieur à 0, le bol rouge a des pentes moyennes plus grandes que le bleu, tandis que pour p négatif , le bol rouge a une moyenne plus petite pentes que le bleu. Ainsi, votre choix de p peut même modifier le classement relatif des pentes moyennes.
L'effet profond de la moyenne harmonique (p = -1) sur la forme jaune-vert devrait nous faire réfléchir: il montre que lorsqu'il y a suffisamment de petites pentes dans le drainage, la moyenne harmonique peut être si petite qu'elle écrase toute influence de toutes les autres pistes.
Dans l'esprit d'une analyse exploratoire des données, vous pourriez envisager de faire varier p - peut-être en le laissant varier de 0 à légèrement supérieur à 1 afin d'éviter des poids extrêmes - et de trouver quelle valeur crée la meilleure relation entre la pente moyenne et la variable que vous modélisent (comme les seuils d'initialisation des canaux). «Meilleur» est généralement compris dans le sens de «plus linéaire» ou de «création de résidus [homoscédastiques] constants» dans un modèle de régression.