L'équivariance et l'invariance sont parfois utilisées de manière interchangeable. Comme l'a souligné @ Xi'an , vous pouvez trouver des utilisations dans la littérature statistique, par exemple sur les notions d' estimateur invariant et en particulier d' estimateur de Pitman .
Cependant, je voudrais mentionner qu'il serait préférable que les deux termes restent séparés , car le préfixe " in " dans invariant est privatif (signifiant "aucune variance"), tandis que " équi- " dans équivariant se réfère à "variable". dans une proportion similaire ou équivalente ". En d'autres termes, l'un ne bouge pas, l'autre le fait .
Commençons par de simples caractéristiques d’image et supposons que l’image je ait un maximum unique m pour la position spatiale du pixel ( xm,ym) , qui est ici la principale caractéristique de classification. En d'autres termes: une image et toutes ses traductions sont "les mêmes" . Une propriété intéressante des classificateurs est leur capacité à classer de la même manière certaines versions déformées je′ de je , par exemple des traductions par tous les vecteurs ( u , v ) .
La valeur maximale m′ de je′ est invariante : m′= m : la valeur est la même. Alors que son emplacement sera à ( x′m, y′m) = ( xm- u , ym- v ) , il est équivariant , ce qui signifie qu’il varie "de manière égale" avec la distorsion .
Les formulations précises données en mathématiques pour l'équivariance dépendent des objets et des transformations que l'on considère, je préfère donc ici la notion la plus utilisée dans la pratique (et je peux être blâmé d'un point de vue théorique).
Ici, les traductions (ou une action plus générique) peuvent être équipées de la structure d'un groupe g , g étant un opérateur de traduction spécifique. Une fonction ou une caractéristique F est invariante sous g si, pour toutes les images d'une classe, et pour tout g ,
F( g( Je) ) = f( Je).
Il devient équivalent s'il existe une autre structure mathématique ou action (souvent un groupe) g′ qui reflète les transformations de g de manière significative . En d' autres termes, de telle sorte que pour chaque g , vous avez une expérience unique d' un g′∈ G′ tel que
F( g( Je) ) = g′( f( Je) ).
Dans l'exemple ci-dessus sur le groupe de traductions, g et g′ sont identiques (et donc g′= G ): une traduction entière de l'image correspond à la même traduction exacte de l'emplacement maximal.
Une autre définition commune est:
F( g( Je) ) = g( f( Je) ).
J'ai toutefois utilisé des g et des g′ potentiellement différents , car parfois F( Je) et g( Je) ne sont pas dans le même domaine. Cela se produit par exemple dans les statistiques multivariées (voir, par exemple , les propriétés d'équivariance et d'invariance des fonctions quantiles multivariées et connexes, et le rôle de la normalisation ). Mais ici, l'unicité de la cartographie entre g et g′ permet de revenir à la transformation initiale g .
Souvent, les gens utilisent le terme invariance parce que le concept d'équivariance est inconnu ou tout le monde utilise l'invariance, et l'équivariance semble plus pédante.
Pour mémoire, d’autres notions connexes (notamment en mathématiques et en physique) sont appelées covariance , contravariance , invariance différentielle .
En outre, l'invariance par translation, au moins approximative ou dans une enveloppe, a été une quête de plusieurs outils de traitement du signal et de l'image. Notamment, des transformations à plusieurs taux (banques de filtres) et à plusieurs échelles (ondelettes ou pyramides) ont été conçues au cours des 25 dernières années, par exemple sous le capot de transformées en ondelettes (pour une revue sur les ondelettes 2D, panorama sur les représentations géométriques multi-échelles ). Les ondelettes peuvent absorber quelques variations d'échelle discrètes. Toutes ces invariances (approximatives) viennent souvent avec le prix de la redondance dans le nombre de coefficients transformés. Mais ils sont plus susceptibles de produire des caractéristiques invariantes ou équivariantes.