Vue d'ensemble
La réponse courte est qu'ils ont le nombre maximum de vanishing moments
pour une donnée support
(c'est-à-dire le nombre de coefficients de filtre). C'est la propriété "extremal" qui distingue les ondelettes de Daubechies en général. En gros, plus le nombre de moments disparus est élevé, plus la compression est bonne et moins le calcul est synonyme de support. En fait, le compromis entre les moments nuls et la taille du filtre est si important qu’il domine la façon dont les ondelettes sont nommées. Par exemple, vous verrez souvent l' D4
ondelette appelée soit D4
ou db2
. Le 4
fait référence au nombre de coefficients, et le2
fait référence au nombre de moments disparus. Les deux font référence au même objet mathématique. Ci-dessous, je vais expliquer plus en détail ce que sont les moments (et pourquoi nous voulons les faire disparaître), mais pour l’instant, comprenez simplement que cela se rapporte au fait que nous pouvons "replier" la plupart des informations contenues dans le signal en un signal plus petit. nombre de valeurs. La compression avec perte est obtenue en gardant ces valeurs et en jetant les autres.
Maintenant, vous avez peut-être remarqué que CDF 9/7
, qui est utilisé dans JPEG 2000
, a deux chiffres dans le nom, plutôt qu'un. En fait, il est également appelé bior 4.4
. C'est parce que ce n'est pas du tout une ondelette "standard". En fait, techniquement, il ne conserve même pas l'énergie contenue dans le signal, et cette propriété est la raison principale pour laquelle les gens ont été si enthousiasmés par le DWT! Les nombres 9/7
et 4.4
font toujours référence aux supports et aux moments d’annulation, respectivement, mais il existe maintenant deux ensembles de coefficients qui définissent l’ondelette. Le terme technique est que plutôt que d'être orthogonal
, ils sont biorthogonal
. Plutôt que de plonger trop profondément dans ce que cela signifie mathématiquement, je
JPEG 2000
Vous trouverez une analyse beaucoup plus détaillée des décisions de conception relatives à l’ondelette CDF 9/7 dans le document suivant:
Usevitch, Bryan E. Tutoriel sur la compression d’images en ondelettes avec pertes modernes: Fondements de JPEG 2000 .
Je vais juste passer en revue les points principaux ici.
Assez souvent, les ondelettes orthogonales de Daubechies peuvent en réalité augmenter le nombre de valeurs requises pour représenter le signal. L'effet s'appelle coefficient expansion
. Si nous effectuons une compression avec perte, cela peut ou non avoir de l'importance (puisque nous jetons quand même des valeurs à la fin), mais cela semble définitivement contre-productif dans le contexte de la compression. Une façon de résoudre le problème consiste à traiter le signal d'entrée comme périodique.
Le simple fait de traiter l'entrée de manière périodique entraîne des discontinuités aux arêtes, plus difficiles à compresser, et ne sont que des artefacts de la transformation. Par exemple, considérons les sauts de 3 à 0 dans l'extension périodique suivante: . Pour résoudre ce problème, nous pouvons utiliser une extension périodique symétrique du signal, comme suit: . L’élimination des sauts sur les bords est l’une des raisons pour lesquelles la transformation en cosinus discrète (DCT) est utilisée à la place de la TFD en JPEG. La représentation d'un signal avec des cosinus suppose implicitement que le signal d'entrée est "bouclé de l'avant à l'arrière". Nous voulons donc des ondelettes ayant la même propriété de symétrie.[ 0 , 1 , 2 , 3 ] → [ . . 0,0 , 1 , 2 , 3 , 0 , 1 , 2 , 3 , . . . ][ 0 , 1 , 2 , 3 ] → [ . . . , 0 , 1 , 2 , 3 , 3 , 2 , 1 , 0 , 0 , 1 ... ]
Malheureusement, la seule ondelette orthogonale qui possède les caractéristiques requises est l’ondelette de Haar (ou D2, db1), qui ne représente qu’un moment d’évanouissement. Pouah. Cela nous conduit aux ondelettes biorthogonales, qui sont en fait des représentations redondantes et ne préservent donc pas l'énergie. La raison pour laquelle les ondelettes CDF 9/7 sont utilisées dans la pratique est qu’elles ont été conçues pour être sur le point de préserver l’énergie. Ils ont également bien testé la pratique.
Il existe d'autres moyens de résoudre les divers problèmes (mentionnés brièvement dans le document), mais ce sont les grandes lignes des facteurs en cause.
Moments de disparition
Alors, quels sont les moments, et pourquoi nous nous soucions d'eux? Les signaux lisses peuvent être bien approximés par des polynômes, c'est-à-dire des fonctions de la forme:
a + b x + c x2+ dX3+ . . .
Les moments d'une fonction (c'est-à-dire d'un signal) mesurent sa similarité avec une puissance donnée de x. Mathématiquement, cela s'exprime comme un produit intérieur entre la fonction et la puissance de x. Un moment de fuite signifie que le produit intérieur est égal à zéro et que la fonction ne "ressemble" donc pas à la puissance de x, comme suit (pour le cas continu):
∫xnf(x)dx=0
Désormais, chaque ondelette orthogonale discrète est associée à deux filtres FIR , qui sont utilisés dans le DWT . L’un est un filtre passe-bas (ou d’échelle) , et l’autre est un filtre passe-haut (ou en ondelettes)ϕψ. Cette terminologie semble varier quelque peu, mais c'est ce que je vais utiliser ici. À chaque étape du DWT, le filtre passe-haut est utilisé pour "décoller" une couche de détails, et le filtre passe-bas fournit une version lissée du signal sans ce détail. Si le filtre passe-haut a des moments nuls, ceux-ci (c'est-à-dire les entités polynomiales d'ordre faible) se verrouillent dans le signal lissé complémentaire plutôt que dans le signal de détail. En cas de compression avec perte, nous espérons que le signal de détail ne contiendra pas beaucoup d’informations et que nous pourrons donc en éliminer la plus grande partie.
Voici un exemple simple utilisant l'ondelette Haar (D2). Un facteur d'échelle de impliqué, mais je l'omets ici pour illustrer le concept. Les deux filtres sont les suivants:
1/2–√
ϕ=[1,1]ψ=[1,−1]
Le filtre passe-haut disparaît pour le zéroième moment, c'est-à-dire , il n'a donc qu'un moment. Pour voir cela, considérons ce signal constant: . Maintenant, intuitivement, il devrait être évident qu'il n'y a pas beaucoup d'informations là-bas (ou dans un signal constant). Nous pourrions décrire la même chose en disant "quatre deux". Le DWT nous donne un moyen de décrire cette intuition de manière explicite. Voici ce qui se passe lors d'un seul passage du DWT utilisant l'ondelette de Haar:x0=1[2,2,2,2]
[2,2,2,2]→ϕψ{[2+2,2+2]=[4,4][2−2,2−2]=[0,0]
Et que se passe-t-il lors du second passage, qui opère uniquement sur le signal lissé:
[4,4]→ϕψ{[4+4]=[8][4−4]=[0]
Remarquez comment le signal constant est complètement invisible pour les détails (qui sont tous égaux à 0). Notez également comment quatre valeurs de ont été réduites à une seule valeur de . Maintenant, si nous voulions transmettre le signal original, nous pourrions simplement envoyer le et le DWT inverse pourrait reconstruire le signal original en supposant que tous les coefficients de détail sont nuls. Les ondelettes avec des moments de fuite d'ordre supérieur permettent des résultats similaires avec des signaux bien approximés par des lignes, des paraboles, des cubiques, etc.8 8288
Lectures complémentaires
Je passe en revue beaucoup de détails pour que le traitement ci-dessus reste accessible. Le document suivant a une analyse beaucoup plus approfondie:
M. Unser et T. Blu, Propriétés mathématiques des filtres d’ondelettes JPEG2000 , IEEE Trans. Image Proc., Vol. 12, non. 9 septembre 2003, pages 1080-1090.
note de bas de page
L'article ci-dessus semble suggérer que l'ondelette JPEG2000 s'appelle Daubechies 9/7 et est différente de l'ondelette CDF 9/7.
Nous avons dérivé la forme exacte des filtres d’échelle JPEG2000 Daubechies 9/7 ... Ces filtres résultent de la factorisation du même polynôme que [10]. La principale différence est que les filtres 9/7 sont symétriques. De plus, contrairement aux splines biorthogonales de Cohen-Daubechies-Feauveau [11], la partie non régulière du polynôme a été divisée de la manière la plus uniforme possible.Daubechies8
[11] A. Cohen, I. Daubechies et JC Feauveau, «Bases biorthogonales d'ondelettes à support compact», Comm. Pure Appl. Math., Vol. 45, non. 5, pages 485 à 560, 1992.
La version préliminaire de la norme JPEG2000 ( lien pdf ) que j'ai consultée appelle également le filtre officiel Daubechies 9/7. Il fait référence à cet article:
M. Antonini, M. Barlaud, P. Mathieu et I. Daubechies, «Codage d’images en utilisant la transformation en ondelettes», IEEE Trans. Image Proc. 1, pages 205-220, avril 1992.
Je n'ai lu aucune de ces sources et je ne peux donc pas dire avec certitude pourquoi Wikipedia appelle le fichier JPEG2 CDF 9/2 de JPEG2000. Il semble qu'il y ait peut-être une différence entre les deux, mais les gens appellent quand même le fichier JPEG2 CDF 9/7 officiel de JPEG2000 (car il repose sur les mêmes bases?). Quel que soit le nom, le papier de Usevitch décrit celui utilisé dans la norme.