DFT avec des bacs géométriquement espacés?


16

La Transformée de Fourier Discrète (DFT) traditionnelle et son cousin, la FFT, produisent des bacs espacés également. En d'autres termes, vous obtenez quelque chose comme les 10 premiers hertz dans le premier bac, 10,1 à 20 dans le second, etc. Cependant, j'ai besoin de quelque chose d'un peu différent. Je veux que la plage de fréquence couverte par chaque bac augmente géométriquement. Supposons que je sélectionne un multiplicateur de 1,5. Ensuite, nous avons 0 à 10 dans le premier bac, je veux 11 à 25 dans le deuxième bac, 26 à 48 dans le troisième, etc. Est-il possible de modifier l'algorithme DFT pour se comporter de cette façon?


Vous pouvez toujours calculer DFT aux points d'intérêt. De plus, les banques de transformation et de filtre d' ondelettes discrètes me viennent à l'esprit. Ça vaut peut-être la peine de les regarder.

2
Vous recherchez la transformation Q constante (CQT) .
Paul R

2
Mal formulé. Ce que vous voulez n'est ni nouveau, ni une amélioration dans de nombreux cas.
hotpaw2


2
DFT et FFT ne sont pas des cousins. Ils donnent des résultats identiques.
Phonon

Réponses:


17

Pour citer ma thèse:

Une collection de transformées porte le nom de constante Q et est similaire à la transformée de Fourier.

Le calcul de la transformée de Fourier discrète peut être très efficace lors de l'utilisation de la transformée de Fourier rapide. Cependant, nous remarquons que l'énergie d'un signal est divisée en seaux de fréquence de taille uniforme à travers le spectre. Bien que cela soit utile dans de nombreux cas, nous remarquons des situations où cette distribution uniforme n'est pas optimale. Un exemple important d'un tel cas est observé avec l'analyse des fréquences musicales. Dans la musique occidentale, les fréquences qui composent les gammes musicales sont géométriquement espacées. On voit donc que la cartographie entre les bins de fréquence de la transformée de Fourier discrète et les fréquences d'échelles musicales est insuffisante dans le sens où les bins correspondent mal. La transformation Q constante résout ce problème.

L'objectif de la constante Q est de produire un ensemble de cases de fréquence espacées logarithmiquement dans lesquelles la largeur de la case de fréquence est un produit de la précédente. Par conséquent, nous pouvons produire un nombre identique de cases par note de musique à travers le spectre audible, maintenant ainsi un niveau constant de précision pour chaque note de musique. Les bacs de fréquences s'élargissent vers les fréquences supérieures et se rétrécissent vers les fréquences inférieures. Cette propagation dans la précision de la détection de fréquence imite étroitement la manière dont le système auditif humain répond aux fréquences.

De plus, la correspondance étroite des notes aux échelles occidentales rend la constante-Q particulièrement utile dans la détection des notes; identifier une valeur de note de musique plutôt qu'une valeur de fréquence explicite. De plus, la constante Q simplifie le processus d'analyse du timbre. Les fréquences d'une note musicale jouée par un instrument sont souvent composées de partiels harmoniquement liés. Le timbre de l'instrument peut être caractérisé par les rapports des harmoniques. Avec la transformée Q constante, les harmoniques sont également espacées à travers les cases indépendamment de la fréquence fondamentale. Cela simplifie considérablement le processus d'identification d'un instrument jouant une note n'importe où dans la gamme en déplaçant simplement la caractérisation sur les compartiments.

Brown et Puckette (1992) décrivent en détail un algorithme efficace pour transformer une transformée de Fourier discrète (qui peut être calculée avec la FFT) en une transformée Q constante .


1

Il existe des hypothèses mathématiques importantes dans la DFT (FFT). Le plus important dans ce cas est que vous effectuez une transformation sinusoïdale à temps infini tronquée. La seconde est que le temps tronqué et les signaux de fréquence tronqués sont supposés être enveloppés modulo (circulaires). la paire de temps <-> fréquence est donc parfaitement réversible.

La transformation constante-Q ne tronque pas si bien, donc toute implémentation pratique ne donne pas un appariement ortho-normal parfait. Le noyau est une sinusoïde en décomposition exponentielle infiniment longue et ne peut donc pas avoir l'avantage circulaire indiqué ci-dessus. Si vous ne tronquez pas, ils forment un ensemble orthonormé.

Les transformées en ondelettes sont généralement espacées d'une puissance de 2, ce qui n'est pas très utile pour une estimation de fréquence à grain fin.

La suggestion d'espacer de manière inégale une sinusoïde DFT standard manquera des informations dans la région largement espacée alors qu'elle dupliquera des informations dans la région densément espacée. Sauf si une fonction d'apodisation différente est utilisée pour chaque fréquence ... très coûteuse.

Une solution pratique consiste à effectuer une procédure répétée demi-spectre-> décimer par 2 pour obtenir des sous-sections basées sur l'octave afin de satisfaire une erreur d'estimation minimax par octave. Le rapport portion-spectre-> décimation par rapport peut être réglé sur n'importe quel rapport pour répondre à tout besoin de granularité. Toujours assez intensif en calcul, cependant.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.