Que vous mettiez à l'échelle la sortie de votre DFT, en avant ou en inverse, cela n'a rien à voir avec la convention ou ce qui est mathématiquement pratique. Cela a tout à voir avec l'entrée de la DFT. Permettez-moi de montrer quelques exemples où la mise à l'échelle est requise ou non requise pour la transformation directe et inverse.
Doit mettre à l'échelle une transformation directe de 1 / N.
Pour commencer, il doit être clair que pour analyser une simple onde sinusoïdale, la longueur de la transformation ne devrait pas être pertinente, mathématiquement parlant. Supposons que N = 1024, Freq = 100 et que votre signal soit:
f (n) = cos (Fréq * 2 * Pi * n / N)
Si vous prenez une DFT de 1024 points de f (n), vous constaterez que bin [100] = 512. Mais ce n'est pas une valeur significative tant que vous ne l'avez pas mise à l'échelle par N. 512/1024 = 1/2 et bien sûr, l'autre 1/2 est dans le spectre négatif dans bin [924].
Si vous doublez la longueur de la DFT, N = 2048, les valeurs de sortie seraient le double de celles de la DFT à 1024 points, ce qui, encore une fois, rend les résultats dénués de sens à moins que nous ne les mettions à l'échelle 1 / N. La longueur de la TFD ne devrait pas être un facteur dans ce type d'analyse. Donc, dans cet exemple, vous devez redimensionner le DFT par 1 / N.
Ne doit pas mettre à l'échelle une transformation directe.
Supposons maintenant que vous ayez la réponse impulsionnelle d'un filtre FIR à 32 prises et que vous souhaitiez connaître sa réponse en fréquence. Pour plus de commodité, nous supposerons un filtre passe-bas avec un gain de 1. Nous savons que pour ce filtre, la composante continue du DFT doit être 1. Et il doit être clair que ce sera le cas quelle que soit la taille du DFT car la composante DC est simplement la somme des valeurs d'entrée (c'est-à-dire la somme des coefficients FIR).
Ainsi, pour cette entrée, la DFT n'est pas mise à l'échelle par 1 / N pour obtenir une réponse significative. C'est pourquoi vous pouvez mettre à zéro une réponse impulsionnelle autant que vous le souhaitez sans affecter le résultat de la transformation.
Quelle est la différence fondamentale entre ces deux exemples?
La réponse est simple. Dans le premier cas, nous avons fourni de l'énergie pour chaque échantillon d'entrée. En d'autres termes, l'onde sinusoïdale était présente pour les 1024 échantillons, nous avons donc dû mettre à l'échelle la sortie de la DFT au 1/1024.
Dans le deuxième exemple, par définition, nous n'avons fourni de l'énergie que pour 1 échantillon (l'impulsion à n = 0). Il a fallu 32 échantillons pour que l'impulsion se fraye un chemin à travers le filtre à 32 prises, mais ce délai n'est pas pertinent. Puisque nous avons fourni de l'énergie pour 1 échantillon, nous mettons à l'échelle la sortie de la DFT de 1. Si une impulsion était définie avec 2 unités d'énergie au lieu de 1, nous mettrions à l'échelle la sortie de 1/2.
Ne doit pas mettre à l'échelle une transformation inverse.
Considérons maintenant une DFT inverse. Comme pour le DFT avancé, nous devons considérer le nombre d'échantillons auxquels nous fournissons de l'énergie. Bien sûr, nous devons être un peu plus prudents ici car nous devons remplir à la fois les cases de fréquence positive et négative de manière appropriée. Cependant, si nous plaçons une impulsion (c'est-à-dire un 1) dans deux cases appropriées, alors la sortie résultante de la DFT inverse sera une onde cosinus avec une amplitude de 2 quel que soit le nombre de points que nous utilisons dans la DFT inverse.
Ainsi, comme avec la DFT directe, nous ne mettons pas à l'échelle la sortie de la DFT inverse si l'entrée est une impulsion.
Doit mettre à l'échelle une transformation inverse.
Considérons maintenant le cas où vous connaissez la réponse en fréquence d'un filtre passe-bas et que vous souhaitez effectuer une TFD inverse pour obtenir sa réponse impulsionnelle. Dans ce cas, puisque nous fournissons de l'énergie à tous les points, nous devons mettre à l'échelle la sortie de la DFT de 1 / N pour obtenir une réponse significative. Ce n'est pas aussi évident car les valeurs d'entrée seront complexes, mais si vous travaillez sur un exemple, vous verrez que c'est vrai. Si vous n'évoluez pas de 1 / N, vous aurez des valeurs de réponse impulsionnelle de crête de l'ordre de N, ce qui ne peut pas être le cas si le gain est 1.
Les quatre situations que je viens de détailler sont des exemples de points finaux où il est clair comment mettre à l'échelle la sortie de la DFT. Cependant, il y a beaucoup de zone grise entre les points d'extrémité. Prenons donc un autre exemple simple.
Supposons que nous ayons le signal suivant, avec N = 1024, Freq = 100:
f(n) = 6 * cos(1*Freq * 2*Pi * n/N) n = 0 - 127
f(n) = 1 * cos(2*Freq * 2*Pi * n/N) n = 128 - 895
f(n) = 6 * cos(4*Freq * 2*Pi * n/N) n = 896 - 1023
Notez les différences d'amplitude, de fréquence et de durée pour les trois composants. Malheureusement, la DFT de ce signal affichera les trois composants au même niveau de puissance, même si le 2ème composant a 1/36 du niveau de puissance des deux autres.
Le fait que les trois composants fournissent la même quantité d'énergie est évident, ce qui explique les résultats de la DFT, mais il y a un point important à souligner ici.
Si nous connaissons la durée des différentes composantes de fréquence, nous pouvons alors mettre à l'échelle les différents intervalles de fréquence en conséquence. Dans ce cas, nous ferions cela pour mettre à l'échelle avec précision la sortie de la DFT: bin [100] / = 128; bin [200] / = 768; bac [400] / = 128;
Ce qui m'amène à mon dernier point; en général, nous n'avons aucune idée de la durée pendant laquelle une composante de fréquence particulière est présente à l'entrée de notre DFT, nous ne pouvons donc pas faire ce type de mise à l'échelle. En général, cependant, nous fournissons de l'énergie pour chaque point d'échantillonnage, c'est pourquoi nous devrions mettre à l'échelle la TFD avant de 1 / N lors de l'analyse d'un signal.
Pour compliquer les choses, nous appliquerions presque certainement une fenêtre à ce signal pour améliorer la résolution spectrale de la DFT. Étant donné que les première et troisième composantes de fréquence sont au début et à la fin du signal, elles sont atténuées de 27 dB tandis que la composante centrale n'est atténuée que de 4 dB (fenêtre de Hanning).
Pour être clair, la sortie de la DFT peut être une assez mauvaise représentation de l'entrée, mise à l'échelle ou non.
Dans le cas de la DFT inverse, qui est généralement un problème de mathématiques pures, par opposition à l'analyse d'un signal inconnu, l'entrée de la DFT est clairement définie, vous savez donc comment mettre à l'échelle la sortie.
Lors de l'analyse d'un signal avec un analyseur de spectre, analogique ou FFT, les problèmes sont similaires. Vous ne connaissez pas la puissance du signal affiché, sauf si vous connaissez également son rapport cyclique. Mais même dans ce cas, le fenêtrage, la portée, les taux de balayage, le filtrage, le type de détecteur et d'autres facteurs fonctionnent tous pour faire fausse route.
En fin de compte, vous devez être très prudent lorsque vous vous déplacez entre les domaines temporel et fréquentiel. La question que vous avez posée concernant la mise à l'échelle est importante, donc j'espère avoir clairement indiqué que vous devez comprendre l'entrée vers la DFT pour savoir comment mettre à l'échelle la sortie. Si l'entrée n'est pas clairement définie, la sortie de la DFT doit être considérée avec beaucoup de scepticisme, que vous la moduliez ou non.