Utilisation de décibels dans les statistiques

11

Je travaille sur un projet qui consiste à lire des étiquettes RFID et à comparer la puissance du signal que le lecteur voit lorsque vous changez la configuration de l'antenne (nombre d'antennes, position, etc ...). Dans le cadre du projet, je dois comparer les configurations pour voir lesquelles sont les plus efficaces.

Idéalement, je serais en mesure d'effectuer soit un test t non apparié ou une ANOVA entre deux positions d'antenne (ou MANOVA entre plusieurs). Cependant, comme la réponse est en décibels logarithmiques, je me demande quelle est la meilleure façon de procéder?

Serait-il préférable de convertir les résultats en une échelle linéaire, puis de comparer en utilisant l'une des méthodes que j'ai mentionnées, ou devrais-je utiliser les décibels tels qu'ils sont avec un test statistique différent pour les comparer?

data-transformation linear-model descriptive-statistics

— Brian Truman
source

2

Pris la liberté de modifier les balises. La statistique mathématique est en pratique une balise inutile. La série logarithmique se réfère à quelque chose de tout à fait différent avec une réponse discrète.

— Nick Cox

1

Comme vous utilisez des tests supposant une distribution gaussienne, si la distribution des réponses est "plus gaussienne" en dB que dans l'échelle linéaire (c'est-à-dire que les données d'origine sont approximativement log normales), il est logique de rester dans l'échelle logarithmique.

— Luca Citi

@NickCox, je pense que cela mathematical-statisticsfonctionne très bien lors de la demande d'une preuve, la balise correspondante étant synonyme de l'ancienne balise.

— Richard Hardy

J'aurais peut-être dû dire "une étiquette inutile pour ce genre de question".

— Nick Cox

5

La transformation dépend de l'échelle à laquelle vous souhaitez déduire votre inférence.

Généralement, la variance d'une fonction de n'est pas égale à la fonction de la variance de . Parce que transformant avec , puis en effectuant une inférence statistique (tests d'hypothèse ou intervalles de confiance) sur , puis en retransformant - les résultats de cette inférence appliquer à n'est pas valide (car les statistiques de test et les IC nécessitent une estimation de la variance). $x$ $x$ $\sigma^{2}_{f(x)} \ne f(\sigma^{2}_{x})$ $x$ $f$ $f(x)$ $f^{-1}$ $x$

Baser les IC sur des variables transformées + rétrotransformation produit des intervalles sans les probabilités de couverture nominales, donc la confiance rétrotransformée sur une estimation basée sur n'est pas la confiance sur une estimation basée sur . $f(x)$ $x$

De même, des inférences sur des variables non transformées basées sur des tests d'hypothèses sur des variables transformées signifient que l'une des conditions suivantes peut être vraie, par exemple, lorsque vous faites des inférences sur fonction d'une variable de regroupement : $x$ $y$

diffère significativement entre , mais ne diffère pas significativement entre . $x$ $y$ $f(x)$ $y$
diffère considérablement entre et diffère considérablement entre . $x$ $y$ $f(x)$ $y$
ne diffère pas de manière significative entre et ne diffère pas de manière significative entre . $x$ $y$ $f(x)$ $y$
ne diffère pas significativement entre , mais diffère significativement entre . $x$ $y$ $f(x)$ $y$

En bref, savoir si diffère de manière significative entre les groupes de ne vous dit pas si diffère entre . $f(x)$ $y$ $x$ $y$

Donc, la question de savoir si transformer ces dB est répondu par si vous vous souciez de dB ou dB exponentiated.

— Alexis
source

14

Strictement, nous devons voir vos données pour avoir une chance de donner des conseils définitifs, mais il est possible de deviner.

Comme vous le dites, les décibels sont déjà à l'échelle logarithmique. Cela signifie probablement, pour diverses raisons physiques et statistiques, qu'ils sont très susceptibles de bien se comporter en étant approximativement additifs, homoscédastiques et symétriquement distribués en fonction des prédicteurs. Mais vous pourrez peut-être donner un argument physique ou technique sur la façon dont la réponse devrait varier lorsque vous modifiez vos variables de conception.

Je ne connais aucun principe ou théorie possible qui signifie que vous êtes obligé de les exposer avant d'appliquer un test ou une ANOVA. Je m'attendrais à ce que cela aggrave le comportement statistique, pas mieux. $t$

Le même type de raisonnement s'applique généralement à d'autres échelles logarithmiques "pré-transformées" telles que le pH ou l'échelle de Richter.

PS: Aucune idée de ce que sont les étiquettes RFID.

— Nick Cox
source

4

Les étiquettes RFID sont des étiquettes d'identification par radiofréquence ... ces éléments de votre passeport, du matériel de bibliothèque, de la carte de crédit à puce, etc. qui permettent une identification par jeton sans fil.

— Alexis

2

Downvote apparemment aléatoire là-dedans. Je n'ai pas grand-chose à redire car j'ai plusieurs votes pour peu de travail et ce n'est pas une bonne réponse. (J'aurais pu écrire un meilleur compte tenu de certaines données.) Mais le downvote est futile: sans raison donnée, il n'y a aucune possibilité de changer d'avis!

— Nick Cox

3

N'est-ce pas? Je souhaite vraiment que les électeurs en baisse laissent des commentaires constructifs.

— Alexis

3

Eh bien, la seule façon de répondre définitivement à cette question est de regarder quelques données en décibels - existe-t-il une distribution simple (par exemple la distribution gaussienne) qui est un bon modèle pour cela? Ou l'exponentielle des données est-elle un meilleur candidat? Je suppose que les données non exponentielles sont plus proches de la gaussienne et donc pour rendre toute analyse qui en découle plus simple, vous devriez l'utiliser, mais je vous laisse en juger.

Je conteste l'analyse que vous proposez, qui consiste à appliquer un test de signification aux données observées de différentes expériences (à savoir différentes positions d'antenne). En considérant la physique de cela, il doit y avoir une différence, peut-être minuscule, peut-être substantielle. Mais a priori, il y a une différence, donc avec un ensemble de données suffisamment grand, vous devez rejeter l'hypothèse nulle de pas de différence. Ainsi, l'effet d'un test de signification n'est que de conclure "vous avez / vous n'avez pas un grand ensemble de données". Cela ne semble pas très utile.

Il serait plus utile de quantifier la différence entre les différentes positions d'antenne, et peut-être aussi de prendre en compte les coûts et les avantages pour décider quelle position doit être sélectionnée. Les différences quantifiées sont parfois appelées «analyse de la taille de l'effet»; une recherche sur le Web pour cela devrait révéler certaines ressources. Les coûts et les avantages relèvent de la théorie de l'utilité et de la théorie de la décision; encore une recherche trouvera des ressources.

— Robert Dodier
source

2

L'échelle décibel (logarithmique) est utile car la puissance d'un signal peut souvent être décrite par une série (variable) (ou gamme de fluides) de multiplications.

$\frac{1}{10}$
$\frac{1}{100}$
$\frac{1}{1000}$
etc.

P [m W] = P_{0} {(\frac{1}{dix})}^{L [c m]}

$P[mW] = P_0 \left( \frac{1}{10} \right)^{L[cm]}$

C'est plus simple, si vous exprimez le logarithme de la puissance du signal, en tant que fonction linéaire (qui, si vous le souhaitez, nécessite une définition de l'échelle absolue, dans ce cas, 0 dB correspond à 1 mW)

P [ré B] = dix (Journal (P_{0} [m W]) - L [c m])

$P[dB] = 10 \left(\log(P_0[mW])-L[cm]\right)$

Chaque fois que vous avez un processus multiplicatif comme:

X \propto e^{Oui}

$X \propto e^Y$

$Y$

Oui \sim N (μ, σ^{2})

$Y \sim N(\mu,\sigma^2)$

$X$ $log(X)$

Je m'attends à ce que votre terme d'erreur soit multiplicatif comme ça. C'est-à-dire: la force du signal sera une somme de nombreux termes d'erreur distribués normaux (par exemple les fluctuations de température de l'amplificateur, les conditions atmosphériques, etc.) qui se produisent dans l' exposant de l'expression de la force du signal.

y_{je} = e^{X_{je} + ϵ_{je}}

$y_{i} = e^{x_i+\epsilon_i}$

— Sextus Empiricus
source