Dans ma quête sans fin pour identifier les ronflements, j'ai trouvé que la "planéité spectrale" semble être une bonne mesure de la "qualité" du signal.
Je calcule la planéité spectrale comme la moyenne géométrique de la puissance FFT points de données divisés par la moyenne arithmétique des mêmes points.
Je calcule ensuite (un peu ici) la moyenne arithmétique courante (sur 50 images) et l'écart type de la planéité spectrale et calcule un écart type "normalisé" comme l'écart type courant divisé par la moyenne courante.
Pour mes échantillons, je trouve que cette métrique est supérieure à environ (allant jusqu'à ou ainsi) lorsque l'audio est "bon" (c'est-à-dire que j'ai un suivi fiable des sons de respiration / ronflement d'un sujet endormi) et qu'il glisse généralement en dessous lorsque l'audio est "dans la boue". (Je peux améliorer quelque peu cette discrimination en utilisant un seuil qui évolue avec d'autres facteurs, mais c'est probablement un sujet différent.) J'observe également que la mesure va au-delà lorsqu'il y a un bruit de fond important (par exemple, quelqu'un entre dans la pièce et bruit).
Donc, ma question de base est: Y a-t-il un nom (au-delà de "l'écart-type normalisé de planéité spectrale") pour ce que je mesure, et quelqu'un peut-il offrir une explication conceptuelle de ce que la métrique "signifie"?
(J'ai essayé une douzaine d'autres métriques pour la "qualité" du signal, et celle-ci semble être la meilleure à ce jour.)
Ajouté: Je devrais probablement admettre que je n'ai pas une poignée conceptuelle particulièrement bonne sur ce que la planéité spectrale simple mesure (juste l'article Wikipedia ), donc toute explication supplémentaire serait appréciée.