Comment savoir s'il y a un signal (quand votre signal ressemble beaucoup à du bruit)?

C'est à nouveau mon détecteur de ronflement.

Je suis devenu assez bon pour détecter un signal quand il y a quelque chose - peut suivre un ronflement qui s'écaille sur le mur jusqu'à une respiration que vous ne pouvez même pas entendre dans l'enregistrement. Le problème est que je ne peux pas dire quand le signal est tombé en dessous du niveau détectable et que l'application "entend des choses". Et, malheureusement, le ronflement / la respiration est souvent suffisamment irrégulier pour qu'une simple autocorrélation ou un schéma de synchronisation d'intervalle similaire ne soit pas d'un grand secours. (Et il est en fait probable que dans certains cas, le bruit soit plus régulier que la respiration.)

Alors, y a-t-il des astuces qui me manquent pour déterminer quand il n'y a pas de signal? Il semble que je sois confronté à un endroit difficile ici, étant donné que le "signal" est si bruyant pour commencer.

(Et peut-être que cela est lié à un autre problème que je rencontre: étrangement, je ne peux pas mesurer avec précision (ou même approximativement) le niveau du signal même lorsqu'il est assez fort. Étant donné que je dois utiliser des moyennes et des ratios roulants pour détecter le signal de toute façon, le niveau d'information se perd. Je cherche des astuces pour le reconstituer.)

Technique de base

(Pour Yoda)

Le signal audio est échantillonné (généralement à 8000 Hz, pour diverses raisons), puis FFT en 1024 blocs. (Dans mes expériences, les filtres de Hamming et les blocs qui se chevauchent semblent avoir peu d'effet, bien que ceux-ci puissent être revus plus tard.)

La FFT est divisée en "bandes" (actuellement 5, de taille légèrement asymétrique pour donner plus de détails sur le bas) et la "différence spectrale" et le niveau de chaque bande sont additionnés. Les moyennes à long terme des valeurs limitées de crête sont utilisées comme «seuils», et d'autres ajustements de biais sont utilisés pour maintenir un taux «supérieur au seuil» d'environ 20%.

Chaque valeur "au-dessus du seuil" reçoit un poids de 1 (sous le seuil est donné un poids de 0), mais ensuite ce poids est ajusté par la "variabilité" apparente (à environ 2 Hz) dans la bande, pour donner plus de poids aux bandes qui transportent un signal plus apparent.

Les poids des bandes sont additionnés, puis les poids additionnés des blocs suivants sont additionnés sur environ une seconde pour produire un "score" courant. Ceci est à nouveau comparé à un seuil moyen courant (plus plusieurs heuristiques) pour détecter le début / décalage du ronflement.

Mettre à jour

Il m'est soudain venu à l'esprit que si mon algorithme maintient efficacement un signal de niveau constant (par mon problème de niveau de signal), le moyen de mesurer efficacement le SNR est de mesurer le bruit lorsqu'il n'y a pas de signal.

Idéalement, les ronflements sont intermittents, avec beaucoup "d'air mort" entre les deux. Et je détecte déjà les enveloppes de ronflement. Donc, tout ce qui se trouve en dehors de l'enveloppe (entre la fin d'un ronflement et le début du suivant) est probablement du bruit! Je peux le mesurer (avec un degré modeste de précision / répétabilité). (Il a fallu trois essais pour arriver à un algorithme à moitié décent, bien sûr - la réalité ne correspond jamais à la théorie.)

Je n'ai donc pas encore la réponse complète, mais j'ai progressé.

(Bien que la technique ci-dessus me donne un assez bon proxy pour le SNR, j'ai toujours du mal à estimer le niveau de signal réel. Mes indications de "niveau relatif" peuvent être hors échelle pour un souffle à peine audible et ainsi de suite pour un cliquetis de fenêtre. J'ai besoin d'une sorte de proxy pour le niveau absolu.)

noise snr

— Daniel R Hicks
source

"Ceci est à nouveau mon détecteur de ronflement" - pourriez-vous s'il vous plaît lier à votre question précédente (où vous l'avez probablement décrit en détail) ou ajouter quelques détails sur votre détecteur dans cette question?

— Lorem Ipsum

@yoda - dsp.stackexchange.com/questions/450/… , dsp.stackexchange.com/questions/1292/… et dsp.stackexchange.com/questions/1395/… .

— Daniel R Hicks

Réponses:

Jusqu'à présent, vous sembliez identifier le ronflement grâce à la présence d'un motif périodique fort dans l'audio. Si vous me dites qu'il pourrait y avoir d'autres sources avec la même propriété, il est temps de passer à autre chose et de se concentrer sur une propriété du signal plus spécifique du ronflement; et je suggère de regarder plus précisément le timbre du son enregistré lui-même. Étant donné qu'un auditeur humain peut s'éloigner du ronflement de la respiration, vous pouvez recourir à une approche traditionnelle de classification des signaux audio. Calculez des fonctionnalités telles que les MFCC et les modèles de fluctuation sur vos données audio et entraînez un classificateur bayésien (ou plus sophistiqué) pour distinguer le ronflement de la respiration.

Il serait peut-être temps aussi de passer en revue la littérature sur le sujet ... Par exemple, j'ai trouvé ceci: http://web.itu.edu.tr/kamasak/pubs/pdf/pm7_8_007.pdf

— pichenettes
source

Un problème est que la nature du son varie tellement d'un individu à l'autre et même pour un seul individu au cours d'une nuit. Mais merci pour les indices - je vais les examiner.

— Daniel R Hicks

Si votre ensemble de formation est suffisamment grand, cela pourrait toujours être possible en utilisant des techniques d'apprentissage automatique.

— pichenettes

J'ai plus de 50 ensembles de données. Malheureusement, un algorithme qui fonctionne parfaitement sur un ensemble échoue lamentablement sur l'autre. Certains ont la télévision en arrière-plan, certains ont des appareils de traitement de l'air qui grondent, etc. Un sujet peut changer de position et changer complètement la nature de son ronflement. Une sorte de schéma d'auto-réglage est clairement nécessaire.

— Daniel R Hicks

quelles fonctionnalités utilisez-vous pour la classification?

— pichenettes

Principalement juste une "différence spectrale" (également appelée "flux spectral") pour détecter le "début" et le "décalage". Mais mon schéma actuel divise le spectre en bandes et "pondère" chaque bande en fonction de la force du signal apparent dans cette bande (qui est jugée par la quantité de variation de la différence spectrale se produisant à environ 1/2 Hz). Cela fonctionne bien pour détecter la respiration / le ronflement sur toute la plage de volume, même avec un bruit important, mais il perd efficacement toute indication du volume réel. Et simplement regarder le niveau sonore total simultané ne fonctionne pas en raison du problème de bruit.

— Daniel R Hicks

Vous devrez peut-être créer un classificateur dynamique, qui peut s'adapter au sujet, à la phase de sommeil et à l'environnement audio actuels, plutôt que de vous accorder sur un ensemble d'entraînement fixe.

— hotpaw2
source

Voilà ce que je pense.

— Daniel R Hicks