La transcription de musique polyphonique ne semble pas actuellement être un problème résolu.
Que diriez-vous de l'inverse d'une petite partie du problème. Existe-t-il des caractéristiques spectrales (à partir d'un STFT) qui peuvent être utilisées pour éliminer certains accords musicaux de l'espace de probabilité? (par exemple, cet extrait de son ne contient probablement pas d'accord C #, ni aucun accord mineur diminué, ou il s'agit d'une seule note et non d'un accord, etc.)
Supposons que l'extrait audio soit plus ou moins stationnaire (attaque transitoire supprimée, etc.) et que des harmoniques pour la plupart ou la totalité des notes individuelles sont très probablement présentes. (Et cette question ne concerne pas les accords inversés.)