Une technique de traitement du signal, la fréquence de Mel Cepstrum , est souvent utilisée pour extraire des informations d'une pièce musicale pour une utilisation dans une tâche d'apprentissage automatique. Cette méthode donne un spectre de puissance à court terme et les coefficients sont utilisés en entrée.
Lors de la conception de systèmes de récupération de musique, ces coefficients sont considérés comme caractéristiques d'une pièce (évidemment pas nécessairement uniques, mais distinctifs). Y a-t-il des caractéristiques qui conviendraient mieux à l'apprentissage avec un réseau? Est-ce que des caractéristiques variant dans le temps comme la progression des basses de la pièce utilisée dans quelque chose comme un réseau Elman fonctionneraient plus efficacement?
Quelles caractéristiques formeraient un ensemble suffisamment étendu sur lequel la classification pourrait avoir lieu?