Quels sont les équivalents audio d'images comme «Lena», «Mandrill» et «Cameraman»?


21

Je ne sais pas comment appeler ces images, mais elles sont très souvent utilisées dans le monde du traitement d'image comme exemples standard pour montrer la sortie d'une opération particulière. Voici un lien vers la page décrivant Lena comme une "image de test standard" . Des clips audio canoniques similaires sont-ils utilisés pour démontrer les effets de certains filtres ou opérations audio?

Réponses:


17

L'exemple le plus proche auquel je peux penser est le début du «Tom's Diner» de Suzanne Vega qui a été utilisé pour le développement de la couche 3 de mpeg-1, et qui est encore parfois utilisé pour faire la démonstration de codecs audio.


3
oui, Tom's Diner est un extrait de voix de chant raisonnablement propre (sans réverbération) et monophonique qui est utile pour tester les programmes de détection de hauteur. un autre est un clip de Boyz II Men sur leur reprise du "Yesterday" des Beatles (tout à la fin). bon pour le suivi de hauteur d'une voix monophonique. c'est plus difficile que Tom's Diner. je me souviens que Digital Performer l'a utilisé.
robert bristow-johnson

16

Le traitement audio est un vaste domaine, mais spécifiquement dans le traitement de la parole, une base de données ouverte d'échantillons connue sous le nom de Harvard Sentences est largement utilisée. Les phrases de Harvard sont des recueils de phrases phonétiquement équilibrés en anglais américain. De nombreuses bases de données équivalentes existent également pour d'autres langues.

Les fichiers réels avec le discours de Harvard Sentences peuvent être trouvés ici .


5

Je pense également que la base de données NIST est très populaire en ce qui concerne les tâches de reconnaissance vocale. En fait, c'est une norme pour la comparaison de nouveaux algorithmes et techniques lors des défis annuels.

De plus, l' load handelextrait contenant MATLAB de GFHandel - Alléluia est assez couramment utilisé.



2

Ne sous-estimez pas la puissance d'une onde sinusoïdale de 1 kHz à 0 dBFS. En mono. Beaucoup de choses qui ne vont pas avec les trajets du signal peuvent être trouvées avec ça.

J'ai construit et calibré suffisamment de systèmes audio pour pouvoir siffler 1 kHz assez exactement. De simple mémoire.

En dehors de cela, IGY de Donald Fagen est si populaire comme piste d'essai qu'il a été interdit par un certain nombre de festivals.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.