Pour faire suite à ma question précédente, je me demandais s'il existait des bibliothèques de détection de la parole. Par détection de la parole, je veux dire passer dans un tampon audio et récupérer un index d'où la parole commence et s'arrête. Donc, si j'ai 10 secondes d'échantillonnage audio à 44 kHz, je m'attendrais à un tableau de nombres tels que:
44000
88000
123000
190334
...
Cela indiquerait par exemple que la parole commence une seconde puis se termine aux deux secondes, etc.
Ce que je ne recherche pas, c'est la reconnaissance vocale qui écrit du texte à partir de la parole. C'est malheureusement ce que je vois beaucoup quand je google «détection de la parole».
Ce serait génial si la bibliothèque était en C, C ++ ou même Objective-C car j'écris une application pour l'iPhone.
Merci!