Réponses:
Ce dont vous avez besoin, c'est d'un logiciel de "reconnaissance vocale". Il en existe beaucoup, mais sachez que les résultats nécessitent généralement beaucoup de corrections. Les DVD seront particulièrement difficiles, car ils ont plusieurs haut-parleurs différents, possiblement beaucoup de bruit et une prononciation incorrecte / non standard. Vous ne pouvez donc vous attendre à un brouillon de la transcription, mais vous devrez quand même en faire beaucoup à la main.
Sur le plan technique, vous devrez probablement extraire l’audio du DVD (en utilisant un logiciel d’extraction, par exemple. mplayer
), puis exécutez-le via un programme de reconnaissance vocale.
Regardez les réponses sous les balises speech-recognition
et speech-to-text
sur superutilisateur pour les logiciels que vous pouvez utiliser.
Si le contenu contient des sous-titres codés, ceux-ci peuvent être traduits directement et de manière fiable dans les données du DVD. Cependant, ils ne sont souvent pas exactement ce qui est dit, mais plutôt paraphrasés pour pouvoir être lus, lorsque le dialogue est rapide (et rarement tout simplement faux).
Les sous-titres peuvent souffrir de la même paraphrase. En outre, sur les DVD, ils sont implémentés en tant que superpositions graphiques. Vous avez donc besoin d'une sorte d'OCR pour les reconvertir en texte.
Ce n’est pas une tâche à laquelle les ordinateurs excellent. Avez-vous envisagé d'utiliser turk mécanique ?
la reconnaissance vocale précise sans formation du logiciel est impossible ... pour les invites connues (comme dans un RVI), vous pouvez faire une chose de logique floue où ça "sonne comme" x, y, z ou redire ... ce n'est pas possible de générer des transcriptions / sous-titres pour les DVD