J'essaie de marquer chaque paragraphe de texte transcrit avec des horodatages indiquant quand / où il apparaît dans l'audio.
mplayeret emacsme rapproche.  mplayer, dans le terminal, émet un flux d’informations temporelles appropriées; par exemple. (journal de commandes et exemples)    
mplayer au-file 1>event.log 2>&1
A:   0.8 (00.7) of 3207.0 (53:27.0)  0.1% [J
A:   0.9 (00.9) of 3207.0 (53:27.0)  0.1% [J
A:   1.0 (01.0) of 3207.0 (53:27.0)  0.1% [JCertaines clés non liées (par exemple, F12) peuvent être utilisées pour marquer un événement dans le journal, en particulier pour le début d'un paragraphe.    
xdotool key --window $termID F12
A:   3.1 (03.0) of 3207.0 (53:27.0)  0.1% [J
No bind found for key 'F12'.                         
A:   3.2 (03.2) of 3207.0 (53:27.0)  0.1% [J
A:   3.3 (03.3) of 3207.0 (53:27.0)  0.1% [JCe qui précède fonctionne bien. Il faut ensuite que les numéros de ligne soient injectés event.log. Je vais probablement utiliser emacspour déclencher ces deux événements de l'intérieur emacs, en liant une clé pour lire la pointposition actuelle et en l'ajoutant au journal.   
Oui, vous l'avez deviné, j'ai un problème. Il semble que mplayergarder un pointeur de flux (ou quelque chose?), Car quand il écrit sa prochaine ligne, il écrase le texte que j'ai ajouté. Je ne sais pas ce qui se passe, mais aucune de mes lignes ajoutées n'apparaît dans le journal final ... je l'ai déjà utilisée echo $number >>events.log.   
J'ai regardé le journal via   tail -f events.loget il montre une de mes lignes de temps en temps, donc ils doivent y arriver ...   
Y-a-t-il moyen de faire autrement? 
Soit par certains fuau journal, ou une méthode entièrement différente, par exemple. un outil qui fait exactement cela, en temps réel .. J'ai examiné les outils de sous-titrage et les éditeurs audio-vidéo, mais ils semblent trop maladroits .. Je suis ouvert à toutes les idées.