Synthèse vocale nécessitant très peu de performances CPU?


13

À l'époque des ordinateurs personnels à processeur 1 MHz à 8 bits (Apple II, Atari 800, et.al.), il y avait des logiciels qui pouvaient faire une synthèse arbitraire text-to-speech compréhensible sur ces PC. Quels algorithmes de synthèse vocale publiés pourraient convenir à la mise en œuvre sur des microcontrôleurs aux performances et à la mémoire également limitées? (Si seulement...)


Je ne sais pas comment ils l'ont fait, mais voici un circuit intégré allophone-audio appelé SpeakerJet et voici le générateur de texte-allophone associé. Vous pourriez demander aux gens de speakjet.com comment ils l'ont fait ...
Kevin Vermeer

@KevinVermeer - Pourquoi n'avez-vous pas posté cela comme réponse? Vous auriez au moins obtenu un vote positif de ma part, car cela constituerait un excellent complément à ma propre réponse.
Mark Booth

Réponses:


3

Les méthodes avec lesquelles je jouais sur les ordinateurs personnels 8 bits dans les années 80 impliquaient d'avoir un petit ensemble d'échantillons phonétiques, puis de définir le texte que vous voulez parler en fonction de ces échantillons.

Comme je ne connaissais pas l' IPA à l'époque, j'ai simplement utilisé deux sons par lettre et alloué le son court aux lettres minuscules et aux sons longs en majuscules. Cela a laissé quelques lacunes cependant, o pour / ɒ / ( chaud ) et O pour / oʊ / ( ouvert ) étaient faciles, mais / uː / (le son oo dans la lune ) ne pouvait pas être représenté dans mon système, ce qui était un problème pour moi, étant donné mon nom (/ búð / rime avec / Smud /, les essayer dans itinerarium s la synthèse de phonème page Web).

Ces jours-ci, vous pourriez faire des choses beaucoup plus intelligentes. Pour commencer, vous pouvez utiliser des techniques de recherche pour traduire des mots connus dans du texte orthographique en vos symboles phonétiques connus , et pour des mots inconnus, l'implémentation de Phonics en tant qu'algorithme devrait faire un travail raisonnable.

Après avoir obtenu votre flux phonétique, vous pouvez alors probablement utiliser des techniques DMA pour diffuser des échantillons de phonèmes individuels de la mémoire vers votre DAC, avec moins de surcharge sur votre CPU.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.