Texte naturel à la parole?


Réponses:


51

SVOX pico2wave

Un TTS très minimaliste, un meilleur son que espeak ou mbrola (à mon avis). Quelques informations ici .

Je ne comprends pas pourquoi pico2wave est, par rapport à espeak ou mbrola, rarement discuté. C'est petit, mais ça sonne vraiment bien (naturel). Sans modification, vous entendrez une voix féminine au son naturel.

ET ... comparé à Mbrola, il reconnaît les unités et le parle correctement!
Par exemple:

  • 2 ° C → deux degrés
  • 2m → deux mètres
  • 2 kg → deux kilogrammes

Après l'installation, je l'utilise dans un script:

#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

Puis lancez-le avec le texte souhaité:

<scriptname>.sh "hello world"

ou lisez le contenu d'un fichier entier:

<scriptname>.sh "$(cat <filename>)"

C'est tout pour avoir un TTS stable et léger sous Ubuntu.


1
Autant que je sache, il utilise uniquement les paramètres CLI en entrée. Est-il possible que pico2wave lise du texte à partir d'un nom de fichier?
Carlos Eugenio Thompson Pinzón

13
pico2waveest dans le paquet libttspico-utilsdans les versions récentes d'ubuntu. @ CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
naught101

1
@ CarlosEugenioThompsonPinzón pico2wave -w a.wav "$(input.txt)"=). Convenez que cette interface CLI est de mauvaise conception: contrairement à la très grande majorité des CLI et il est possible d’atteindre la longueur d’argument de la CLI OS max .
Ciro Santilli a annoncé le

1
@ Koen je ne sais pas! :-) Comme pour tout autre problème, essayez de produire un exemple minimal, par exemple en utilisantecho {1..1000}
Ciro Santilli 事件 中心 法轮功 六四 事件

1
@ user49557 Nous ne sommes pas censés détourner les questions des autres, alors vous pouvez peut-être créer une nouvelle question, expliquant ce que vous avez installé exactement et ce qui n'a pas fonctionné, puis je peux toujours essayer de vous aider (aucune garantie, bien que , Je ne suis pas un expert: P)
Koen

22

Dis le!

Je crois que j'ai trouvé le meilleur logiciel TTS gratuitement en utilisant une extension Google Chrome appelée "SpeakIt". Cela ne fonctionne que dans le navigateur Chrome pour moi sur Ubuntu. Cela ne fonctionne pas avec le chrome pour une raison quelconque. SpeakIt est livré avec deux voix féminines qui paraissent toutes les deux très réalistes par rapport à tout le reste. Il existe au moins quatre autres voix masculines et féminines répertoriées dans les extensions Chrome si vous effectuez une recherche dans le Chrome Web Store en utilisant "TTS" comme requête.

Utilisation : Pour une utilisation sur un site Web. vous mettez en surbrillance le texte que vous voulez lire, puis cliquez avec le bouton droit de la souris sur "SpeakIt" ou cliquez sur l'icône SpeakIt ancrée dans la barre supérieure de Chrome.


Les utilisateurs de Firefox ont également deux options. Dans les addons de Firefox, faites une recherche sur TTS et vous devriez trouver "Cliquez sur Parler" ainsi que "Texte à la voix". Les voix ne sont pas aussi bonnes que celles de Chrome SpeakIt, mais elles sont définitivement utilisables.

L’extension SpeakIt utilise la technologie iSpeech et pour un prix de 20 USD par an, le site peut convertir du texte en fichiers audio MP3. Vous pouvez entrer du texte, des URL, des flux RSS, ainsi que des documents tels que TXT, DOC et PDF, et les exporter au format MP3. Vous pouvez créer un podcast, intégrer de l'audio, etc. Voici un lien et un échantillon de l'audio (ne sais pas combien de temps le lien durera).


3
Malheureusement, aucune des options du navigateur ne fonctionne pour les fichiers PDF. Avez-vous rencontré un qui fait? J'aimerais pouvoir sélectionner des paragraphes à lire à partir d'un fichier PDF (c.-à-d. Ne pas avoir à coller des bits dans un terminal ou autre)
James Owers

1
cette extension fonctionne pour moi sur le chrome 50.0.2661.94 avec Debian 8.4 et c’est génial! J'aime particulièrement la voix féminine anglaise. Le seul reproche que je ferais, c'est qu'il marque une pause trop longue sur des virgules.
Mulllhausen

Il arrive souvent que les mots soient mal prononcés et qu’il faut également du temps pour envoyer le texte à un serveur distinct plutôt que de simplement utiliser votre propre système.
Goddard

14

Pico et espeak sont amusants et faciles à utiliser, mais ils ne sont pas très bons. Les voix par défaut du Festival ne sont pas très bonnes non plus. Cependant, Festival est un cadre de parole basé sur un schéma, dans lequel un certain nombre de chercheurs ont construit de bien meilleures voix plug-in. Vous pouvez facilement surpasser la qualité pico2wave d'Ubuntu d'origine, car l'une de ces voix est disponible sous forme de package clé en main.

Pour rendre le festival naturel, voici ce qu'il faut faire:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Vous pouvez le faire depuis la ligne de commande en utilisant -b(ou --batch) et en mettant chaque commande entre guillemets simples:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Vous pouvez obtenir d’autres voix assez bonnes à partir du référentiel Nitech, mais leur installation est fastidieuse et les chemins par défaut ont été modifiés. Il peut donc être nécessaire de modifier manuellement les références de nom de fichier dans les fichiers de schéma fournis pour pouvoir fonctionner avec Ubuntu.


2
Btw, dans Ubuntu 16.04, ce paquet semble manquer. Vous pouvez télécharger et installer le fichier deb à partir de Debian et tout fonctionnera correctement : packages.debian.org/sid/all/festvox-us-slt-hts/download sudo dpkg -i Téléchargements / festvox-us-slt-hts_0.2010.10. 25-2_all.deb
Jon Watte

13

Simple Google ™ TTS

Mise à jour à partir de la page du projet (2019-02) : Ce projet n'est pas maintenu et le restera dans un avenir prévisible.


En l'absence de meilleure alternative, j'ai écrit un script bash qui s'interface avec un script perl de Michal Fapso afin de fournir des informations TTS via Google Translate. De la description du projet:

Le but est de fournir une interface facile à utiliser pour la sortie texte-parole via le système de synthèse vocale de Google. Une option de secours utilisant pico2wave fournit automatiquement une synthèse TTS si aucune connexion Internet n’est trouvée.

Dans l'état actuel des choses, l'encapsuleur prend en charge la lecture à partir de l'entrée standard, des fichiers de texte brut et de la sélection X (texte en surbrillance).

Les principales caractéristiques sont:

  • synthèse TTS en ligne via Google Translate
  • synthèse TTS hors ligne via pico2wave
  • prend en charge une variété de langues différentes
  • peut lire à partir de la CLI, des fichiers texte et du texte surligné
  • prend en charge la lecture du texte en surbrillance avec un formatage fixe (par exemple, les fichiers PDF)

L'installation et l'utilisation sont documentées sur la page du projet .

Je serais heureux si vous essayiez. Les rapports de bugs et tout autre commentaire sont les bienvenus!


Ce doit être l'un des projets les plus cool que j'ai jamais vu. Juste wow. 😲

5
Ce n'est plus maintenu.
Goddard

8

J'ai cherché haut et bas un texte de synthèse vocale pour Ubuntu de grande qualité. Il n'y en a pas. Mes cordes vocales sont paralysées, il fallait donc que TTS ajoute des instructions vocales à mes vidéos Ubuntu . Vous pouvez obtenir un logiciel de synthèse vocale Linux de haute qualité ici . C'est vraiment très cher. J'ai fini par acheter Natural Reader pour Windows (ne fonctionne pas sous Ubuntu sous Wine) pour 40 $. Peut-être que plus tard, j'aurai celui de Linux.


mec, il y en a et je l'utilisais comme la semaine dernière, il y en a au moins 5 ou 6 et je ne peux plus rien y faire maintenant, je dois aimer notre communauté
mchid

Textaloud a reçu des instructions pour que son produit fonctionne sous le vin. see nextup.com/forum/viewtopic.php?t=3349 Je crois que Cepstral a aussi un port linux. Je n'ai pas réussi à faire fonctionner mon logiciel favori, balabolka. J'ai installé Windows 10 principalement pour le traitement de tts. MS David est bon et ressemble à Cepstral David. Le précédent est gratuit si vous avez Windows 10.
Bhikkhu Subhuti

6

Je mène des recherches sur les voix au texte qui sonnent le mieux et qui s’accordent le mieux. Vous trouverez ci-dessous une liste de ce que je pensais être le top 5 des produits par ordre de qualité sonore. La plupart des sites Web associés à ces produits ont une démo interactive qui vous permettra de prendre votre propre décision.

  1. NeoSpeech
  2. iVona
  3. Acapela
  4. AT & T Voix Naturelles
  5. Voix CereProc

1
Existe-t-il des disponibilités pour Linux? Je ne le pense pas
Mehdi Khademloo

5

Je trouve que les voix de Nitech HTS au festival sont très naturelles et réconfortantes par rapport aux autres voix que j'ai entendues. Voir ce lien pour savoir comment configurer Nitech et d’autres sons avec festival. Je n'ai pas trouvé de bon gui que je puisse utiliser pour configurer ces voix mais les régler via festival.scm fonctionne toujours. Ce message est très ancien et vous voudrez peut-être trouver le répertoire d'installation à l'aide de la commande "localiser le festival"


Semble être très bon. Démos
Iacchus

2
Oui, les voix de Nitech dépassent de loin les voix du Festival (à l’exception des voix de la CMU, qui sont également très efficaces). Dommage qu’elles soient difficiles à installer. Il y a une bonne voix CMU qui a un paquet par défaut dans Ubunut, elle s'appelle cmu_us_slt_arctic_hts et vient dans le paquet festvox-us-slt-hts. C'est beaucoup mieux que pico ou espeak!
Jon Watte

5

Combinez les outils SVOX (pico) avec LibreOffice:

Les outils SVOX (pico) sont faciles à installer et apportent des voix de bonne qualité dans Ubuntu. Installez-le:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Vous pouvez utiliser LibreOffice en combinaison avec les outils SVOX (pico) en installant l' extension "Read Text" et vous obtenez une "interface graphique" pour cet excellent logiciel TTS:

Configurez les options de Read Text Extension avec Outils - Modules - Sélection de lecture .... Utilisez / usr / bin / python en tant que programme externe. Sélectionnez une option de ligne de commande incluant le jeton (PICO_READ_TEXT_PY) . Vous voudrez peut-être en expérimenter certaines.

Il ne vous reste plus qu'à sélectionner du texte dans LO Writer, Calc, Impress ou Draw et à cliquer sur l'icône ajoutée sous forme de barre d'outils (un visage heureux avec un ballon).


4

Voici ce que j'ai fait pour avoir un discours purement naturel pour les fichiers PDF et autres fichiers texte (les autres solutions ne sont pas naturelles ou ce sont juste des services payants). C’est en fait un moyen de contourner le chrome ou le chrome, mais cela fonctionne rapidement et facilement.

  1. Installez SpeakIt! extension sur votre chrome ou chrome.
  2. Installez PDF Viewer si vous utilisez du chrome (chrome a déjà une visionneuse pdf gratuite) et cochez les options "Autoriser incognito" et "Autoriser l'accès aux URL de fichier" dans les paramètres d'extensions de chrome.
  3. Glissez-déposez votre pdf dans le navigateur.
  4. Maintenant, mettez du texte en surbrillance, cliquez avec le bouton droit de la souris et sélectionnez SpeakIt! afin que vous puissiez écouter de la synthèse vocale naturelle.

Il existe également des moyens d'ouvrir d'autres fichiers tels que .doc et .txt dans chrome et de faire de même. Il existe d'autres extensions pour Chrome qui affichent les fichiers pdf. Vérifiez si cela vous convient mieux. De plus, vous pouvez télécharger tous types de textes dans Google Drive et utiliser SpeakIt! le lire pour vous. Une autre extension appelée 'Speak text' fonctionne de la même manière et a un langage naturel.


Pourriez-vous préciser comment faire lire à SpeakIt des fichiers pdf enregistrés dans Google Drive?
Marco Lackovic

2

En cherchant un meilleur moteur tts à utiliser avec le nouveau mode narratif firefox 49, j'ai trouvé pico tts (svox) - mon moteur TTS préféré.

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Comment changer le système de moteur de synthèse vocale par défaut?

Les gens de arch linux m'ont amené sur le droit chemin:

Décommentez le module que vous aimez et faites-le par défaut dans les paramètres du répartiteur de parole:

# sudo vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Redémarrez le démon:

# sudo systemctl restart speech-dispatcher.service

MAIS, lors du redémarrage de Firefox, rien ne se passe. Selon le lien ci-dessus (arch forum post # 10 et 16) fonctionne avec festival (n’a pas essayé), mais le répartiteur de parole de pico ne répertorie pas les voix disponibles. Ça ne courra pas.

Toute idée serait très appréciée ;-)


1

Mon programme de synthèse vocale préféré s'appelle Magic English, mais comme Natural Reader mentionné par Joe Steiger, il s'agit d'un programme Windows et je ne sais pas s'il fonctionnera sous Wine.

AT & T Natural Voices est disponible en ligne sous forme de démo, mais c'est plus une solution de contournement qu'une solution ...


1

Simple Google ™ TTS

Pico, mbrola, cmu, festival, flite, tous SUCK en 2017 (Ils étaient incroyables dans les années 90). Le discours naturel d'AT & T (ce qui est fantastique) n'est pas Linux compat et n'est pas gratuit, nous utilisons donc Google

git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -

Ceci est une copie de la réponse Glutanimate (l'auteur de ce projet). Aussi: "Mise à jour du statut: Ce projet n'est pas maintenu et le restera dans un avenir prévisible." Il suggère des alternatives
Pablo A

1

GTS

gTTS ( Google Text-to-Speech ), une bibliothèque Python et un outil CLI permettant une interface avec l'API textuelle de Google Translate. Écrit des mp3données parlées dans un fichier, un objet de type fichier (bytestring) pour une manipulation audio ultérieure, ou stdout.

Inconvénients : CLI uniquement. Vous devez être en ligne, car cela nécessite de demander à Google public endpoint ouvert.

sudo -H pip install gTTS  # Install

Usage

gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -

Documentation et autres exemples

Autres

Certains ont déjà été mentionnés


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.