Utilisation
Démarrage rapide
Voici un exemple d'utilisation de base :
```(
python
depuis RealtimeTTS import TextToAudioStream, SystemEngine, AzureEngine, ElevenlabsEngine
moteur = SystemEngine () # remplacer par votre moteur TTS flux = TextToAudioStream(moteur) stream.feed("Bonjour le monde! Comment ça va aujourd'hui ?") stream.play_async() ``
Flux Texte
Vous pouvez alimenter des chaînes individuelles :
``(`python
stream.feed(« Bonjour, c'est une phrase. »)
Ou vous pouvez alimenter des générateurs et des itérateurs de caractères pour le streaming en temps réel :
```(
python
def write (prompt : str) :
pour chunk en openai.ChatCompletion.create(
modèle="gpt-3.5-turbo",
messages=[{"role": "utilisateur", "contenu" : prompt}],
stream=True
):
si (text_chunk := chunk[« choix »][0][« delta »].get(« contenu »)) n'est pas Aucun :
produire du texte_chunk
text_stream = write (« Un discours relaxant en trois phrases »)
stream.feed(text_stream) ``
``(`python
char_iterator = iter (« Diffusion de ce personnage par personnage »)
stream.feed (char_iterator)
Layback
Asynchrone:
``(`python
stream.play_async()
pendant que stream.is_playing():
temps.sommeil(0,1)
Synchronisé:
``(`python
stream.play()
Tester la bibliothèque
Le sous-répertoire de test contient un ensemble de scripts pour vous aider à évaluer et comprendre les capacités de la bibliothèque RealtimeTTS.
Notez que la plupart des tests reposent toujours sur l'« ancienne » API OpenAI (<1.0.0). L'utilisation de la nouvelle API OpenAI est démontrée dans openai_1.0_test.py.
-
simple_test.py
- Description : Une démonstration de style « hello world » de l'usage le plus simple de la bibliothèque.
-
complex_test.py
- Description : Une démonstration complète présentant la plupart des fonctionnalités fournies par la bibliothèque.
-
coqui_test.py
- Description : Test du moteur local coqui TTS.
-
traducteur.py
- Dépendances: Exécuter
pip install openai realtimestt
. - Description : Traductions en temps réel dans six langues différentes.
- Dépendances: Exécuter
-
openai_voice_interface.py
- Dépendances: Exécuter
pip install openai realtimestt
. - Description : Interface utilisateur activée par mot de réveil et basée sur la voix vers l'API OpenAI.
- Dépendances: Exécuter
-
advanced_talk.py
- Dépendances: Exécuter
pip install openai keyboard realtimestt
. - Description : Choisissez le moteur et la voix TTS avant de démarrer la conversation sur l'IA.
- Dépendances: Exécuter
-
_talkbot.py minimaliste
- Dépendances: Exécuter
pip install openai realtimestt
. - Description : Un talkbot basique en 20 lignes de code.
- Dépendances: Exécuter
-
simple_llm_test.py
- Dépendances: Exécuter
pip install openai
. - Description : Démonstration simple de la façon d'intégrer la bibliothèque avec de grands modèles de langage (LLM).
- Dépendances: Exécuter
-
test_callbacks.py
- Dépendances: Exécuter
pip install openai
. - Description : présente les rappels et vous permet de vérifier les temps de latence dans un environnement d'application réel.
- Dépendances: Exécuter
Mettre en pause, reprendre et arrêter
Mettre en pause le flux audio :
``(`python
stream.pause()
Reprendre un flux en pause :
``(`python
stream.reprendre()
Arrêtez immédiatement le flux :
``(`python
stream.stop()
Exigences expliquées
- Version Python:
- Obligatoire: Python >= 3.9, < 3.13
-
Raison : La bibliothèque dépend de la bibliothèque GitHub « TTS » de coqui, qui nécessite des versions Python dans cette gamme.
-
PyAudio : pour créer un flux audio de sortie
-
stream2sent : pour diviser le flux de texte entrant en phrases
-
pyttsx3 : Moteur de conversion texte-parole du système
-
pydub : pour convertir les formats de morceaux audio
-
azure-cognitiveservices-speech : Moteur de conversion texte-parole azur
-
elevenlabs : Moteur de conversion texte-parole Elevenlabs
-
coqui-TTS : Bibliothèque de synthèse vocale XTTS de Coqui pour un TTS neuronal local de haute qualité
Criez à Idiap Research Institute pour entretenir une fourche de coqui tts.
-
openai : pour interagir avec l'API TTS d'OpenAI
-
gtts : Google traduit la conversion texte-parole