Перейти к содержанию

Utilisation

Démarrage rapide

Voici un exemple d'utilisation de base :

```(python depuis RealtimeTTS import TextToAudioStream, SystemEngine, AzureEngine, ElevenlabsEngine

moteur = SystemEngine () # remplacer par votre moteur TTS flux = TextToAudioStream(moteur) stream.feed("Bonjour le monde! Comment ça va aujourd'hui ?") stream.play_async() ``

Flux Texte

Vous pouvez alimenter des chaînes individuelles :

``(`python stream.feed(« Bonjour, c'est une phrase. »)

Ou vous pouvez alimenter des générateurs et des itérateurs de caractères pour le streaming en temps réel :

```(python def write (prompt : str) : pour chunk en openai.ChatCompletion.create( modèle="gpt-3.5-turbo", messages=[{"role": "utilisateur", "contenu" : prompt}], stream=True ): si (text_chunk := chunk[« choix »][0][« delta »].get(« contenu »)) n'est pas Aucun : produire du texte_chunk

text_stream = write (« Un discours relaxant en trois phrases »)

stream.feed(text_stream) ``

``(`python char_iterator = iter (« Diffusion de ce personnage par personnage ») stream.feed (char_iterator)

Layback

Asynchrone:

``(`python stream.play_async() pendant que stream.is_playing(): temps.sommeil(0,1)

Synchronisé:

``(`python stream.play()

Tester la bibliothèque

Le sous-répertoire de test contient un ensemble de scripts pour vous aider à évaluer et comprendre les capacités de la bibliothèque RealtimeTTS.

Notez que la plupart des tests reposent toujours sur l'« ancienne » API OpenAI (<1.0.0). L'utilisation de la nouvelle API OpenAI est démontrée dans openai_1.0_test.py.

  • simple_test.py

    • Description : Une démonstration de style « hello world » de l'usage le plus simple de la bibliothèque.
  • complex_test.py

    • Description : Une démonstration complète présentant la plupart des fonctionnalités fournies par la bibliothèque.
  • coqui_test.py

    • Description : Test du moteur local coqui TTS.
  • traducteur.py

    • Dépendances: Exécuter pip install openai realtimestt.
    • Description : Traductions en temps réel dans six langues différentes.
  • openai_voice_interface.py

    • Dépendances: Exécuter pip install openai realtimestt.
    • Description : Interface utilisateur activée par mot de réveil et basée sur la voix vers l'API OpenAI.
  • advanced_talk.py

    • Dépendances: Exécuter pip install openai keyboard realtimestt.
    • Description : Choisissez le moteur et la voix TTS avant de démarrer la conversation sur l'IA.
  • _talkbot.py minimaliste

    • Dépendances: Exécuter pip install openai realtimestt.
    • Description : Un talkbot basique en 20 lignes de code.
  • simple_llm_test.py

    • Dépendances: Exécuter pip install openai.
    • Description : Démonstration simple de la façon d'intégrer la bibliothèque avec de grands modèles de langage (LLM).
  • test_callbacks.py

    • Dépendances: Exécuter pip install openai.
    • Description : présente les rappels et vous permet de vérifier les temps de latence dans un environnement d'application réel.

Mettre en pause, reprendre et arrêter

Mettre en pause le flux audio :

``(`python stream.pause()

Reprendre un flux en pause :

``(`python stream.reprendre()

Arrêtez immédiatement le flux :

``(`python stream.stop()

Exigences expliquées

  • Version Python:
  • Obligatoire: Python >= 3.9, < 3.13
  • Raison : La bibliothèque dépend de la bibliothèque GitHub « TTS » de coqui, qui nécessite des versions Python dans cette gamme.

  • PyAudio : pour créer un flux audio de sortie

  • stream2sent : pour diviser le flux de texte entrant en phrases

  • pyttsx3 : Moteur de conversion texte-parole du système

  • pydub : pour convertir les formats de morceaux audio

  • azure-cognitiveservices-speech : Moteur de conversion texte-parole azur

  • elevenlabs : Moteur de conversion texte-parole Elevenlabs

  • coqui-TTS : Bibliothèque de synthèse vocale XTTS de Coqui pour un TTS neuronal local de haute qualité

Criez à Idiap Research Institute pour entretenir une fourche de coqui tts.

  • openai : pour interagir avec l'API TTS d'OpenAI

  • gtts : Google traduit la conversion texte-parole