paragon-intelligence
diff --git a/‎agentle/tts/audio_format.py‎
Lines changed: 6 additions & 0 deletions b/‎agentle/tts/audio_format.py‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎agentle/tts/elevenlabs_tts_provider.py‎
Lines changed: 67 additions & 0 deletions b/‎agentle/tts/elevenlabs_tts_provider.py‎
Lines changed: 67 additions & 0 deletions
diff --git a/‎agentle/tts/output_format_type.py‎
Lines changed: 26 additions & 0 deletions b/‎agentle/tts/output_format_type.py‎
Lines changed: 26 additions & 0 deletions
diff --git a/‎agentle/tts/real_time/definitions/audio_data.py‎
Lines changed: 0 additions & 20 deletions b/‎agentle/tts/real_time/definitions/audio_data.py‎
Lines changed: 0 additions & 20 deletions
diff --git a/‎agentle/tts/real_time/definitions/speech_config.py‎
Lines changed: 0 additions & 27 deletions b/‎agentle/tts/real_time/definitions/speech_config.py‎
Lines changed: 0 additions & 27 deletions
diff --git a/‎agentle/tts/real_time/definitions/speech_result.py‎
Lines changed: 0 additions & 14 deletions b/‎agentle/tts/real_time/definitions/speech_result.py‎
Lines changed: 0 additions & 14 deletions
diff --git a/‎agentle/tts/real_time/definitions/tts_stream_chunk.py‎
Lines changed: 0 additions & 15 deletions b/‎agentle/tts/real_time/definitions/tts_stream_chunk.py‎
Lines changed: 0 additions & 15 deletions
diff --git a/‎agentle/tts/real_time/definitions/voice_gender.py‎
Lines changed: 0 additions & 9 deletions b/‎agentle/tts/real_time/definitions/voice_gender.py‎
Lines changed: 0 additions & 9 deletions
diff --git a/‎agentle/tts/real_time/definitions/voice_info.py‎
Lines changed: 0 additions & 18 deletions b/‎agentle/tts/real_time/definitions/voice_info.py‎
Lines changed: 0 additions & 18 deletions
diff --git a/‎agentle/tts/real_time/real_time_speech_to_text_provider.py‎
Lines changed: 0 additions & 66 deletions b/‎agentle/tts/real_time/real_time_speech_to_text_provider.py‎
Lines changed: 0 additions & 66 deletions
@@ -0,0 +1,6 @@
+from typing import Literal
+
+
+AudioFormat = Literal[
+    "audio/mpeg", "audio/wav", "audio/opus", "audio/basic", "application/octet-stream"
+]
@@ -0,0 +1,67 @@
+import base64
+from collections.abc import AsyncIterator
+from typing import override
+
+from agentle.tts.audio_format import AudioFormat
+from agentle.tts.output_format_type import OutputFormatType
+from agentle.tts.speech_config import SpeechConfig
+from agentle.tts.speech_result import SpeechResult
+from agentle.tts.tts_provider import TtsProvider
+from agentle.utils.needs import needs
+
+
+class ElevenLabsTtsProvider(TtsProvider):
+    @override
+    @needs("elevenlabs")
+    async def synthesize(self, text: str, config: SpeechConfig) -> SpeechResult:
+        from elevenlabs import AsyncElevenLabs
+        from elevenlabs.types.voice_settings import (
+            VoiceSettings as ElevenLabsVoiceSettings,
+        )
+
+        elevenlabs = AsyncElevenLabs()
+        audio_stream: AsyncIterator[bytes] = elevenlabs.text_to_speech.convert(
+            text=text,
+            voice_id=config.voice_id,
+            model_id=config.model_id,
+            output_format=config.output_format,
+            voice_settings=ElevenLabsVoiceSettings(
+                stability=config.voice_settings.stability,
+                use_speaker_boost=config.voice_settings.use_speaker_boost,
+                similarity_boost=config.voice_settings.similarity_boost,
+                style=config.voice_settings.style,
+                speed=config.voice_settings.speed,
+            )
+            if config.voice_settings
+            else None,
+            language_code=config.language_code,
+        )
+
+        # Collect all chunks into bytes
+        chunks: list[bytes] = []
+        async for chunk in audio_stream:
+            chunks.append(chunk)
+        audio_bytes = b"".join(chunks)
+
+        audio_base64 = base64.b64encode(audio_bytes).decode("utf-8")
+
+        return SpeechResult(
+            audio=audio_base64,
+            mime_type=self._get_mime_type(config.output_format),
+            format=config.output_format,
+        )
+
+    def _get_mime_type(self, output_format: OutputFormatType) -> AudioFormat:
+        """Convert ElevenLabs output format to MIME type."""
+        if output_format.startswith("mp3_"):
+            return "audio/mpeg"
+        elif output_format.startswith("pcm_"):
+            return "audio/wav"  # or "audio/pcm" depending on your use case
+        elif output_format.startswith("ulaw_"):
+            return "audio/basic"
+        elif output_format.startswith("alaw_"):
+            return "audio/basic"
+        elif output_format.startswith("opus_"):
+            return "audio/opus"
+        else:
+            return "application/octet-stream"  # fallback
@@ -0,0 +1,26 @@
+from typing import Literal
+
+
+OutputFormatType = Literal[
+    "mp3_22050_32",
+    "mp3_24000_48",
+    "mp3_44100_32",
+    "mp3_44100_64",
+    "mp3_44100_96",
+    "mp3_44100_128",
+    "mp3_44100_192",
+    "pcm_8000",
+    "pcm_16000",
+    "pcm_22050",
+    "pcm_24000",
+    "pcm_32000",
+    "pcm_44100",
+    "pcm_48000",
+    "ulaw_8000",
+    "alaw_8000",
+    "opus_48000_32",
+    "opus_48000_64",
+    "opus_48000_96",
+    "opus_48000_128",
+    "opus_48000_192",
+]