Définition technique
Un agent vocal IA = reconnaissance vocale (STT) + LLM raisonnement + synthèse vocale (TTS). La conversation passe en moins d'une seconde : votre parole → texte → réponse LLM → voix synthétisée → vous entendez.
Stack technique 2026
STT : Deepgram Nova-2, OpenAI Whisper Large v3. LLM : Claude 4.7, GPT-5, Mistral. TTS : ElevenLabs Multilingual v2, Cartesia Sonic. Orchestration : LiveKit Agents, Vapi, Retell AI.
Cas d'usage typiques
Voir notre page agent vocal IA pour les cas concrets : standard téléphonique, qualification de leads, prise de RDV automatisée.
Questions fréquentes
600 à 900 ms entre fin de parole utilisateur et début de parole IA. Suffisant pour une conversation naturelle.