Amazon Polly : générateur vocal IA

Déployez des voix humaines de haute qualité et naturelles dans des dizaines de langues

Qu'est-ce qu'Amazon Polly ?

Amazon Polly est un service entièrement géré qui génère de la voix à la demande, en convertissant n’importe quel texte en flux audio. Utilisation de technologies de deep learning pour convertir des articles, des pages Web, des documents PDF et d’autres textes en synthèse vocale (TTS). Polly propose des dizaines de voix réalistes couvrant un large éventail de langues pour vous permettre de créer des applications à commande vocale qui stimulent l’engagement et la conversion. Répondez aux divers besoins linguistiques, d’accessibilité et d’apprentissage des utilisateurs de toutes les zones géographiques et de tous les marchés. Des réseaux neuronaux et des moteurs vocaux génératifs performants fonctionnent en arrière-plan et synthétisent la parole pour vous. Intégrez l’API Amazon Polly à vos applications existantes pour être rapidement compatible avec la voix. 

Capacités

Amazon Polly propose diverses fonctionnalités, dont certaines sont répertoriées ci-dessous.

Voix réalistes

Proposez des expériences utilisateur conversationnelles dans des temps de réponse constamment rapides

Lorsque vous demandez une sortie Amazon Polly, vous pouvez choisir parmi des dizaines de voix réalistes et différentes langues. Chaque voix est créée par des locuteurs natifs, avec des variations entre les voix, voire au sein d’une même langue. La plupart des langues incluant une ou plusieurs voix masculines et féminines, vous pouvez donc choisir celle qui convient le mieux à votre cas d’utilisation.

Femme sur un pont avec un téléphone en veste jaune

Sortie personnalisable

Personnalisation et contrôle de la sortie vocale selon vos besoins

Amazon Polly vous permet de créer une sortie de synthèse vocale personnalisée qui attire et retient l’attention de votre public. Utilisez des lexiques personnalisés pour modifier la prononciation des acronymes, des noms de sociétés, de la terminologie interne ou de tout autre terme de votre choix. Les balises SSML (Speech Synthesis Markup Languages) d’Amazon Polly vous permettent également de régler l’accentuation, l’intonation, le phrasé et le style. Générez une sortie d’IA vocale qui convient le mieux à votre activité.

Image d’hommes travaillant dans un bureau

Puissance de l’IA générative

Accédez à des fonctionnalités d’IA générative intégrées à une fraction du coût

Amazon Polly prend en charge plusieurs moteurs vocaux parmi lesquels vous pouvez choisir à des fins de synthèse vocale. Le moteur déploie un transformeur d’un milliard de paramètres pour générer des voix de manière incrémentielle et diffusable. Ce générateur de voix basé sur l’IA crée un discours synthétique assertif, émotionnellement engagé et très familier, similaire à une véritable voix humaine.

Jeunes entrepreneurs travaillant ensemble sur un nouveau projet

Contrôle et sécurité

Stockage et redistribution en toute sécurité de la parole dans des formats standard 

Stockez votre sortie de synthèse vocale sans frais supplémentaires dans des fichiers audio standard tels que MP3 et OGG pour la redistribution, l’analyse, l’archivage ou tout autre cas d’utilisation. Mettez vos fichiers en cache pour les récupérer plus rapidement au besoin. La sécurité, la confiance et la confidentialité de votre contenu sont les principales priorités d’AWS. Amazon Polly ne conserve pas le contenu de vos textes envoyés.

Image des mains d’une personne travaillant sur un PC

Cas d'utilisation

Ajoutez la parole aux applications destinées à un public mondial, comme les flux RSS, les sites Web ou les vidéos. Faites en sorte que vos applications mobiles et IoT soient compatibles avec les fonctionnalités vocales.

En savoir plus sur la génération vocale.

Stockez et lisez une sortie vocale Amazon Polly pour guider les appelants grâce à des systèmes de réponse téléphonique interactifs ou automatisés. Utilisez les capacités de l’IA pour générer des voix qui établissent un lien émotionnel avec vos clients.

En savoir plus sur les moteurs vocaux

Créez des voix off pour des animations, des jeux et d’autres contenus multimédias directement à partir de vos scripts. Utilisez SSML, un langage de balisage basé sur XML standard W3C, pour ajuster le phrasé, l’accentuation et l’intonation en fonction de la scène. Réglez automatiquement la durée de la parole pour faciliter le doublage multilingue.

En savoir plus sur SSML

Questions fréquentes (FAQ)

Oui. Amazon Polly propose des services d’intelligence artificielle de synthèse vocale gratuits pendant un an après votre inscription, jusqu’à un seuil d’utilisation minimum. Le seuil varie de 100 000 à 5 millions de caractères selon le moteur vocal que vous choisissez. Pour en savoir plus, consultez Tarification d’Amazon Polly.
Amazon Polly propose plus de 60 voix masculines et féminines dans plus de 40 langues et variantes linguistiques. AWS met à jour et complète constamment ses fonctionnalités vocales.
Amazon Polly produit des fichiers MP3, ogg et d’autres formats de fichiers audio standard échantillonnés à 8 000 Hz, 16 000 Hz et 22 050 Hz.
La réponse est Oui. Actuellement Alexa, l’assistant vocal virtuel d’Amazon, utilise Polly pour la synthèse de texte, mais les voix ont été créées exclusivement pour Alexa.
Non. Amazon Polly est un service d’IA cloud entièrement géré. Vous communiquez avec lui à l’aide des API dans votre code. Vous ne pouvez ni télécharger ni déployer le code source d’Amazon Polly dans votre environnement. Cependant, vous pouvez utiliser Amazon Polly gratuitement (dans la limite d’un seuil d’utilisation prédéterminé) pendant 12 mois à compter de la date de démarrage. Pour en savoir plus, consultez Tarification d’Amazon Polly.

En savoir plus sur AWS