Erhalten Sie 5 Millionen Zeichen pro Monat für 12 Monate kostenlos

Amazon Polly – KI-Sprachgenerator

Setzen Sie hochwertige, natürlich klingende menschliche Stimmen in Dutzenden von Sprachen ein.

AWS-Konto erstellen

Was ist Amazon Polly?

Amazon Polly ist ein vollständig verwalteter Service, der On-Demand-Sprache generiert und jeden Text in einen Audiostream umwandelt. Verwendung von Deep-Learning-Technologien zur Konvertierung von Artikeln, Webseiten, PDF-Dokumenten und anderen Text-zu-Sprache (TTS). Polly bietet Dutzende lebensechter Stimmen in einer Vielzahl von Sprachen, mit denen Sie sprachgesteuerte Anwendungen erstellen können, die ansprechen und konvertieren. Erfüllen Sie die unterschiedlichen Sprach-, Zugänglichkeits- und Lernbedürfnisse von Benutzern in allen Regionen und Märkten. Leistungsstarke neuronale Netzwerke und generative Sprachmaschinen arbeiten im Hintergrund und synthetisieren Sprache für Sie. Integrieren Sie die Amazon-Polly-API in Ihre vorhandenen Anwendungen, um schnell sprachbereit zu sein.

Anwendungsfälle

Generieren Sie Sprache in Dutzenden von Sprachen.

Fügen Sie Anwendungen mit einem globalen Publikum Sprache hinzu, z. B. RSS-Feeds, Websites oder Videos. Machen Sie Ihre Mobil- und IoT-Anwendungen sprachbereit für die Zukunft.

Weitere Informationen zur Sprachgenerierung.

Sprechen Sie Kunden mit einer natürlich klingenden Stimme an

Speichern Sie die Sprachausgabe von Amazon Polly und geben Sie sie wieder, um Anrufer mit interaktiven oder automatischen Sprachdialogsystemen zu informieren. Nutzen Sie KI-Funktionen, um Stimmen zu generieren, die Ihre Kundschaft emotional ansprechen.

Weitere Informationen zu Sprach-Engines

Zu einem Bruchteil der Kosten Audio für Medien erstellen

Erstellen Sie Voiceover für Animationen, Spiele und andere Medien direkt aus Ihren Skripten. Verwenden Sie SSML, eine W3C-Standard-XML-basierte Markup-Sprache, um Phrasierung, Betonung und Intonation an die jeweilige Szene anzupassen. Passen Sie die Sprachdauer automatisch an, um mehrsprachiges Synchronisieren zu erleichtern.

Mehr über SSML erfahren

Funktionsmöglichkeiten

Amazon Polly verfügt über eine Vielzahl von Funktionen, darunter einige der unten aufgeführten

Lebensechte Stimmen

Konversationelle Benutzererlebnisse in gleichbleibend schnellen Reaktionszeiten bieten

Wenn Sie eine Amazon-Polly-Ausgabe anfordern, können Sie aus Dutzenden lebensechter Stimmen und verschiedenen Sprachen wählen. Jede Stimme wird von Muttersprachlern erstellt, wobei es auch innerhalb derselben Sprache Variationen von Stimme zu Stimme gibt. Die meisten Sprachen enthalten eine oder mehrere Männer- und Frauenstimmen, sodass Sie die für Ihren Anwendungsfall am besten geeignete Sprache auswählen können.

Frau in gelber Jacke mit Telefon auf der Brücke

Individuell anpassbare Ausgabe

Sprachausgabe nach Bedarf anpassen und steuern

Mit Amazon Polly können Sie benutzerdefinierte Text-zu-Sprache-Ausgaben erstellen, die die Aufmerksamkeit Ihres Publikums wecken und halten. Verwenden Sie benutzerdefinierte Lexika, um die Aussprache von Akronymen, Firmennamen, interner Terminologie oder anderen Wörtern Ihrer Wahl zu ändern. Mit den Speech Synthesis Markup Languages (SSML)-Tags von Amazon Polly können Sie auch Betonung, Intonation, Phrasierung und Stil anpassen. Generieren Sie eine KI-Sprachausgabe, die am besten zu Ihrem Unternehmen passt.

Bild von Männern, die in einem Büro arbeiten

Leistung der generativen KI

Zu einem Bruchteil der Kosten auf integrierte Generative-KI-Funktionen zugreifen

Amazon Polly unterstützt mehrere Sprach-Engines, aus denen Sie wählen können, um Text-zu-Sprache zu konvertieren. Die Engine verwendet einen Transformer mit Milliarden Parametern, um Stimmen schrittweise und streambar zu erzeugen. Dieser KI-Sprachgenerator erzeugt synthetische Sprache, die selbstbewusst, emotional engagiert und sehr umgangssprachlich ist, ähnlich einer echten menschlichen Stimme.

Junge Geschäftsleute arbeiten zusammen an einem neuen Projekt

Kontrolle und Sicherheit

Sicheres Speichern und Verteilen von Sprache in Standardformaten

Speichern Sie Ihre Text-zu-Sprache-Ausgabe in Standard-Audiodateien wie MP3 und OGG zur Verbreitung, Analyse, Archivierung oder für andere Anwendungsfälle ohne zusätzliche Kosten. Zwischenspeichern Sie Ihre Dateien, um sie bei Bedarf schneller abrufen zu können. Die Sicherheit, das Vertrauen und der Datenschutz Ihrer Inhalte haben für AWS höchste Priorität. Amazon Polly speichert den Inhalt Ihrer Textübermittlungen nicht.

Bild der Hände einer Person bei der Arbeit am PC

Häufig gestellte Fragen

Ist der Service Text-zu-Sprache von Amazon Polly kostenlos?

Ja. Amazon Polly bietet nach Ihrer Anmeldung ein Jahr lang kostenlose Text-zu-Sprache-KI-Services an – bis zu einer Mindestnutzungsschwelle. Der Schwellenwert variiert je nach der von Ihnen ausgewählten Sprach-Engine zwischen 100 000 Zeichen und 5 Millionen Zeichen. Weitere Informationen finden Sie unter Amazon-Polly-Preise.

Wie viele Stimmen hat Amazon Polly?

Amazon Polly bietet über 100 männliche und weibliche Stimmen in über 40 Sprachen und Sprachvarianten. AWS aktualisiert und erweitert unsere Sprachfunktionen ständig.

Wie hoch ist die Samplerate von Amazon Polly?

Amazon Polly produziert MP3-, OGG- und andere Standard-Audiodateiformate, die mit 8 000 Hz, 16 000 Hz und 22 050 Hz gesampelt wurden.

Benutzt Alexa Amazon Polly?

Die Antwort lautet Ja. Derzeit verwendet Alexa die Polly-Technologie, um die Text-zu-Sprache-Generierungslösung voranzutreiben. Die Alexa-Stimmen wurden jedoch exklusiv für Alexa entwickelt und sind nicht extern verfügbar.

Ist Amazon Polly Open-Source?

Nein. Amazon Polly ist ein vollständig verwalteter Cloud-KI-Service. Sie kommunizieren damit über APIs in Ihrem Code. Sie können den Amazon-Polly-Quellcode nicht herunterladen oder in Ihrer Umgebung bereitstellen. Sie können Amazon Polly jedoch ab Ihrem Start 12 Monate lang kostenlos nutzen (bis zu einem vorab festgelegten Nutzungsgrenzwert). Weitere Informationen finden Sie unter Amazon-Polly-Preise.