Amazon Polly - AI 음성 생성기

수십 가지 언어로 자연스러운 고음질 음성을 배포

Amazon Polly란 무엇입니까?

Amazon Polly는 온디맨드 방식으로 음성을 생성하여, 어떤 텍스트라도 오디오 스트림으로 변환해주는 완전관리형 서비스입니다. 딥 러닝 기술을 사용하여 기사, 웹 페이지, PDF 문서 및 기타 TTS(텍스트 음성 변환)를 변환합니다. Polly는 실제와 같은 수십 가지 음성을 광범위한 언어로 제공하므로, 참여 및 변환이 가능한 음성 작동 애플리케이션을 구축할 수 있습니다. 여러 지역 및 시장 전반에서 사용자의 다양한 언어, 접근성 및 학습 요구 사항을 충족합니다. 강력한 신경망과 생성형 음성 엔진이 백그라운드에서 작동하여 음성을 합성합니다. Amazon Polly API를 기존 애플리케이션에 통합하여 신속하게 음성을 사용할 수 있습니다. 

기능

Amazon Polly는 아래에 나열된 기능을 비롯하여 다양한 기능을 갖추고 있습니다

실제 같은 음성

일관되게 빠른 응답 시간으로 대화형 사용자 경험 제공

Amazon Polly 출력을 요청할 경우, 수십 개의 실제 같은 음성 및 다양한 언어 중에서 선택할 수 있습니다. 각 음성은 원어민을 사용하여 생성되며, 동일한 언어 내에서도 음성 대 음성 변형이 있습니다. 대부분의 언어에는 하나 이상의 남성 및 여성 음성이 포함되므로, 사용 사례에 가장 적합한 언어를 선택할 수 있습니다.

노란 재킷을 입고 전화기를 들고 다리 위에 있는 여자

사용자 지정 가능한 출력

필요에 따라 음성 출력 사용자 지정 및 제어

Amazon Polly를 사용하면 청중의 관심을 끌고 유지하기 위한 사용자 지정 텍스트 음성 변환 출력을 생성할 수 있습니다. 사용자 어휘집을 사용하여 두문자어, 회사 이름, 내부 용어 또는 선택한 기타 단어의 발음을 수정할 수 있습니다. 또한 Amazon Polly의 Speech Synthesis Markup Language(SSML) 태그를 사용하여 강조, 억양, 구문, 스타일을 조정할 수 있습니다. 비즈니스에 가장 적합한 음성 AI 출력을 생성하세요.

사무실에서 일하고 있는 남자 이미지

생성형 AI 기반

기본 제공되는 생성형 AI 기능을 적은 비용으로 이용 가능

Amazon Polly는 텍스트를 음성으로 변환하기 위해 선택할 수 있는 여러 가지 음성 엔진을 지원합니다. 이 엔진은 10억 개의 파라미터 트랜스포머를 배포하여 점진적이고 스트리밍 가능한 방식으로 음성을 생성합니다. 이 AI 음성 생성기는 명확하고, 감정적으로 몰입하며, 자연스러운 구어체에 가까운 실제 사람의 음성과 유사한 합성 음성을 생성합니다.

함께 새로운 프로젝트를 위해 일하는 젊은 사업가들

제어 및 보안

형식으로 음성을 안전하게 저장하고 재배포

재배포, 분석, 보관 또는 기타 사용 사례를 위해 텍스트 음성 변환 출력을 MP3 및 OGG 같은 표준 오디오 파일에 저장하여 추가 비용 없이 사용할 수 있습니다. 필요한 경우 파일을 캐시하여 더 빠르게 검색할 수 있습니다. 콘텐츠의 보안, 신뢰도, 개인 정보 보호는 AWS의 최우선 과제입니다. Amazon Polly는 사용자가 제출한 텍스트의 내용을 저장하지 않습니다.

PC에서 작업하는 사람의 손 이미지

사용 사례

글로벌 고객을 대상으로 하는 RSS 피드, 웹 사이트 또는 동영상과 같은 애플리케이션에 음성을 추가합니다.

음성 생성에 대해 자세히 알아보기

Amazon Polly 음성 출력을 저장하고 재생하여 대화형 또는 자동화된 음성 응답 시스템을 통해 문의 고객을 안내할 수 있습니다.

신경망 텍스트 음성 변환(TTS)에 대해 자세히 알아보기

음성 합성 애플리케이션을 위한 SSML, W3C 표준, XML 기반 마크업 언어를 사용하고 표현, 강조 및 억양을 위한 일반 SSML 태그를 지원합니다.

SSML에 대해 자세히 알아보기

FAQ

예. Amazon Polly는 가입 후 1년 동안 최소 사용량 임계값까지 무료 텍스트 음성 변환 AI 서비스를 제공합니다. 임계값은 선택하는 음성 엔진에 따라 100,000자에서 500만 자까지 다양합니다. 자세한 내용은 Amazon Polly 요금 페이지를 참조하세요.
Amazon Polly는 40개 이상의 언어 및 언어 변형을 통해 60가지 이상의 남성 및 여성 음성을 제공합니다. AWS는 음성 기능을 지속적으로 업데이트 및 추가하고 있습니다.
Amazon Polly는 8,000Hz, 16,000Hz, 22,050Hz로 샘플링된 MP3, OGG 및 기타 표준 오디오 파일 형식을 제작합니다.
대답은 '예'입니다. 현재 Amazon 가상 음성 어시스턴트인 Alexa는 텍스트 합성에 Polly를 사용하지만 음성은 Alexa 전용으로 구축되었습니다.
아니요. Amazon Polly는 완전관리형 클라우드 AI 서비스입니다. 코드의 API를 사용하여 이 서비스와 통신하는 방식입니다. 사용자 환경에서 Amazon Polly 소스 코드를 다운로드하거나 배포하는 건 불가합니다. 하지만 Amazon Polly는 가입 시작 후 12개월 동안 무료로(사전 정의된 사용량 임계값 한도까지) 사용할 수 있습니다. 자세한 내용은 Amazon Polly 요금 페이지를 참조하세요.

AWS 자세히 살펴보기