Amazon EMR Sem Servidor

Execute aplicações de big data usando frameworks de código aberto sem gerenciar clusters e servidores

Por que usar o EMR Sem Servidor?

O Amazon EMR Sem Servidor é uma opção do Amazon EMR que usa tecnologia sem servidor para facilitar a execução de estruturas de big data analytics de código aberto por analistas e engenheiros de dados sem que seja necessário configurar, gerenciar e escalar clusters ou servidores. Você obtém todos os recursos e benefícios do Amazon EMR sem precisar de especialistas para planejar e gerenciar clusters.

Benefícios

Selecione a estrutura de código aberto que deseja executar para sua aplicação, como Apache Spark e Apache Hive, e o EMR Sem Servidor provisionará e gerenciará automaticamente os recursos subjacentes de computação e memória.
Execute workloads de análise em qualquer escala com o ajuste de escala automático sob demanda que redimensiona os recursos em segundos para atender aos requisitos dinâmicos de volumes de dados e processamento.
O EMR Sem Servidor aumenta e diminui a escala dos recursos vertical e automaticamente para fornecer a quantidade certa de capacidade para sua aplicação. Você paga somente pelo que usa e pode minimizar as preocupações com provisionamento excessivo ou insuficiente.

Como ele funciona

1

Crie sua aplicação

Escolha a estrutura e a versão de código aberto que deseja usar.

2

Envie trabalhos

Envie trabalhos para a aplicação por meio de APIs ou do EMR Studio. Você também pode enviar trabalhos usando serviços de orquestração de fluxo de trabalho, como o Apache Airflow ou o Amazon Managed Workflows para Apache Airflow.

3

Depure trabalhos

Use ferramentas conhecidas de código aberto, como o Spark UI e o Tez UI, para monitorar e depurar trabalhos.

Casos de uso

À medida que as demandas das workloads mudam, dimensione os recursos da aplicação sem precisar pré-configurar a quantidade de capacidade de computação e memória de que você precisa.
Escolha a opção de pré-inicializar os recursos da aplicação e ativar o tempo de resposta em segundos para pipelines de dados sensíveis ao SLA.
Crie ambientes de desenvolvimento e teste com rapidez, escale de forma automática em situações de uso imprevisíveis e disponibilize produtos ao mercado mais rapidamente.