Amazon EMR sin servidor

Ejecute aplicaciones de big data mediante marcos de código abierto sin necesidad de administrar clústeres ni servidores

¿Por qué EMR sin servidor?

Amazon EMR sin servidor es una opción sin servidor en Amazon EMR que facilita a los ingenieros y los analistas de datos la ejecución de marcos de análisis de big data de código abierto sin la necesidad de configurar, administrar y escalar clústeres o servidores. Obtendrá todas las funciones y ventajas de Amazon EMR sin la necesidad de expertos que planifiquen y administren los clústeres.

Beneficios

Seleccione el marco de código abierto que desea ejecutar para su aplicación, como Apache Spark y Apache Hive, y EMR sin servidor aprovisionará y administrará de manera automática los recursos de computación y memoria subyacentes.
Ejecute cargas de trabajo de análisis a cualquier escala con un escalado automático bajo demanda que cambia el tamaño de los recursos en segundos para cumplir con los cambiantes requisitos de procesamiento y volúmenes de datos.
EMR sin servidor escala y reduce verticalmente de forma automática los recursos para proporcionar la capacidad justa para su aplicación. Solo paga por lo que usa y no tendrá que preocuparse tanto de si el aprovisionamiento es excesivo o insuficiente.

Funcionamiento

1

Cree su aplicación

Elija el marco de código abierto y la versión que quiere usar.

2

Envíe trabajos

Envíe trabajos a la aplicación a través de API o EMR Studio. También puede enviar trabajos mediante servicios de orquestación de flujos de trabajo como Apache Airflow o Amazon Managed Workflows para Apache Airflow.

3

Depure trabajos

Use herramientas conocidas de código abierto, como la interfaz de usuario de Spark y la interfaz de usuario de Tez, para supervisar y depurar los trabajos.

Casos de uso

A medida que cambien las exigencias de la carga de trabajo, escale los recursos de las aplicaciones con facilidad, sin tener que preconfigurar la cantidad de potencia de procesamiento y memoria que necesita.
Elija la opción para preinicializar los recursos de la aplicación y habilitar el tiempo de respuesta en segundos para las canalizaciones de datos sensibles a los SLA.
Ponga en marcha con rapidez y de forma fácil entornos de desarrollo y pruebas, escale de manera automática según el uso impredecible y entregue productos al mercado de manera más rápida.