Amazon EMR serverless

Esegui applicazioni di big data utilizzando framework open source senza bisogno di gestire cluster e server

Perché EMR serverless?

Amazon EMR serverless è un'opzione serverless di Amazon EMR che consente ad analisti e data engineer di eseguire facilmente framework di analisi dei big data open source senza configurare, gestire e scalare cluster o server. Ottieni tutte le funzionalità e i vantaggi di Amazon EMR senza dover ricorrere a esperti per la pianificazione e la gestione dei cluster.

Vantaggi

Seleziona il framework open source che desideri eseguire per la tua applicazione, ad esempio Apache Spark e Apache Hive, ed EMR Serverless esegue automaticamente il provisioning e la gestione delle risorse di calcolo e memoria sottostanti.
Esegui carichi di lavoro analitici su qualsiasi scala grazie al dimensionamento automatico on-demand che ridimensiona le risorse in pochi secondi per soddisfare le variazioni dei volumi di dati e dei requisiti di elaborazione.
EMR Serverless aumenta e riduce verticalmente e in modo automatico le risorse per fornire la giusta quantità di capacità per l'applicazione. Paghi solo per ciò che utilizzi e puoi ridurre al minimo i problemi relativi a un provisioning eccessivo o insufficiente.

Come funziona

1

Crea la tua applicazione

Scegli il framework open source e la versione che desideri utilizzare.

2

Invia i processi

Invia processi alla tua applicazione tramite le API o EMR Studio. Puoi anche inviare i processi utilizzando servizi di orchestrazione dei flussi di lavoro come Apache Airflow o Flusso di lavoro gestito da Amazon per Apache Airflow.

3

Processi di debug

Usa strumenti open source familiari come Spark UI e Tez UI per monitorare ed eseguire il debug dei processi.

Casi d'uso

Al variare delle esigenze del carico di lavoro, è possibile scalare le risorse delle applicazioni senza problemi, senza dover preconfigurare la potenza di calcolo e la memoria necessarie.
Scegli l'opzione per pre-inizializzare le risorse dell'applicazione e abilitare il tempo di risposta in secondi per le pipeline di dati sensibili agli SLA.
Crea ambienti di sviluppo e di test in modo semplice e veloce, esegui il dimensionamento automatico in base all'utilizzo imprevedibile e immetti più rapidamente i prodotti sul mercato.