Prezzi di Amazon SageMaker Lakehouse
Amazon SageMaker Lakehouse unifica tutti i tuoi dati nei data lake di Amazon Simple Storage Service (Amazon S3) e nei data warehouse di Amazon Redshift, aiutandoti a creare potenti applicazioni di analisi e di IA/ML su una singola copia dei dati. SageMaker Lakehouse ti offre la flessibilità di accedere ai dati e sottoporli a query con tutti gli strumenti e i motori compatibili con Apache Iceberg. Protegge i dati nel lakehouse definendo autorizzazioni dettagliate che vengono applicate in modo coerente in tutti gli strumenti di analisi e machine learning (ML) e in tutti i motori. Oltre a questi vantaggi, accedi ai tuoi dati da database operativi e applicazioni tramite integrazioni Zero-ETL e dati da origini di terze parti attraverso funzionalità di query federate nel lakehouse.
SageMaker Lakehouse è accessibile direttamente da Amazon SageMaker Unified Studio (anteprima). I dati provenienti da diverse origini sono organizzati in container logici chiamati cataloghi in SageMaker Lakehouse. Ogni catalogo rappresenta dati provenienti da origini dati esistenti come data warehouse e database di terze parti o creati direttamente nel lakehouse per archiviare i dati in Amazon S3 o Amazon Redshift Managed Storage (RMS). I motori di query possono connettersi a questi cataloghi e accedere ai dati sul posto con le API Apache Iceberg. Puoi utilizzare qualsiasi motore compatibile con Apache Iceberg, come Apache Spark, Trino, Amazon Athena o Amazon EMR per accedere ai dati come tabelle Apache Iceberg e sottoporre a query i dati dai loro motori di query proprietari e di terze parti. Allo stesso modo, i cataloghi sono montati in motori di query proprietari come cluster Amazon Redshift e gruppi di lavoro come database. Connettiti ai database dagli strumenti di query tramite Java Database Connectivity (JDBC) o Editor di query V2 Amazon Redshift per eseguire query utilizzando SQL.
SageMaker Lakehouse ha i seguenti componenti sottostanti. Paghi per i componenti che usi nel lakehouse.
Metadati SageMaker Lakehouse: le definizioni dei dati sono organizzate in una gerarchia logica di cataloghi, database e tabelle utilizzando Catalogo dati AWS Glue.
- Catalogo: un container logico che contiene oggetti di un archivio dati come schemi, tabelle, viste o viste materializzate di Amazon Redshift. Puoi nidificare i cataloghi all'interno di un catalogo in modo che corrispondano ai livelli di gerarchie dell'origine dati che stai trasferendo al lakehouse.
- Database: i database possono essere utilizzati per organizzare gli oggetti di dati come tabelle e viste nel lakehouse.
- Tabelle e viste: le tabelle e le viste sono oggetti di dati in un database che descrivono come accedere ai dati sottostanti come schemi, partizioni, posizioni di archiviazione, formato di archiviazione e query SQL.
È possibile accedere ai metadati di SageMaker Lakehouse dalle API AWS Glue. Per l'archiviazione dei metadati e le richieste di API si applica il Catalogo dati AWS Glue, incluso il Piano gratuito AWS. Per ulteriori informazioni, visita Prezzi di AWS Glue.
Archiviazione di dati e accesso: utilizzando SageMaker Lakehouse, puoi leggere e scrivere dati in Amazon S3 o RMS. In base al tipo di archiviazione scelto per i dati nel lakehouse, dovrai sostenere costi aggiuntivi di archiviazione ed elaborazione per accedere allo spazio di archiviazione sottostante. Visita i prezzi di AWS Glue per maggiori dettagli sui prezzi di archiviazione ed elaborazione per i tipi di storage.
Statistiche e manutenzione delle tabelle Apache Iceberg: in SageMaker Lakehouse, puoi automatizzare la raccolta di statistiche sulle tabelle dei data lake in Amazon S3 per un'esecuzione più rapida delle query e la manutenzione delle tabelle Apache Iceberg, come la compattazione, per ottimizzare il layout di archiviazione delle tabelle Apache Iceberg. L'attivazione di queste funzionalità comporta costi aggiuntivi. Per ulteriori informazioni, visita Prezzi di AWS Glue.
Autorizzazioni: le autorizzazioni granulari in SageMaker Lakehouse sono basate su AWS Lake Formation. Le autorizzazioni in SageMaker Lakehouse sono gratuite. Per maggiori dettagli, consulta i prezzi di Lake Formation.
Costi dell'integrazione Zero-ETL
SageMaker ha integrazioni Zero-ETL con le applicazioni, il che elimina la necessità di creare e gestire pipeline di estrazione, trasformazione e caricamento (ETL). Le applicazioni supportate includono Salesforce, ServiceNow, Zendesk e altre ancora.
Queste integrazioni offrono flessibilità, permettendo di scegliere tabelle di dati specifiche in un'applicazione e replicarle automaticamente su Amazon Redshift. Questa flessibilità consente di eseguire analisi unificate su più applicazioni e origini dati. AWS non addebita costi aggiuntivi per l'integrazione Zero-ETL. Paghi per le risorse esistenti utilizzate per creare ed elaborare i dati di modifica creati come parte di un'integrazione Zero-ETL. Sono inclusi spazio di archiviazione aggiuntivo di Amazon Redshift per l'archiviazione dei dati replicati, risorse di calcolo per l'elaborazione della replica dei dati (o RPU su Amazon Redshift serverless) e i costi di trasferimento dati tra zone di disponibilità per lo spostamento dei dati dall'origine alla destinazione. L'elaborazione continua delle modifiche dei dati tramite l'integrazione Zero-ETL viene offerta senza costi aggiuntivi. Per ulteriori informazioni, visita Prezzi di Amazon Aurora, Prezzi di Database relazionale Amazon (Amazon RDS) per MySQL, Prezzi di Amazon DynamoDB e Prezzi di AWS Glue.