Amazon SageMaker Lakehouse の特徴

ページトピック

全般

全般

お好みの Apache Iceberg 互換のツールやエンジンを使用して、インプレースでデータにアクセスし、クエリを実行できます。お好みの Apache Iceberg 互換のエンジンとツールを使用して、Apache Spark 抽出、変換、ロード (ETL) ジョブから SQL ダッシュボード、機械学習 (ML) パーソナライゼーションモデル、生成 AI アプリケーションまで、さまざまな分析と ML のユースケースを実行できます。

既存のデータアーキテクチャを変更することなく、データレイクの柔軟性とデータウェアハウスのパフォーマンスを実現できます。高度に最適化された Amazon Redshift ストレージと、マテリアライズドビューなどのセカンダリデータ構造にアクセスして、データレイクでの SQL 分析をスピードアップします。

SQL、Apache Spark、ビジネスインテリジェンス (BI)、AI/ML ツールなど、お好みの分析ツールやエンジンをデータの 1 つのコピーで実行しながら、ワークロードに最適な形式でデータを保存します。

Apache Iceberg との互換性により、SageMaker Lakehouse 内のすべてのデータは ACID (原子性、一貫性、独立性、永続性) に完全に準拠し、高性能な SQL 分析を実現できます。

インプレースでデータにアクセスしてクエリを実行するには、複数のサードパーティーソースにわたって保存されているデータに対してフェデレーテッドクエリを実行します。

ゼロ ETL 統合を使用して、ほぼリアルタイムの分析を行うために、Amazon DynamoDB、Amazon Aurora MySQL、Amazon Aurora PostgreSQL、Amazon RDS for MySQL などの運用データベースと、Salesforce、ServiceNow、Zendesk などのアプリケーションから SageMaker Lakehouse にデータを取り込みます。

統合されたアクセスコントロールにより、SageMaker Lakehouse のデータを保護しましょう。アクセス許可を一度定義すれば、そのアクセス許可はすべての分析ツールとエンジンのすべてのデータに適用されます。