Amazon SageMaker のデータと AI ガバナンスに関するよくある質問

データと AI ガバナンス

次世代の Amazon SageMaker は、レイクハウス、AI モデル、アプリケーション全体にわたるデータや AI の検出、ガバナンス、コラボレーションを簡素化します。Amazon DataZone 上に構築された Amazon SageMaker Catalog では、ユーザーは生成 AI が作成したメタデータによるセマンティック検索を使用して、承認されたデータやモデルを安全に検出してアクセスできます。あるいは、Q Developer に自然言語で指示してデータを見つけてもらうこともできます。ユーザーは、きめ細かなアクセスコントロールを備えた単一のアクセス許可モデルを使用して、SageMaker Unified Studio (プレビュー) で一元的にアクセスポリシーを一貫した方法で定義および適用できます。簡単なパブリッシュとサブスクライブのワークフローを通じて、データと AI アセットをシームレスに共有し、コラボレーションできます。Amazon SageMaker を使用すると、Amazon Bedrock ガードレールを使用して AI モデルを保護し、責任ある AI ポリシーを実装できます。データ品質の監視とオートメーション、機密データの検出、データと ML のリネージにより、組織全体で信頼を築けます。

SageMaker Catalog には、データと AI の開発のための単一環境である Amazon SageMaker Unified Studio (プレビュー) からアクセスできます。プログラムによってセットアップ、設定、または既存のプロセスと統合するために、SageMaker Catalog では、既存の Amazon DataZone API の使用方法に関するガイドラインが記載された API を公開しています。

  • チーム間でのデータ検索と共有の難しさ: データ作成者と消費者は、組織にわたる関連データセットを迅速に見つけて共有するという課題に直面することがよくあります。この非効率性により、データ検索に無駄な時間がかかり、コラボレーションが制限されます。
  • データ品質と AI モデルの出力に対する信頼の欠如: データのオリジン、品質、アクセスパターンを可視化できないため、組織はデータの質と AI モデルの出力の正確さを信頼できずにいます。
  • 一貫性のないデータアクセスとプライバシー侵害: 組織は一貫した方法でデータアクセスポリシーを適用するのに苦労しており、機密情報への不正アクセスにつながるおそれがあります。
  • 規制と内部ポリシーの順守を維持することが困難: 組織は、包括的な監査および監視ツールがないため、規制コンプライアンスを維持し、内部ポリシーを順守することが難しいと感じています。

Amazon SageMaker のデータと AI ガバナンスは、データチームが以下のことを行えるように支援します。

  • 迅速なデータ検出とコラボレーション: ユーザーは組織全体で関連データをすばやく見つけて共有できるため、情報の検索に費やす時間を短縮し、チームワークを促進できます。
  • リネージと品質による信頼性の向上: データのオリジンを追跡し、データ品質を向上させて、データ駆動の意思決定と AI モデルのアウトプットに対する信頼性を高めます。
  • データと AI モデルのセキュリティの強化: データとモデルをプロジェクト経由でのみアクセスできるように保護することで、セキュリティとプライバシーの基準を維持しながら、プロジェクト内のアセットを参照する権限を持つユーザーだけがアクセスできるようにします。
  • ビジネスリスクの軽減と規制順守の向上: ログ記録アクティビティは、組織が業界の規制や内部ポリシーを順守するのに役立ち、組織のリスクを軽減するのに役立ちます。
  • アセットの検索と検出でビジネスの生産性を高める: データと AI アセットを検索して検出することで、チームを強化し、重要なアセットを見つけるのに費やす時間を短縮し、データ駆動型の意思決定をより迅速に行えるようにします。
  • 一元化されたデータアクセスポリシーの管理: データアクセスルールを一元的に定義および管理することで、さまざまな AWS サービスやサードパーティ環境にわたって一貫した方法で応用できるようになります。
  • ビジネスコンテキストと分類によるデータ強化: データセットにメタデータを追加して分類することで、特定のビジネスニーズに対するデータの関連性と適用可能性をユーザーが理解しやすくなります。
  • ユーザーとシステムのアクティビティをログ記録: データや AI システムとのやりとりを監視して記録し、使用パターンや潜在的なセキュリティ問題を可視化します。
  • AI/ML データガバナンスの実装: データガバナンスの原則を AI と機械学習のプロセスにも適用し、承認されたデータのみがモデルトレーニングに使用され、AI システムが定義されたアクセス許可と倫理ガイドラインに従うようにします。

Amazon SageMaker Catalog は Amazon DataZone 上に構築されており、統一されたユーザーエクスペリエンスで同じガバナンス機能を提供します。既存の Amazon DataZone のお客様が、必要に応じて使い慣れたインターフェイスを引き続き使用できるように、Amazon DataZone のエクスペリエンスは今後も変わりません。

料金の詳細については、https://aws.amazon.com/datazone/pricing/ をご覧ください。