Amazon EMR on AWS Outposts

EMR on Outposts を使用すべき理由

AWS Outposts は、AWS サービス、インフラストラクチャ、運用モデルを、ほぼすべてのデータセンター、コロケーションスペース、オンプレミス施設で使用できるようにします。Amazon EMR が AWS Outposts で利用できるようになり、お使いのオンプレミス環境で、Apache Hadoop、Apache Hive、Apache Spark、Presto クラスターを、クラウドと同様にセットアップ、デプロイ、管理、スケールできるようになりました。Amazon EMR は、インフラストラクチャのプロビジョニングやクラスターのセットアップ、設定、調整といった煩雑な管理タスクを自動化しながら、コスト効率に優れた能力を Outposts にもたらすので、ユーザーはアプリケーションに集中することができます。

EMR 用のものと同じ AWS マネジメントコンソール、API、CLI を使って、オンプレミスですばやく簡単にマネージド型の EMR クラスターを作成できます。Outpost で起動した EMR クラスターは、他のクラスターと同様に AWS コンソールに表示されますが、実行はお使いの Outpost で行われます。

利点

Outpost をセットアップしたら、新しい EMR クラスターをオンプレミスで起動し、既存の HDFS ストレージに数分以内に接続することができます。それにより、オンプレミスのシステムが追加の処理能力を必要とする場合でもすばやく対応できます。オンプレミスの Hadoop と Spark クラスターに処理能力を追加することで、使用率が高い時間帯の負荷需要に対処し SLA を維持することができます。
データや Apache Hadoop のワークロードをクラウドへ移行させている途中に、移行の完了前に EMR を使用したいとお考えの場合、AWS Outposts を使えば、既存の HDFS ストレージに接続している EMR クラスターをオンプレミスで起動することができます。データは今後、クラウドアーキテクチャの発展の一環として、Amazon S3 へ徐々に移行させることが可能です。
Apache Hadoop、Apache Hive、Apache Spark、Presto は一般的に、大規模なデータアーキテクチャを構成しているデータの処理、変換、分析に使用されています。ガバナンス、コンプライアンス、またはその他理由によりオンプレミスで維持する必要のあるデータには、EMR を使えば、Apache Hadoop や Apache Spark などのアプリケーションをオンプレミスで、お使いのデータの近くにデプロイし実行することができます。それにより、大量のオンプレミスデータをクラウドへ移行させる必要がなくなり、データの処理にかかる合計時間を減らすことができます。