일반
AWS DataSync란 무엇입니까?
AWS DataSync는 AWS로의 데이터 마이그레이션과 온프레미스 스토리지, 엣지 로케이션, 다른 클라우드 공급자 및 AWS 스토리지 서비스 간의 데이터 이동을 간소화 및 가속화하는 온라인 데이터 이동 및 검색 서비스입니다.
AWS DataSync Discovery는 온프레미스 스토리지 성능 및 사용률에 대한 가시성과 AWS 스토리지 서비스로 데이터를 마이그레이션할 때의 권장 사항을 제공합니다. 따라서 마이그레이션 계획 수립을 간소화하고 AWS로의 데이터 마이그레이션을 가속화하는 데 도움이 됩니다. DataSync Discovery를 사용하면 자동화된 데이터 수집 및 분석을 통해 온프레미스 스토리지 성능 및 용량 사용량을 더 잘 이해할 수 있습니다. 따라서 마이그레이션할 데이터를 빠르게 식별하고 생성된 권장 사항을 사용하여 성능 및 용량 요구 사항에 일치하는 AWS 스토리지 서비스를 선택할 수 있습니다.
온라인 데이터 전송의 경우 AWS DataSync는 온프레미스 스토리지, 엣지 로케이션, 다른 클라우드 공급자 및 AWS 스토리지 서비스 간에 이루어지는 다량의 데이터 복사를 간소화, 자동화 및 가속화합니다. DataSync는 네트워크 파일 시스템(NFS) 공유, 서버 메시지 블록(SMB) 공유, Hadoop 분산 파일 시스템(HDFS), 자체 관리형 객체 스토리지, Google Cloud Storage와 Wasabi Cloud Storage 같은 다른 클라우드의 객체 스토리지(지원 클라우드에 대한 전체 목록 참조), Azure Files, Azure Blob Storage(Azure Data Lake Storage Gen2 포함), Snow의 Amazon S3 호환 스토리지, Amazon Simple Storage Service(Amazon S3), Amazon Elastic File System(Amazon EFS) 파일 시스템, Amazon FSx for Windows File Server 파일 시스템, Amazon FSx for Lustre 파일 시스템, Amazon FSx for OpenZFS 파일 시스템 및 Amazon FSx for NetApp ONTAP 파일 시스템 간에 데이터를 복사할 수 있습니다.
AWS DataSync를 사용해야 하는 이유는 무엇인가요?
AWS DataSync를 사용하면 데이터를 안전하고 빠르게 검색하고 이동할 수 있습니다. DataSync Discovery를 사용하면 온프레미스 스토리지 사용률을 더 잘 이해하고 권장 사항을 바탕으로 비용 예측에 필요한 정보를 얻고 AWS로의 마이그레이션을 계획할 수 있습니다. 데이터 이동의 경우 DataSync를 사용하면 오픈 소스 도구를 통해 사용자 지정 솔루션을 구축하거나 비싼 상용 네트워크 가속화 소프트웨어 라이선스를 사용 및 관리할 필요 없이 수백만 개의 파일이 포함된 대규모 데이터 세트를 복사할 수 있습니다. DataSync를 사용하여 활성 데이터를 AWS로 마이그레이션하거나 데이터를 아카이브하여 온프레미스 스토리지 용량을 확보하거나 비즈니스 연속성을 위해 데이터를 AWS로 복제하거나 분석 및 처리를 위해 데이터를 클라우드로 전송할 수 있습니다.
AWS DataSync Discovery로 해결되는 문제는 무엇인가요?
AWS DataSync는 온프레미스 스토리지, 엣지 로케이션, 다른 클라우드 공급자 및 AWS 스토리지 서비스 간에 데이터세트를 간단하게 전송할 수 있도록 하여 온라인 데이터 전송의 복잡성과 비용을 줄여줍니다. DataSync는 표준 스토리지 프로토콜(NFS, SMB)을 사용하거나 HDFS 클라이언트로 또는 Amazon S3 API 또는 기타 클라우드 스토리지 API를 사용하여 기존 스토리지 시스템 및 데이터 소스에 연결합니다. 특별히 구축된 네트워크 프로토콜과 확장 아키텍처를 사용하여 스토리지 시스템 및 AWS 간 데이터 전송을 가속화합니다. DataSync는 파일 및 객체 이동, 데이터 전송 일정 예약, 전송 진행 상황 모니터링, 암호화, 데이터 전송 확인 및 문제에 대한 알림을 처리합니다.
AWS DataSync로 해결되는 문제는 무엇인가요?
AWS DataSync는 온프레미스 스토리지, 엣지 로케이션, 다른 클라우드 공급자 및 AWS 스토리지 서비스 간에 데이터세트를 간단하게 전송할 수 있도록 하여 온라인 데이터 전송의 복잡성과 비용을 줄여줍니다. DataSync는 표준 스토리지 프로토콜(NFS, SMB)을 사용하거나 HDFS 클라이언트로 또는 Amazon S3 API 또는 기타 클라우드 스토리지 API를 사용하여 기존 스토리지 시스템 및 데이터 소스에 연결합니다. 특별히 구축된 네트워크 프로토콜과 확장 아키텍처를 사용하여 스토리지 시스템 및 AWS 간 데이터 전송을 가속화합니다. DataSync는 파일 및 객체 이동, 데이터 전송 일정 예약, 전송 진행 상황 모니터링, 암호화, 데이터 전송 확인 및 문제에 대한 알림을 처리합니다.
검색
AWS DataSync Discovery가 지원하는 스토리지 시스템은 무엇인가요?
AWS DataSync Discovery는 현재 ONTAP 9.7 이상을 실행하는 NetApp FAS 및 AFF 시리즈 어레이를 지원합니다. 추가 스토리지 시스템에 대한 지원은 시간이 지남에 따라 추가될 것입니다.
AWS DataSync Discovery는 스토리지 시스템에 대한 어떤 정보를 수집하나요?
AWS DataSync Discovery는 스토리지 관리 API 인터페이스를 사용하여 스토리지 시스템에 대한 정보와 함께 성능 및 사용률 지표를 수집합니다. 시스템 정보에는 총 스토리지 용량, 볼륨 구성, 내보내기/공유 이름 등과 같은 속성이 포함됩니다. 스토리지 시스템 지표로는 볼륨 처리량(throughput) 및 IOPS와 같은 성능 지표와 할당된 용량 및 사용된 용량과 같은 사용률 지표가 있습니다. DataSync Discovery는 수집된 시스템 정보 및 지표를 사용하여 AWS 스토리지로의 마이그레이션에 대한 권장 사항을 생성합니다.
AWS DataSync Discovery는 권장 사항을 어떻게 결정하나요?
AWS DataSync Discovery는 온프레미스 스토리지 시스템에서 수집된 데이터를 분석한 후 이와 일치하는 기능, 용량 및 성능 특성을 가진 AWS 스토리지 서비스를 찾습니다. 적절한 경우 DataSync Discovery는 사용자가 고려할 수 있는 하나 이상의 AWS 스토리지 서비스를 권장합니다.
프로덕션 시스템에서 AWS DataSync Discovery를 사용할 수 있나요? 사용자와 애플리케이션에는 어떤 영향을 미치나요?
AWS DataSync Discovery를 온프레미스 스토리지 시스템에 사용할 때 사용자와 애플리케이션에 미치는 눈에 띄는 영향은 없습니다.
AWS DataSync Discovery는 스토리지 시스템에 대해 수집한 데이터를 어디에 저장하나요?
수집된 데이터는 DataSync 서비스를 통해 저장되고 관리됩니다. AWS DataSync 콘솔에서 데이터를 보거나 AWS CLI 또는 AWS 소프트웨어 개발 키트(SDK)를 사용하여 데이터에 액세스할 수 있습니다.
AWS DataSync Discovery는 검색 작업에서 수집된 데이터를 언제까지 저장하나요?
수집된 데이터 및 권장 사항은 검색 작업이 끝난 후 60일간 유지됩니다.
데이터 이동
데이터 이동이 가능한 곳은 어디인가요?
DataSync는 네트워크 파일 시스템(NFS) 공유, 서버 메시지 블록(SMB) 공유, Hadoop 분산 파일 시스템(HDFS), 자체 관리형 객체 스토리지, Google Cloud Storage 및 Wasabi Cloud Storage와 같은 기타 클라우드의 객체 스토리지(지원 클라우드에 대한 전체 목록 참조), Azure Files, Azure Blob Storage(Azure Data Lake Storage Gen2 포함), Snow의 Amazon S3 호환 스토리지, Amazon Simple Storage Service(Amazon S3), Amazon Elastic File System(Amazon EFS) 파일 시스템, Amazon FSx for Windows File Server 파일 시스템, Amazon FSx for Lustre 파일 시스템, Amazon FSx for OpenZFS 파일 시스템 및 Amazon FSx for NetApp ONTAP 파일 시스템과 같은 스토리지 위치 유형을 지원합니다.
AWS DataSync를 사용하여 AWS로 데이터를 마이그레이션하려면 어떻게 해야 하나요?
AWS DataSync를 사용하여 엣지 또는 다른 클라우드의 온프레미스 데이터를 Amazon S3, Amazon EFS, Amazon FSx for Windows File Server, Amazon FSx for Lustre, Amazon FSx for OpenZFS 및 Amazon FSx for NetApp ONTAP으로 마이그레이션할 수 있습니다. 전체 데이터 집합에 대한 초기 사본을 만들도록 DataSync를 구성하고 온프레미스에서 AWS로 최종 컷오버될 때까지 변경되는 데이터의 후속 증분 전송을 예약하십시오. DataSync에는 암호화 및 무결성 검증이 포함되어 데이터를 손상되지 않은 상태로 안전하게 수신하여 바로 사용할 수 있도록 보장합니다. 네트워크 연결에 의존하는 워크로드에 대한 영향을 최소화하기 위해 근무 시간 외에 마이그레이션이 실행되도록 예약하거나 내장형 대역폭 스로틀을 구성하여 DataSync에서 사용하는 네트워크 대역폭을 제한할 수 있습니다. DataSync는 메타데이터 구조가 유사한 스토리지 시스템 간에 메타데이터를 보존하여 최종 사용자와 애플리케이션이 대상 AWS 스토리지 서비스 사용으로 원활하게 전환할 수 있도록 지원합니다.
마이그레이션 모범 사례 및 팁에 대한 자세한 내용은 스토리지 블로그, ‘AWS DataSync를 사용하여 스토리지 마이그레이션’을 참조하세요.
AWS DataSync를 사용하여 콜드 데이터를 아카이브하려면 어떻게 해야 합니까?
AWS DataSync를 사용하여 콜드 데이터를 온프레미스 스토리지 시스템에서 Amazon S3 Glacier Flexible Retrieval(이전의 S3 Glacier) 또는 Amazon S3 Glacier Deep Archive와 같은 내구성 있고 안전한 장기 스토리지로 직접 이동할 수 있습니다. DataSync의 제외 필터를 사용하여 임시 파일 및 폴더 복사를 제외하거나 포함 필터 또는 매니페스트를 사용하여 소스 위치에서 파일 하위 집합만 복사할 수 있습니다. S3 스토리지 클래스로 데이터를 전송하거나 DataSync를 EFS 수명 주기 관리와 함께 사용하여 Amazon EFS Infrequent Access 스토리지 클래스(EFS IA)에 데이터를 저장하는 등 가장 비용 효율적인 스토리지 서비스를 선택할 수 있습니다. 기본 제공 태스크 일정 예약 기능을 사용하여 로그, 원시 장면 또는 전자 의료 기록과 같은 규정 준수 또는 감사 목적으로 보관해야 하는 데이터를 정기적으로 아카이브합니다.
비즈니스 연속성을 위해 AWS DataSync를 사용하여 데이터를 AWS에 복제하려면 어떻게 해야 하나요?
AWS DataSync를 사용하면 파일을 모든 Amazon S3 스토리지 클래스에 정기적으로 복제하거나 대기 파일 시스템을 위해 Amazon EFS, Amazon FSx for Windows File Server, Amazon FSx for Lustre, Amazon FSx for OpenZFS 또는 Amazon FSx for NetApp ONTAP으로 데이터를 보낼 수 있습니다. 기본 태스크 일정 예약 기능을 사용하여 데이터 집합의 변경 사항을 정기적으로 대상 스토리지에 복사하도록 보장합니다. AWS DataSync를 사용하는 데이터 보호에 대한 자세한 내용은 이 AWS 스토리지 블로그를 참조하세요.
지속적인 워크플로를 위해 온프레미스와 AWS 간의 반복 전송에 AWS DataSync를 사용하려면 어떻게 해야 합니까?
AWS DataSync를 사용하여 온프레미스 시스템에서 AWS 내부 또는 외부로의 전송을 처리할 수 있습니다. DataSync는 AWS로 활성 파일을 빠르게 이동해야 하는 업계에서 중요한 하이브리드 클라우드 스토리지 워크플로를 가속화하는 데 도움을 줄 수 있습니다. 여기에는 생명 과학 분야의 기계 학습, 미디어 및 엔터테인먼트 분야의 비디오 제작, 금융 서비스 분야의 빅 데이터 분석, 석유 및 가스 산업의 지진 연구 등이 포함됩니다. DataSync는 적시 전달을 통해 종속 프로세스가 지연되지 않도록 합니다. 포함 및 제외 필터 또는 매니페스트를 지정하여 태스크가 실행될 때마다 전송해야 하는 파일 또는 객체를 지정할 수 있습니다.
AWS DataSync를 사용하여 다른 클라우드의 데이터를 AWS로 복사할 수 있나요?
예. AWS DataSync를 사용하면 Google 클라우드 스토리지, SMB 프로토콜을 사용하는 Azure Files 또는 Azure Blob Storage(Azure Data Lake Storage Gen 2 포함)에서 Amazon S3 API를 사용하여 데이터를 복사할 수 있습니다. Wasabi 클라우드 스토리지, Oracle 클라우드 스토리지, Cloudflare R2 스토리지, Digital Ocean Spaces, Backblaze B2 클라우드 스토리지 같은 그 밖의 클라우드 스토리지로부터 데이터를 이동할 수도 있습니다(지원 클라우드에 대한 전체 목록 참조). 클라우드 환경이나 Amazon EC2에서 DataSync 에이전트를 배포하고 소스 및 대상 위치를 생성한 다음 태스크를 시작하여 데이터 복사를 시작합니다. 하이브리드 및 멀티클라우드 환경을 위한 AWS 솔루션에 대해 자세히 알아보세요.
AWS DataSync를 사용하여 데이터 레이크를 구축할 수 있나요?
예. AWS DataSync를 활용하면 온프레미스 데이터 세트 또는 다른 클라우드의 데이터를 Amazon S3로 전송하는 작업을 자동화하여 데이터 레이크를 손쉽게 구축할 수 있습니다. DataSync를 사용하면 표준 스토리지 프로토콜(NFS, SMB)을 HDFS 클라이언트로 사용하거나 Amazon S3 API 또는 기타 클라우드 스토리지 API를 사용하여 전체 데이터 세트를 간단하고 신속하게 전송할 수 있습니다. 데이터 세트를 처음 전송한 이후 AWS로의 신규 데이터 후속 전송을 예약할 수 있습니다. DataSync에는 암호화 및 무결성 검증이 포함되어 데이터를 손상되지 않은 상태로 안전하게 수신하여 바로 사용할 수 있도록 보장합니다. 네트워크 연결에 의존하는 워크로드에 대한 영향을 최소화하기 위해 근무 시간 외에 전송 태스크가 실행되도록 예약하거나 내장형 대역폭 스로틀을 구성하여 DataSync에서 사용하는 네트워크 대역폭을 제한할 수 있습니다. 데이터가 Amazon S3에 있는 경우 네이티브 AWS 서비스를 통해 빅 데이터 분석, AI(인공 지능), ML(기계 학습), HPC(고성능 컴퓨팅) 및 미디어 데이터 처리 애플리케이션을 실행하여 비정형 데이터 세트에서 인사이트를 확보할 수 있습니다. 데이터 레이크 구축 및 활용 방법에 대한 자세한 내용은 AWS 데이터 레이크 스토리지 웹 페이지를 참조하세요.
AWS DataSync를 사용하여 AWS Snowcone 서비스 사이에서 데이터를 전송하려면 어떻게 해야 하나요?
DataSync를 사용하여 동일한 AWS 계정 내 Amazon S3, Amazon EFS, Amazon FSx for Windows File Server, Amazon FSx for Lustre, Amazon FSx for OpenZFS 또는 Amazon FSx for NetApp ONTAP 사이에서 파일 또는 객체를 전송할 수 있습니다. 동일한 AWS 리전 내 AWS 서비스 간, 중국을 제외한 다른 상용 AWS 리전의 서비스 간 또는 AWS GovCloud(미국 동부 및 미국 서부) 리전 간에 데이터를 전송할 수 있습니다. 이를 위해 DataSync 에이전트를 배포하지 않아도 되며, AWS DataSync 콘솔, AWS 명령줄 인터페이스(CLI) 또는 AWS 소프트웨어 개발 키트(SDK)를 사용하여 포괄적으로 구성할 수 있습니다.
AWS DataSync를 사용하여 Amazon WorkDocs로 마이그레이션할 수 있나요?
예. AWS DataSync는 마이그레이션을 위해 사용되는 Amazon S3 버킷으로의 파일 업로드를 자동화하여 Amazon WorkDocs Migration Service의 필수 단계를 가속화합니다. DataSync를 사용하면 홈 디렉터리 및 부서 공유 항목을 WorkDocs에 쉽고 빠르게 마이그레이션할 수 있습니다. WorkDocs로의 마이그레이션을 위해 DataSync를 사용하는 방법을 자세히 알아보려면 'AWS DataSync를 사용하여 Amazon WorkDocs로 네트워크 파일 공유 마이그레이션' 블로그를 참조하세요.
사용
AWS DataSync Discovery 사용을 시작하려면 어떻게 해야 하나요?
AWS DataSync 에이전트를 온프레미스 VM 환경에 배포하여 시작합니다. DataSync 콘솔, CLI 또는 SDK를 사용하여 온프레미스 스토리지에 연결할 DataSync Discovery를 구성하고 검색 작업을 실행하여 스토리지 시스템에 대한 데이터와 성능, 용량 및 사용률 지표를 수집합니다. 검색 작업이 실행되는 동안 DataSync 콘솔의 대시보드에서 스토리지 시스템에 대한 정보를 볼 수 있습니다. 검색 작업이 완료되면 수집된 데이터가 분석되어 Amazon EFS, Amazon FSx 및 Amazon S3와 같은 AWS 스토리지 서비스로의 마이그레이션을 위한 권장 사항이 생성됩니다. 이러한 권장 사항을 AWS 스토리지 서비스 선택을 위한 지침으로 사용하고 AWS DataSync를 사용하여 데이터를 이동할 수 있습니다.
AWS DataSync로 데이터 이동을 시작하려면 어떻게 해야 하나요?
AWS Management Console에서 클릭 몇 번으로 또는 AWS Command Line Interface(CLI)를 통해 AWS DataSync로 데이터를 전송할 수 있습니다. 시작하려면 다음 3단계를 수행합니다.
1. 온프레미스, 엣지 또는 다른 클라우드 스토리지 시스템 및 AWS 스토리지 서비스 간에 데이터를 전송하기 위해 에이전트 배포 - DataSync 에이전트를 배포하고 관리 콘솔 또는 API를 통해 이를 AWS 계정과 연결합니다. 에이전트는 NFS 서버, SMB 파일 공유, Hadoop 클러스터 또는 자체 관리형 객체 스토리지 또는 클라우드 객체 스토리지에 액세스하여 데이터를 읽거나 쓰는 데 사용됩니다. 동일한 AWS 계정 내 AWS 스토리지 서비스 간에 데이터를 전송하는 경우에는 에이전트를 배포하지 않아도 됩니다.
2. 데이터 전송 태스크 생성 - 데이터 소스 및 대상의 위치와 데이터 전송을 구성할 때 사용할 옵션(예: 태스크 일정 예약 및 태스크 보고서 지원)을 지정하여 태스크를 생성합니다.
3. 전송 시작 - 태스크를 시작하고 콘솔 또는 Amazon CloudWatch를 통해 데이터 이동을 모니터링하고 태스크 보고서를 사용하여 전송 태스크를 감사합니다.
AWS DataSync 에이전트를 배포하려면 어떻게 해야 하나요?
AWS DataSync 에이전트를 퍼블릭 클라우드 환경 또는 Amazon EC2에서 온프레미스 하이퍼바이저에 배포합니다. 온프레미스 파일 서버 또는 Snow의 Amazon S3 호환 스토리지와 이 파일 서버 간에 데이터를 복사하려면 AWS Console에서 에이전트 가상 머신 이미지를 다운로드하고 온프레미스 VMware ESXi, Linux 커널 기반 가상 머신(KVM) 또는 Microsoft Hyper-V 하이퍼바이저에 배포합니다. 에이전트 배포는 필수입니다. 그러면 에이전트가 NFS, SMB 프로토콜을 사용하여 파일 서버에 액세스하거나 Hadoop 클러스터의 NameNode 및 DataNode에 액세스하거나 Amazon S3 API를 사용하여 객체 스토리지에 액세스할 수 있습니다. AWS Outposts 버킷의 S3 및 AWS 리전의 S3 버킷 사이에서 전송을 설정하려면 사용자 Outpost에 에이전트를 배포합니다.
퍼블릭 클라우드 환경과 AWS 스토리지 간에 데이터를 복사할 때 DataSync 에이전트를 클라우드 환경 또는 Amazon EC2에 배포할 수 있습니다. AWS DataSync는 AWS DataSync 에이전트와 AWS 스토리지 서비스 간에 전송되는 데이터를 압축하므로, AWS DataSync 에이전트를 퍼블릭 클라우드 환경에 배포하면 송신 요금을 줄일 수 있습니다.
동일한 AWS 계정 내 AWS 스토리지 서비스 간에 데이터를 전송하는 경우에는 에이전트를 배포하지 않아도 됩니다. 다른 AWS 계정 내 AWS 스토리 서비스 사이에서 데이터를 복사하거나 자체 관리형 클라우드 내 파일 서버에서 또는 이 파일 서버로 데이터를 복사하려면 DataSync 에이전트 AMI를 사용하여 Amazon EC2 인스턴스를 시작합니다.
AWS DataSync 에이전트에 대한 리소스 요구 사항은 무엇입니까?
에이전트를 실행하는 데 필요한 최소 리소스는 여기에서 확인할 수 있습니다.
AWS DataSync 데이터 전송 태스크를 시작하려면 어떻게 해야 하나요?
AWS Management Console 또는 AWS Command Line Interface(CLI)를 통해 태스크를 시작하면 AWS DataSync가 데이터를 복사합니다. 태스크를 실행할 때마다 소스 및 대상의 변경 사항을 스캔하고, 소스와 대상 간에 데이터 및 메타데이터의 차이가 있는 경우 복사를 수행합니다. 소스의 어떤 특성을 사용하여 변경 여부를 판단할지를 구성하고, 특정 파일 및 객체 데이터를 전송하기 위한 포함 및 제외 필터 또는 매니페스트를 정의하고, 대상의 파일 또는 객체가 소스에서 변경된 경우 덮어쓰거나, 소스에 없는 경우 삭제해야 하는지 여부를 제어할 수 있습니다.
기본 모드 태스크와 고급 모드 태스크의 차이점은 무엇인가요?
기본 모드 태스크에는 데이터세트의 파일 및 개체 수에 대해 할당량이 적용됩니다. 기본 모드는 데이터세트의 파일과 객체를 순차적으로 준비, 전송, 검증하기 때문에 대부분의 워크로드에서 고급 모드보다 속도가 느립니다. 고급 모드를 사용하면 기본 모드보다 더 높은 성능 수준으로 사실상 개체 수의 제한 없이 데이터세트를 전송할 수 있습니다. 고급 모드 태스크는 데이터를 병렬로 나열, 준비, 전송, 검증하여 데이터 전송 프로세스를 최적화하고 간소화합니다. 또한 향상된 지표 및 보고 기능을 통해 대규모 데이터 전송을 더 쉽게 추적하고 관리할 수 있습니다. 고급 모드는 현재 Amazon S3 위치 간 전송에 사용할 수 있습니다. 기본 모드는 현재 이용 가능한 모든 DataSync 위치 유형을 지원합니다. 태스크 모드 간의 차이점에 대한 자세한 목록은 DataSync 설명서를 참조하세요. 태스크 모드 간 요금 차이는 DataSync 요금 페이지를 참조하세요.
AWS DataSync에서 데이터를 올바르게 복사하려면 어떻게 해야 하나요?
AWS DataSync가 데이터를 전송 및 저장하는 경우 무결성 검사를 수행하여 대상에 쓰는 데이터와 원본에서 읽는 데이터가 일치하도록 보장합니다. 또한 전송이 끝날 무렵에 선택적 확인 검사를 수행하여 원본과 대상을 비교할 수 있습니다. DataSync는 원본과 대상에 저장된 데이터의 전체 파일 체크섬을 계산하고 비교합니다. 전체 데이터 세트를 검사하거나 DataSync가 전송하는 파일 또는 객체만 검사할 수도 있습니다.
AWS DataSync를 통해 전송 중인 데이터의 상태를 모니터링하고 감사하려면 어떻게 해야 하나요?
태스크 보고서를 통해 모든 태스크 실행에 걸쳐 전송 작업을 확인하여 데이터 전송 프로세스를 감사할 수 있습니다. 태스크 보고서를 사용하면 각 태스크 실행에 대한 요약 보고서와 함께 전송, 생략, 확인 및 삭제된 모든 파일에 대한 상세 보고서를 받아볼 수 있습니다. 태스크 보고서는 전송된 총 파일 및 바이트 수를 제공하며, 해당하는 경우 크기, 경로, 타임스탬프, 파일 체크섬, 객체 버전 ID 등의 파일 속성을 포함합니다. 또한 AWS Glue, Amazon Athena 및 Amazon QuickSight를 활용하여 태스크 보고서를 자동으로 카탈로그화, 쿼리 및 시각화하여 데이터 전송 프로세스에 대한 중요한 인사이트를 얻을 수 있습니다.
AWS Management Console 또는 CLI를 사용하여 전송 중인 데이터의 상태 및 진행률을 모니터링할 수 있습니다. Amazon CloudWatch 지표를 사용하여 복사된 파일 수 또는 데이터의 크기를 확인할 수 있습니다. 또한 CloudWatch Logs에 대한 개별 파일 로깅을 사용하도록 설정하여 특정 시간에 전송된 항목뿐 아니라 DataSync에서 수행한 콘텐츠 무결성 확인 결과를 식별할 수 있습니다.
이러한 솔루션을 함께 사용하면 감사, 모니터링, 보고 및 문제 해결이 간소화되고 이해 관계자에게 시기적절한 업데이트를 제공할 수 있습니다.
AWS DataSync를 통해 전송하는 파일 및 폴더를 필터링할 수 있나요?
예. 제외 필터 또는 포함 필터를 지정하거나 이 두 필터를 모두 지정하여 태스크가 실행될 때마다 전송되는 파일, 폴더 또는 객체를 제한할 수 있습니다. 또는 매니페스트를 사용하여 소스 위치에서 전송해야 하는 파일 또는 객체의 하위 집합을 지정할 수 있습니다.
포함 필터는 소스 및 대상에서 태스크가 실행되고 DataSync로 스캔할 범위를 제한할 때 포함해야 할 파일 및 폴더 경로 또는 객체 키를 지정합니다. 제외 필터는 복사에서 제외할 파일 및 폴더 경로 또는 객체 키를 지정합니다. 태스크를 생성하거나 업데이트할 때 제외 및 포함 필터를 모두 구성할 수 있습니다. 태스크를 시작할 때 태스크에 구성된 필터를 재정의하고 업데이트할 수 있습니다. DataSync에서 공통 필터를 사용하는 방법에 대한 자세한 내용은 이 AWS 스토리지 블로그를 참조하세요.
매니페스트는 태스크가 시작될 때 포함되어야 하는 파일 경로 또는 객체 키를 나열하고 소스 및 대상에서 DataSync가 스캔하는 항목의 범위를 제한하는 CSV 형식의 파일입니다. 태스크를 생성하거나 업데이트할 때 수백만 개의 소스 파일 또는 객체가 포함된 매니페스트 파일을 제공할 수 있으며, DataSync는 매니페스트에 나열된 파일만 비교하고 전송합니다. 태스크를 시작할 때 매니페스트 파일을 재정의하고 업데이트할 수 있습니다. Amazon S3에서 데이터를 복사할 때 전송할 각 객체의 선택적 S3 버전 ID를 지정할 수도 있습니다. 자세한 내용은 이 블로그를 읽어보세요.
참고로 필터와 매니페스트는 함께 사용할 수 없습니다.
매니페스트 파일을 사용하는 것과 포함 필터를 사용하는 것은 어떻게 다른가요?
매니페스트는 소스 위치에서 전송할 파일 또는 객체의 명시적 목록인 반면, 포함 필터는 소스에서 전송할 파일 및 폴더의 패턴을 지정하는 문자열입니다. 필터의 패턴과 일치하는 파일 및 폴더만 복사됩니다. 패턴은 전체 파일 또는 폴더 경로 또는 와일드카드(*) 문자로 끝나는 접두사일 수 있습니다. 이는 접두사와 일치하는 모든 파일 또는 객체를 복사해야 함을 나타냅니다. 포함 필터는 작은 파일 또는 객체 집합 또는 일부 특정 폴더만 복사하려는 고객에게 적합합니다. 자동화된 워크플로의 일부로 이동한 데이터 세트와 같이 잘 알려진 데이터 세트를 보유한 고객은 매니페스트를 사용하면 변경 사항을 확인하기 위해 전체 파일 또는 객체 스토리지 시스템을 스캔하지 않아도 됩니다. 고객은 매니페스트 파일을 사용하여 전송할 수백만 개의 소스 파일 또는 객체를 지정할 수 있으며 DataSync는 매니페스트에 나열된 파일만 비교합니다. 또한 고객은 매니페스트를 사용하여 Amazon S3 버킷에서 특정 버전의 객체를 복사할 수 있습니다.
AWS DataSync가 일정에 따라 전송하도록 구성할 수 있나요?
예. 반복 전송을 관리하기 위해 스크립트를 작성하고 실행할 필요 없이 AWS DataSync 콘솔 또는 AWS CLI(명령줄 인터페이스)를 사용하여 작업을 예약할 수 있습니다. 태스크 일정 예약은 콘솔에서 직접 제공되는 시간별, 일별 또는 주별 옵션을 사용하여 구성한 일정에 따라 태스크를 자동으로 실행합니다. 이를 통해 데이터 세트의 변경 사항이 자동으로 감지되어 대상 스토리지에 복사될 수 있습니다.
AWS DataSync는 파일을 복사할 때 디렉터리 구조를 유지하나요?
예. AWS DataSync는 파일을 전송할 때 원본 위치의 구조와 같은 디렉터리 구조를 대상에 생성합니다.
AWS DataSync 태스크가 중단된 경우 어떻게 되나요?
태스크가 중단된 경우(예: 네트워크 연결이 끊어지거나 AWS DataSync 에이전트가 다시 시작되는 경우) 다음 태스크 실행 시 누락된 파일을 전송하며, 데이터는 실행 종료 시 완전하고 일관된 상태가 됩니다. 태스크가 시작될 때마다 증분 복사를 수행하여 변경 내용만 원본에서 대상으로 전송합니다.
AWS Direct Connect를 통해 AWS DataSync를 사용할 수 있나요?
Direct Connect 링크가 있는 AWS DataSync를 사용하여 퍼블릭 서비스 엔드포인트 또는 프라이빗 VPC 엔드포인트에 액세스할 수 있습니다. VPC 엔드포인트를 사용하는 경우 DataSync 에이전트와 AWS 서비스 간에 전송되는 데이터는 퍼블릭 인터넷을 통과하거나 퍼블릭 IP 주소를 사용할 필요가 없으므로 네트워크를 통해 복사될 때 데이터의 보안이 강화됩니다. DataSync Discovery는 현재 퍼블릭 서비스 엔드포인트를 통해서만 지원됩니다.
AWS DataSync에서 VPC 엔드포인트 또는 AWS PrivateLink를 지원하나요?
예. VPC 엔드포인트는 데이터 이동 사용 사례에서 지원됩니다. VPC 엔드포인트를 사용하여 AWS DataSync 에이전트 간에 전송된 데이터(온프레미스 또는 클라우드 내 배포됨)가 퍼블릭 인터넷을 통과하거나 퍼블릭 IP 주소를 사용할 필요가 없도록 보장할 수 있습니다. VPC 엔드포인트를 사용하면 Amazon Virtual Private Cloud(Amazon VPC) 내에서 네트워크 트래픽을 유지하여 데이터 보안을 강화할 수 있습니다. DataSync용 VPC 엔드포인트는 AWS PrivateLink를 통해 제공됩니다. AWS PrivateLink는 지원되는 AWS 서비스에 VPC를 비공개로 연결할 수 있는 가용성과 확장성이 뛰어난 기술입니다.
VPC 엔드포인트를 사용하도록 AWS DataSync를 구성하려면 어떻게 해야 하나요?
VPC 엔드포인트를 AWS DataSync와 함께 사용하려면 선택한 VPC에 DataSync 서비스용 AWS PrivateLink 인터페이스 VPC 엔드포인트를 생성한 다음, DataSync 에이전트를 생성할 때 이 엔드포인트 탄력적 네트워크 인터페이스(ENI)를 선택하면 됩니다. 그러면 에이전트는 이 ENI에 연결되어 활성화되며, 이후에 이 에이전트에서 전송하는 모든 데이터는 구성된 VPC 내에 유지됩니다. AWS DataSync Console, AWS CLI(명령줄 인터페이스) 또는 AWS SDK를 사용하여 VPC 종단점을 구성할 수 있습니다. 자세히 알아보려면 가상 사설 클라우드에서 AWS DataSync 사용을 참조하십시오.
AWS 스토리지 간 이동
AWS DataSync에서 지원하는 AWS 스토리지 서비스는 무엇인가요?
AWS DataSync는 Amazon Simple Storage Service(Amazon S3), Amazon Elastic File System(Amazon EFS), Amazon FSx for Windows File Server, Amazon FSx for Lustre, Amazon FSx for OpenZFS 및 Amazon FSx for NetApp ONTAP 간의 데이터 이동을 지원합니다.
Amazon S3 Glacier Instant Retrieval, Amazon S3 Glacier Flexible Retrieval(이전의 S3 Glacier), Amazon S3 Glacier Deep Archive 또는 기타 S3 스토리지 클래스에 데이터를 복사할 수 있나요?
예. AWS DataSync를 사용하도록 S3 버킷을 구성하는 경우 DataSync가 객체를 저장할 때 사용하는 S3 스토리지 클래스를 선택할 수 있습니다. DataSync는 S3 Standard, S3 Intelligent-Tiering, S3 Standard-Infrequent Access(S3 Standard-IA), S3 One Zone-Infrequent Access(S3 One Zone-IA), Amazon S3 Glacier Instant Retrieval, Amazon S3 Glacier Flexible Retrieval 및 Amazon S3 Glacier Deep Archive(S3 Glacier Deep Archive)에 직접 데이터를 저장합니다. Amazon S3 스토리지 클래스에 대한 자세한 내용은 Amazon Simple Storage Service 개발자 안내서를 참조하세요.
객체당 최소 청구 용량보다 작은 객체는 S3 Standard에 저장됩니다. 예를 들어 크기가 0바이트이고 메타데이터만 포함하는 폴더 객체는 S3 Standard에 저장됩니다. 설명서에서 Amazon S3 스토리지 클래스 작업 시 고려 사항과 DataSync 사용 시 S3 요청 비용 평가에 대한 내용을 읽어 보세요. 최소 충전 용량에 대한 자세한 내용은 Amazon S3 요금을 참조하세요.
S3 Standard-IA 및 S3 One Zone-IA 스토리지 클래스에서 데이터를 복사할 수 있나요?
예. AWS DataSync 태스크의 원본 위치로 S3를 사용하는 경우 서비스는 버킷에서 대상으로 복사할 모든 객체를 검색합니다. S3 Standard-IA 및 S3 One Zone-IA 스토리지에서 객체를 검색하면 객체의 크기에 따라 검색 요금이 부과됩니다. AWS 설명서에서 Amazon S3 스토리지 클래스 작업 시 고려 사항을 참조하세요.
Amazon S3 Glacier Instant Retrieval에서 데이터를 복사할 수 있나요? Amazon S3 Glacier Flexible Retrieval(이전의 S3 Glacier) 및 Amazon S3 Glacier Deep Archive에서 데이터를 복사할 수 있나요?
AWS DataSync 태스크의 소스 위치로 S3를 사용하는 경우 서비스는 버킷에서 대상으로 복사할 모든 객체를 검색하려 시도합니다. S3 Glacier Instant Retrieval 스토리지 클래스에 아카이빙된 객체를 검색하면 객체 크기에 따라 더 높은 검색 요금이 부과됩니다. S3 Glacier Flexible Retrieval 또는 S3 Glacier Deep Archive 스토리지 클래스에 아카이브되는 객체를 검색하면 오류가 발생합니다. 아카이브된 객체 검색 중 발생한 오류는 DataSync에서 기록하며, 완료 상태는 태스크 실패로 표시됩니다. 설명서에서 Amazon S3 스토리지 클래스 작업 시 고려 사항과 DataSync 사용 시 S3 요청 비용 평가에 대한 내용을 읽어 보세요.
AWS DataSync는 Amazon S3 버킷에 어떻게 액세스하나요?
AWS DataSync에서는 사용자가 제공하는 IAM 역할을 맡습니다. 역할에 연결하는 정책은 역할이 수행할 수 있는 작업을 결정합니다. DataSync는 자동으로 이 역할을 자동 생성하거나 사용자가 수동으로 역할을 구성할 수 있습니다.
AWS DataSync에서 파일 및 폴더를 Amazon S3의 객체로 변환하거나, 반대로 변환하려면 어떻게 해야 하나요?
파일 또는 폴더가 Amazon S3로 복사될 때 파일 또는 폴더와 객체 사이에는 일대일 관계가 존재합니다. 파일 및 폴더 타임스탬프와 POSIX 권한(사용자 ID, 그룹 ID 및 권한 포함)은 S3 사용자 메타데이터에 저장됩니다. NFS 공유의 경우 S3 사용자 메타데이터에 저장된 파일 메타데이터는 File Gateway와 완벽하게 상호 운영 가능하며, 이를 통해 AWS DataSync에서 Amazon S3에 저장된 데이터에 대한 온프레미스 파일 기반 액세스를 제공합니다.
DataSync가 이 사용자 메타데이터를 포함하는 객체를 다시 NFS 서버로 복사하는 경우 파일 메타데이터가 복원됩니다. NFS에서 S3로 다시 복사할 때 기호 링크 및 하드 링크도 복원됩니다.
SMB 파일 공유에서 복사하는 경우 기본 POSIX 권한은 S3 사용자 메타데이터에 저장됩니다. SMB 파일 공유로 다시 복사하는 경우 소유권은 해당 파일 공유에 액세스하도록 DataSync에 구성된 사용자에 기반하여 설정되며, 기본 권한이 할당됩니다.
HDFS에서 복사하면 파일 및 폴더 타임스탬프, 사용자 및 그룹 소유권과 POSIX 권한이 S3 사용자 메타데이터에 저장됩니다. Amazon S3에서 HDFS로 다시 복사하면 파일 및 폴더 메타데이터가 복원됩니다.
자세한 내용은 AWS 설명서의 DataSync의 파일 및 메타데이터 저장 방법을 참조하세요.
자체 관리형 객체 스토리지 또는 Azure Blob Storage와 Amazon S3 사이에서 객체를 전송할 때 어떤 객체 메타데이터가 보존되나요?
DataSync는 자체 관리형 객체 스토리지 또는 Azure Blob Storage와 Amazon S3 사이에서 객체를 전송할 때 객체 메타데이터 및 태그와 함께 객체를 복사합니다.
Amazon S3 버킷 사이에서 객체를 전송할 때 어떤 객체 메타데이터가 보존되나요?
DataSync는 Amazon S3 버킷 사이에서 객체를 전송할 때 객체 메타데이터 및 태그와 함께 객체를 복사합니다. DataSync는 객체 ACL 또는 사전 객체 버전과 같은 기타 객체 정보를 복사하지 않습니다.
AWS DataSync에서 S3 스토리지 클래스를 사용할 때 어떤 Amazon S3 요청 및 스토리지 비용이 적용되나요?
일부 S3 스토리지 클래스는 데이터 검색, 최소 스토리지 용량 및 최소 스토리지 기간과 같이 비용에 영향을 줄 수 있는 동작을 포함합니다. DataSync는 데이터 관리를 자동화하여 이러한 요소를 처리하고, 데이터 검색을 최소화하는 설정을 제공합니다.
객체당 최소 용량 요금을 피하기 위해 AWS DataSync는 작은 객체를 S3 Standard에 자동으로 저장합니다. 데이터 검색 요금을 최소화하기 위해 DataSync를 지정된 태스크에서 전송한 파일만 확인하도록 구성할 수 있습니다. 최소 스토리지 기간 요금을 피하기 위해 DataSync에는 객체 덮어 쓰기 및 삭제를 위한 관리 기능이 있습니다. 설명서에서 Amazon S3 스토리지 클래스 작업 시 비용 고려 사항과 DataSync 사용 시 S3 요청 비용 평가에 대한 내용을 읽어 보세요.
AWS Outposts의 Amazon S3 버킷 내/외부로 객체 데이터를 복사할 수 있나요?
예. AWS Outposts의 Amazon S3와 AWS 리전의 Amazon S3 버킷 사이에서 객체를 복사할 수 있습니다. AWS DataSync는 객체 메타데이터 및 객체 태그와 함께 객체를 복사합니다. DataSync에서 Outposts 버킷의 Amazon S3에 액세스하려면 DataSync EC2 에이전트를 사용자 Outpost에 배포합니다.
Outposts에서 DataSync와 Amazon S3를 함께 사용하는 경우 AWS 리전의 Amazon S3 버킷 내/외부로 데이터를 전송할 수만 있습니다. DataSync 태스크에 대해 지원되는 소스 및 대상에 대한 자세한 내용은 설명서에서 확인할 수 있습니다.
AWS DataSync에서 Amazon EFS 파일 시스템에 액세스하려면 어떻게 해야 하나요?
AWS DataSync는 NFS 프로토콜을 사용하여 Amazon EFS 파일 시스템에 액세스합니다. DataSync 서비스는 DataSync 서비스에서 관리하는 ENI(탄력적 네트워크 인터페이스)를 통해 VPC 내에 파일 시스템을 탑재합니다. DataSync는 사용자를 대신하여 이러한 ENI의 생성, 사용 및 삭제를 모두 관리합니다. 탑재 대상 또는 EFS 액세스 포인트를 사용하여 EFS 파일 시스템을 탑재하도록 선택할 수 있습니다.
AWS DataSync를 모든 Amazon EFS 스토리지 클래스와 함께 사용할 수 있나요?
예. AWS DataSync를 사용하여 파일을 Amazon EFS로 복사하고 EFS 수명 주기 관리를 일정 기간 액세스하지 않은 파일을 Infrequent Access(IA) 스토리지 클래스로 마이그레이션하도록 구성할 수 있습니다.
AWS DataSync에서 Amazon EFS 파일 시스템 리소스 정책을 사용하려면 어떻게 해야 하나요?
IAM 아이덴티티 정책과 리소스 정책을 모두 사용하여 클라우드 환경에 최적화된 확장 가능한 방식으로 Amazon EFS 리소스에 대한 클라이언트 액세스를 제어할 수 있습니다. EFS 파일 시스템에 대한 DataSync 위치를 생성할 때 DataSync에서 EFS에 액세스할 때 수임할 IAM 역할을 지정할 수 있습니다. 그런 다음 EFS 파일 시스템 정책을 사용하여 IAM 역할에 대한 액세스를 구성하면 됩니다. DataSync는 EFS 파일 시스템을 루트 사용자로 탑재하므로 IAM 정책은 elasticfilesystem:ClientRootAccess 작업을 허용해야 합니다.
AWS DataSync를 사용하여 다른 AWS 리전으로 Amazon EFS 파일 시스템을 복제할 수 있나요?
예. Amazon EFS가 기본적으로 제공하는 복제 기능에 더해 AWS DataSync를 사용하여 동일한 AWS 계정 내 두 번째 Amazon EFS 파일 시스템으로 Amazon EFS 파일 시스템의 주기적 복제를 예약할 수 있습니다. 이 기능은 동일한 리전 및 교차 리전 배포 모두에서 사용 가능하며, DataSync 에이전트를 사용하지 않아도 됩니다.
NFS 공유 및 Amazon EFS 간 또는 두 Amazon EFS 파일 시스템 간에 데이터를 복사할 때 어떤 메타데이터가 보존됩니까?
AWS DataSync는 파일 및 폴더 타임스탬프와 POSIX 권한(사용자 ID, 그룹 ID 및 권한 포함)을 복사합니다. 자세히 알아보고 복사되는 메타데이터의 전체 목록을 보려면 설명서를 참조하세요.
HDFS와 Amazon EFS 간에 데이터를 복사할 때 보존되는 메타데이터는 무엇입니까?
AWS DataSync는 파일 및 폴더 타임스탬프와 POSIX 권한을 복사하고 사용자 ID 및 그룹 ID에 대해 기본값을 적용합니다. 자세히 알아보고 복사되는 메타데이터의 전체 목록을 보려면 설명서를 참조하세요.
AWS DataSync는 어떻게 Amazon FSx for Windows File Server 파일 시스템에 액세스하나요?
AWS DataSync는 SMB 프로토콜을 사용하여 AWS Console 또는 CLI에서 구성한 사용자 이름과 암호로 인증해 Amazon FSx for Windows File Server 파일 시스템에 액세스합니다. DataSync 서비스는 DataSync 서비스에서 관리하는 ENI(탄력적 네트워크 인터페이스)를 통해 VPC 내에 파일 시스템을 탑재합니다. DataSync는 사용자를 대신하여 이러한 ENI의 생성, 사용 및 삭제를 모두 관리합니다.
Amazon FSx for Windows File Server 파일 시스템에 대한 SMB 공유 간 또는 두 Amazon FSx 파일 시스템 간에 데이터를 복사할 때 어떤 Windows 메타데이터가 전송됩니까?
AWS DataSync는 파일 타임스탬프, 파일 소유자, 표준 파일 속성, NTFS 임의 액세스 목록(DACL) 및 NTFS 시스템 액세스 제어 목록(SACL)을 포함하여 Windows 메타데이터를 복사합니다. 자세히 알아보고 복사되는 메타데이터의 전체 목록을 보려면 설명서를 참조하세요.
AWS DataSync를 사용하여 다른 AWS 리전으로 Amazon FSx for Windows File Server 파일 시스템을 복제할 수 있나요?
예. AWS DataSync를 사용하여 동일한 AWS 계정 내 두 번째 파일 시스템으로 Amazon FSx for Windows File Server 파일 시스템의 주기적 복제를 예약할 수 있습니다. 이 기능은 동일한 리전 및 교차 리전 배포 모두에서 사용 가능하며, DataSync 에이전트를 사용하지 않아도 됩니다.
AWS DataSync는 어떻게 Amazon FSx for Lustre 파일 시스템에 액세스하나요?
FSx for Lustre 파일 시스템에서 복사하거나 해당 파일 시스템으로 복사할 DataSync 태스크를 생성하는 경우 DataSync 서비스는 파일 시스템이 있는 동일한 VPC 및 서브넷에서 탄력적 네트워크 인터페이스(ENI)를 생성합니다. DataSync는 이러한 ENI를 통해 Lustre 프로토콜을 루트 사용자로 사용해 FSx for Lustre 파일 시스템에 액세스합니다. FSx for Lustre 파일 시스템에 대한 DataSync 위치 리소스를 생성하는 경우 ENI에 적용하고 DataSync 서비스에서 아웃바운드 액세스를 구성할 최대 5개의 보안 그룹을 지정할 수 있습니다. 보안 그룹은 FSx for Lustre에 필요한 네트워크 포트에서 아웃바운드 트래픽을 허용하도록 구성되어야 합니다. FSx for Lustre 파일 시스템의 보안 그룹은 FSx for Lustre 파일 시스템에 대한 DataSync 위치 리소스에 지정된 보안 그룹의 인바운드 액세스를 허용하도록 구성되어야 합니다.
NFS 공유 또는 Amazon EFS 파일 시스템 및 Amazon FSx for Lustre 사이나, 두 Amazon FSx for Lustre 파일 시스템 사이에서 데이터를 복사할 때 어떤 메타데이터가 유지됩니까?
AWS DataSync는 파일 및 폴더 타임스탬프와 POSIX 권한(사용자 ID, 그룹 ID 및 권한 포함)을 복사합니다. 자세히 알아보고 복사되는 메타데이터의 전체 목록을 보려면 설명서를 참조하세요.
AWS DataSync를 사용하여 한 FSx for Lustre 파일 시스템에서 다른 파일 시스템으로 데이터를 마이그레이션할 수 있나요?
예. AWS DataSync를 사용하여 FSx for Lustre 파일 시스템에서 동일한 AWS 계정 내 두 번째 파일 시스템으로 복사할 수 있습니다. 이 기능은 동일한 리전 및 교차 리전 배포 모두에서 사용 가능하며, DataSync 에이전트를 사용하지 않아도 됩니다.
AWS DataSync를 사용하여 다른 AWS 리전으로 Amazon FSx for Lustre 파일 시스템을 복제할 수 있나요?
예. AWS DataSync를 사용하여 동일한 AWS 계정 내 두 번째 파일 시스템으로 Amazon FSx for Lustre 파일 시스템의 주기적 복제를 예약할 수 있습니다. 이 기능은 동일한 리전 및 교차 리전 배포 모두에서 사용 가능하며, DataSync 에이전트를 사용하지 않아도 됩니다.
DataSync는 한 Amazon FSx for Lustre 파일 시스템에서 다른 파일 시스템으로 복사할 때 스트라이핑 또는 레이아웃 설정을 복사하나요?
아니요. 대상 파일 시스템의 파일 레이아웃 및 스트라이핑 구성을 사용하여 파일을 씁니다.
AWS DataSync는 어떻게 Amazon FSx for OpenZFS 파일 시스템에 액세스하나요?
FSx for OpenZFS 파일 시스템에서 복사하거나 해당 파일 시스템으로 복사할 DataSync 태스크를 생성하는 경우 DataSync 서비스는 파일 시스템이 있는 동일한 VPC 및 서브넷에서 탄력적 네트워크 인터페이스(ENI)를 생성합니다. DataSync는 이러한 ENI를 통해 OpenZFS 프로토콜을 루트 사용자로 사용해 FSx for OpenZFS 파일 시스템에 액세스합니다. FSx for OpenZFS 파일 시스템에 대한 DataSync 위치 리소스를 생성하는 경우 ENI에 적용하고 DataSync 서비스에서 아웃바운드 액세스를 구성할 최대 5개의 보안 그룹을 지정할 수 있습니다. 보안 그룹은 FSx for OpenZFS에 필요한 네트워크 포트에서 아웃바운드 트래픽을 허용하도록 구성되어야 합니다. FSx for OpenZFS 파일 시스템의 보안 그룹은 FSx for OpenZFS 파일 시스템에 대한 DataSync 위치 리소스에 지정된 보안 그룹의 인바운드 액세스를 허용하도록 구성되어야 합니다.
NFS 공유 또는 Amazon EFS 파일 시스템 및 Amazon FSx for OpenZFS 사이나, 두 Amazon FSx for OpenZFS 파일 시스템 사이에서 데이터를 복사할 때 어떤 메타데이터가 유지됩니까?
AWS DataSync는 파일 및 폴더 타임스탬프와 POSIX 권한(사용자 ID, 그룹 ID 및 권한 포함)을 복사합니다. 자세히 알아보고 복사되는 메타데이터의 전체 목록을 보려면 설명서를 참조하세요.
AWS DataSync를 사용하여 한 FSx for OpenZFS 파일 시스템에서 다른 파일 시스템으로 데이터를 마이그레이션할 수 있나요?
예. AWS DataSync를 사용하여 FSx for OpenZFS 파일 시스템에서 동일한 AWS 계정 내 두 번째 파일 시스템으로 복사할 수 있습니다. 이 기능은 동일한 리전 및 교차 리전 배포 모두에서 사용 가능하며, DataSync 에이전트를 사용하지 않아도 됩니다.
AWS DataSync를 사용하여 다른 AWS 리전으로 Amazon FSx for OpenZFS 파일 시스템을 복제할 수 있나요?
예. AWS DataSync를 사용하여 동일한 AWS 계정 내 두 번째 파일 시스템으로 Amazon FSx for OpenZFS 파일 시스템의 주기적 복제를 예약할 수 있습니다. 이 기능은 동일한 리전 및 교차 리전 배포 모두에서 사용 가능하며, DataSync 에이전트를 사용하지 않아도 됩니다.
AWS DataSync는 어떻게 Amazon FSx for NetApp ONTAP 파일 시스템에 액세스하나요?
태스크를 생성하면 DataSync가 Amazon FSx for NetApp ONTAP 파일 시스템이 있는 VPC와 동일한 VPC의 기본 서브넷에 탄력적 네트워크 인터페이스(ENI)를 생성합니다. 기본 서브넷은 FSx for ONTAP 파일 시스템을 생성할 때 구성되며, DataSync는 해당 서브넷에 생성한 ENI를 사용하여 FSx for ONTAP 파일 시스템에 액세스합니다. FSx for ONTAP 파일 시스템에 대한 DataSync 위치 리소스를 생성하는 경우 ENI에 적용하여 DataSync 서비스에서 아웃바운드 액세스를 구성할 최대 5개의 보안 그룹을 지정할 수 있습니다. FSx for ONTAP 파일 시스템의 보안 그룹은 FSx for ONTAP 파일 시스템에 대한 DataSync 위치 리소스에 지정된 보안 그룹의 인바운드 액세스를 허용하도록 구성해야 합니다.
AWS DataSync는 Amazon FSx for NetApp ONTAP에 어떤 프로토콜 버전을 사용할 수 있나요?
AWS DataSync는 NFSv3, SMB 2.1, SMB 3을 사용하도록 지원합니다. DataSync는 현재 NFSv4 이상을 FSx for ONTAP에 사용하도록 지원하지 않습니다.
AWS DataSync는 Amazon FSx for NetApp ONTAP 안팎으로 데이터를 복사할 때 파일 시스템 메타데이터를 보존하나요?
예. AWS DataSync는 NFS 프로토콜을 사용할 경우 파일 및 폴더 타임스탬프와 POSIX 권한(사용자 ID, 그룹 ID 및 권한 포함)을 복사합니다. SMB 프로토콜을 사용할 경우, DataSync는 파일 및 폴더 타임스탬프, 소유권 및 ACL을 복사합니다. 자세히 알아보고 복사되는 메타데이터의 전체 목록을 보려면 설명서를 참조하세요.
Amazon FSx for NetApp ONTAP으로 데이터를 마이그레이션할 때 사용해야 하는 프로토콜은 무엇인가요?
SMB 프로토콜을 통해 사용자에게 서비스를 제공하는 Windows 서버 또는 NAS 공유에서 마이그레이션할 때는 FSx for ONTAP 위치에 DataSync SMB 소스 위치와 SMB 프로토콜을 사용하여 FSx for ONTAP 볼륨의 보안 스타일이 NTFS에 맞게 구성되도록 합니다. NFS 프로토콜을 통해 사용자에게 서비스를 제공하는 Unix 또는 Linux 서버 또는 NAS 공유에서 마이그레이션할 때는 FSx for ONTAP 위치에 DataSync NFS 소스 위치와 NFS 프로토콜을 사용하여 FSx for ONTAP 볼륨의 보안 스타일이 Unix에 맞게 구성되도록 합니다. 다중 프로토콜 마이그레이션의 경우 Amazon FSX for NetApp ONTAP으로 다중 프로토콜 워크로드 지원 블로그에서 다루는 모범 사례를 참조하고, SMB 프로토콜을 사용하여 파일 시스템 메타데이터를 최고의 충실도로 보존해야 합니다. FSx for ONTAP 볼륨의 보안 스타일 구성에 대한 자세한 내용은 FSx for ONTAP 볼륨 관리에 대한 설명서를 참조하세요.
AWS DataSync를 통해, 서로 다른 프로토콜을 사용하여 동일한 Amazon FSx for NetApp ONTAP 파일 시스템에 액세스할 수 있나요?
예, 가능합니다. 단, 각 프로토콜(NFS 또는 SMB)별로 별도의 DataSync 위치와 태스크 리소스를 생성해야 합니다. 데이터 덮어쓰기 및 데이터 검증과 관련한 문제를 방지하려면, (동일한 프로토콜을 사용하든 서로 다른 프로토콜을 사용하든 관계없이) 여러 DataSync 작업을 사용하여 동일한 볼륨 경로에 동시에 복사하지 않는 것이 좋습니다.
AWS DataSync를 사용하여 Amazon FSx for NetApp ONTAP 안팎으로 데이터를 전송할 수 있나요?
아니요. DataSync는 NFS 또는 SMB 프로토콜을 사용한 FSx for ONTAP 안팎으로의 파일 데이터 복사만 지원합니다.
AWS DataSync를 사용하여 Amazon FSx for NetApp ONTAP 파일 시스템 간에 데이터를 복사할 수 있나요?
예. AWS DataSync를 사용하여 FSx for ONTAP 파일 시스템에서 동일한 AWS 계정 내 두 번째 파일 시스템으로 복사할 수 있습니다. 이 기능은 동일한 리전 및 교차 리전 배포 모두에서 사용 가능하며, DataSync 에이전트를 사용하지 않아도 됩니다.
AWS DataSync를 사용하여 다른 AWS 리전의 다른 파일 시스템으로 Amazon FSx for NetApp ONTAP 파일 시스템을 복제할 수 있나요?
DataSync를 사용하여 파일 시스템 간에 데이터를 복제할 수 있지만, NetApp SnapMirror를 사용하여 FSx for ONTAP 파일 시스템 간에 데이터를 복제하는 것이 좋습니다. SnapMirror를 사용하면 파일 시스템의 파일 수나 크기에 관계없이 짧은 RPO를 실현할 수 있습니다.
스냅샷 디렉터리를 복사하지 않도록 AWS DataSync를 구성하려면 어떻게 해야 하나요?
DataSync는 ‘.snapshot’이라는 이름의 폴더를 자동으로 제외합니다. 또한 제외 필터를 사용하여 지정한 패턴과 일치하는 파일 및 폴더가 복사되지 않도록 할 수도 있습니다.
AWS Snow Family 디바이스 간 이동
Snow의 Amazon S3 호환 스토리지와 AWS 스토리지 서비스 간에 데이터를 이동하려면 어떻게 해야 하나요?
먼저 온프레미스 환경에 DataSync 에이전트를 배포합니다. AWS Management Console 또는 CLI를 사용하여 에이전트를 활성화하고 DataSync 태스크를 설정하여 Amazon S3 호환 스토리지의 버킷과 Amazon S3, Amazon EFS 또는 Amazon FSx 파일 시스템 간에 데이터를 이동합니다.
성능
AWS DataSync는 얼마나 빠르게 파일 시스템을 AWS에 복사할 수 있나요?
AWS DataSync가 데이터세트를 복사할 수 있는 속도는 데이터 크기, 소스 및 대상 스토리지에서 달성할 수 있는 I/O 대역폭, 사용 가능한 네트워크 대역폭 및 네트워크 상태에 따라 계산됩니다. 온프레미스 및 AWS 스토리지 서비스 간 데이터 전송의 경우 단일 DataSync 태스크로 10Gbps 네트워크 링크를 충분히 활용할 수 있습니다.
AWS DataSync 태스크에서 사용하는 네트워크 대역폭의 크기를 제어할 수 있나요?
예. 내장 대역폭 제한을 구성하여 AWS DataSync에서 사용할 네트워크 대역폭의 크기를 제어할 수 있습니다. 데이터 전송 태스크를 실행하는 동안 이 제한을 늘리거나 줄일 수 있습니다. 이를 통해 동일한 네트워크 연결을 사용하는 다른 사용자 또는 애플리케이션에 미치는 영향을 최소화할 수 있습니다.
AWS DataSync의 성능을 모니터링하려면 어떻게 해야 하나요?
AWS DataSync는 Amazon CloudWatch 지표를 생성하여 전송 프로세스에 대한 세부적인 가시성을 제공합니다. 이러한 지표를 사용하면 파일 검색 및 확인 진행뿐만 아니라 복사된 파일 수 및 데이터 양을 볼 수 있습니다. DataSync 콘솔에서 이러한 지표가 포함된 CloudWatch 그래프를 직접 볼 수 있습니다.
AWS DataSync가 원본 파일 시스템의 성능에 영향을 미칩니까?
온프레미스 파일 스토어의 용량, 전송되는 파일의 수와 크기에 따라 AWS DataSync는 동일한 원본 데이터 스토어에 액세스할 때 다른 클라이언트의 응답 시간에 영향을 미칠 수 있습니다. 이는 해당 스토리지 시스템에서 에이전트가 데이터를 읽거나 쓰기 때문입니다. 태스크에 대한 대역폭 제한을 구성하면 스토리지 시스템에 대한 I/O 제한으로 이 영향을 줄일 수 있습니다.
보안 및 규정 준수
AWS DataSync Discovery는 온프레미스 스토리지에 어떻게 액세스하나요?
AWS DataSync Discovery는 DataSync 에이전트를 사용하여 스토리지 시스템의 관리/API 인터페이스에 액세스합니다. 모든 액세스는 읽기 전용입니다. 스토리지 액세스에 사용되는 API에 대한 자세한 내용은 DataSync 설명서를 참조하세요.
AWS DataSync Discovery를 사용할 때 온프레미스 스토리지 시스템에 대한 보안 인증 정보를 지정하려면 어떻게 해야 하고 이 정보는 어떻게 보호되나요?
스토리지 시스템을 검색하도록 AWS DataSync Discovery를 구성할 때 스토리지의 API 인터페이스에 액세스하기 위한 사용자 이름과 암호를 제공합니다. 그러면 AWS DataSync Discovery가 AWS Secrets Manager에 자동으로 비밀을 생성하여 보안 인증 정보를 저장합니다. DataSync Discovery는 검색 작업을 실행할 때 비밀에서 암호를 검색하고 다시 암호화한 후 암호화된 암호를 작업에 사용되는 에이전트로 전송합니다. 암호는 작업 기간에만 에이전트의 메모리에 유지되며 메모리 외부에서 암호가 지속되는 일은 없습니다.
전송 중 및 저장된 데이터는 암호화되나요?
예. 원본과 대상 사이에서 전송되는 모든 데이터는 SSL(보안 소켓 계층)을 대체하는 TLS(전송 계층 보안)를 통해 암호화됩니다. AWS DataSync 자체에는 데이터가 잔류하지 않습니다. 서비스는 S3 버킷에 대한 기본 암호화, 저장 데이터의 Amazon EFS 파일 시스템 암호화, 저장 및 전송 중에 Amazon FSx 암호화를 사용하여 지원합니다.
AWS DataSync에서 NFS 서버 또는 SMB 파일 공유에 액세스하려면 어떻게 해야 하나요?
AWS DataSync는 사용자가 IT 환경 또는 Amazon EC2에 배포한 에이전트를 사용하여 NFS 또는 SMB 프로토콜을 통해 파일에 액세스합니다. 이러한 에이전트는 AWS 내의 DataSync 서비스 엔드포인트에 연결되며 AWS Management Console 또는 CLI를 통해 안전하게 관리됩니다.
AWS DataSync는 Hadoop 클러스터의 HDFS에 어떻게 액세스하나요?
AWS DataSync는 사용자가 IT 환경 또는 Amazon EC2에 배포한 에이전트를 사용하여 Hadoop 클러스터에 액세스합니다. DataSync 에이전트는 HDFS 클라이언트 역할을 하며 클러스터의 NameNode 및 DataNode와 통신합니다. 사용자가 태스크를 시작하면 DataSync가 프라이머리 NameNode를 쿼리하여 클러스터의 파일 및 폴더 위치를 결정합니다. 그런 다음 DataSync는 클러스터의 DataNode와 통신하여 HDFS의 파일 및 폴더를 복사합니다.
AWS DataSync는 Amazon S3 프로토콜을 지원하는 자체 관리형 스토리지 또는 클라우드 객체 스토리지에 어떻게 액세스하나요?
AWS DataSync는 사용자가 데이터 센터 또는 퍼블릭 클라우드 환경이나 Amazon EC2에 배포한 에이전트를 사용하여 Amazon S3 API를 통해 객체에 액세스합니다. 이러한 에이전트는 AWS 내의 DataSync 서비스 엔드포인트에 연결되며 AWS Management Console 또는 CLI를 통해 안전하게 관리됩니다.
AWS DataSync는 Azure Blob Storage 컨테이너에 어떻게 액세스하나요?
AWS DataSync는 사용자가 Azure 환경 또는 Amazon EC2에 배포한 에이전트를 사용하여 Azure Blob Storage 컨테이너의 객체에 액세스합니다. 이 에이전트는 AWS 내의 DataSync 서비스 엔드포인트에 연결되며 AWS Management Console 또는 CLI를 통해 안전하게 관리됩니다. 에이전트는 DataSync Azure Blob 위치를 만들 때 지정한 SAS 토큰을 사용하여 Azure 컨테이너에 인증합니다.
AWS DataSync를 대상 스토리지에 연결하려면 VPN을 설정해야 하나요?
아니요. 구내로 또는 구내에서 데이터를 복사할 때 VPN/터널을 설정하거나 인바운드 연결을 허용할 필요가 없습니다. 표준 네트워크 포트를 사용하여 방화벽을 통해 라우팅하도록 AWS DataSync 에이전트를 구성할 수 있습니다. 또한 VPC 엔드포인트를 사용하여 Amazon Virtual Private Cloud(Amazon VPC)에 DataSync를 배포할 수도 있습니다. VPC 종단점을 사용하는 경우 DataSync 에이전트와 AWS 서비스 간에 전송되는 데이터는 퍼블릭 인터넷을 통과하거나 퍼블릭 IP 주소를 사용할 필요가 없습니다.
AWS DataSync 에이전트를 안전하게 AWS에 연결하려면 어떻게 해야 하나요?
AWS DataSync 에이전트는 선택한 AWS 리전 내 DataSync 서비스 엔드포인트에 연결할 수 있습니다. 에이전트를 퍼블릭 인터넷 관련 엔드포인트, FIPS(Federal Information Processing Standards) 인증 엔드포인트 또는 VPC 중 하나에 있는 엔드포인트에 연결하도록 선택할 수 있습니다. 에이전트를 활성화하면 에이전트가 AWS 계정과 안전하게 연결됩니다. 자세히 알아보려면 서비스 엔드포인트 선택 및 에이전트 활성화를 참조하세요.
AWS DataSync 에이전트는 어떻게 패치 및 업데이트되나요?
기본 운영 체제 및 AWS DataSync 소프트웨어 패키지 모두를 포함하여 에이전트 VM에 대한 업데이트는 에이전트가 활성화되면 AWS에 의해 자동으로 적용됩니다. 에이전트가 유휴 상태가 되고 데이터 전송 태스크를 실행하지 않으면 업데이트는 무중단으로 적용됩니다.
AWS DataSync에서 지원하는 규정 준수 프로그램은 무엇인가요?
AWS는 클라우드에서 가장 오래 실행되는 규정 준수 프로그램을 보유하고 있습니다. AWS는 고객이 요구 사항을 처리할 수 있도록 최선을 다하고 있습니다. AWS DataSync는 글로벌 및 업계 보안 표준을 충족하도록 평가를 받았습니다. DataSync는 HIPAA 적격 서비스이며, PCI DSS, ISO 9001, 27001, 27017, 27018, SOC 1, 2, 3도 준수합니다. DataSync는 FedRAMP Moderate가 적용되는 AWS 미국 서부/동부 리전과 FedRamp High가 적용되는 AWS GovCloud(US) 리전에서 인가를 받았습니다. 따라서 쉽게 보안을 검증하고 의무 사항을 충족할 수 있습니다. 자세한 내용 및 리소스는 규정 준수 페이지를 참조하세요. 또한 규정 준수 프로그램 제공 범위 내 서비스 페이지에서 전체 서비스 및 인증 목록을 확인할 수 있습니다.
AWS DataSync는 PCI를 준수하나요?
예. AWS DataSync는 PCI-DSS를 준수하고, 따라서 이를 사용하여 결제 정보를 전송할 수 있습니다. AWS Artifact에서 PCI 규정 준수 패키지를 다운로드하여 AWS에서 PCI 규정 준수를 달성하는 방법에 대해 자세히 알아볼 수 있습니다.
AWS DataSync는 HIPAA 적격 서비스인가요?
예. AWS DataSync는 HIPAA 적격 서비스입니다. 따라서 AWS와 HIPAA BAA를 체결한 경우 DataSync를 사용하여 PHI(개인 건강 정보)를 전송할 수 있습니다.
AWS DataSync는 AWS 미국 동부/서부에서 FedRAMP JAB Moderate의 잠정적 인가를 받았나요?
예. AWS DataSync는 Federal Risk and Authorization Management Program(FedRAMP) Moderate 기준에 따라 미국 동부/서부 리전에서 Joint Authorization Board(JAB)로부터 잠정적 운영 인가(P-ATO)를 받았습니다. 연방 또는 상업 고객은 AWS 동부/서부 리전의 인가 영역 내에서 최대 중간 영향 수준의 데이터에 AWS DataSync를 사용할 수 있습니다.
AWS DataSync는 AWS GovCloud(미국) 리전에서 FedRAMP JAB High의 잠정적 인가를 받았나요?
예. AWS DataSync는 Federal Risk and Authorization Management Program(FedRAMP) High 기준에 따라 미국 GovCloud 리전에서 Joint Authorization Board(JAB)로부터 잠정적 운영 인가(P-ATO)를 받았습니다. 연방 또는 상업 고객은 AWS GovCloud(미국) 리전의 인가 영역 내에서 최대 높음 영향 수준의 데이터에 AWS DataSync를 사용할 수 있습니다.
AWS DataSync 선택 시기
AWS DataSync는 rsync 또는 Amazon S3 명령줄 인터페이스와 같은 명령줄 도구를 사용하는 것과 어떻게 다른가요?
AWS DataSync는 AWS로 대규모 활성 데이터세트의 이동을 완전히 자동화하고 가속화합니다. 기본적으로 Amazon S3, Amazon EFS, Amazon FSx, Amazon CloudWatch 및 AWS CloudTrail과 통합되어 스토리지 서비스에 원활하고 안전하게 액세스하고 전송에 대한 자세한 모니터링을 제공합니다.
DataSync는 특별히 구축된 네트워크 프로토콜 및 확장 아키텍처를 사용하여 데이터를 전송합니다. 온프레미스 및 AWS 스토리지 서비스 간 데이터 전송의 경우 단일 DataSync 태스크로 10Gbps 네트워크 링크를 충분히 활용할 수 있습니다.
DataSync는 데이터 전송을 완전히 자동화합니다. 이 서비스는 재시도 및 네트워크 복원력 메커니즘, 네트워크 최적화, 기본 제공 태스크 일정 예약, 태스크 보고서를 통한 감사, DataSync API 및 콘솔을 통한 모니터링, CloudWatch 지표, 전송 프로세스를 세부적으로 보여주는 이벤트 및 로그를 제공합니다. DataSync는 전송 중에는 물론, 전송 종료 시에도 데이터 무결성 검증을 수행합니다.
DataSync는 포괄적인 보안을 제공하고 AWS 스토리지 서비스와 직접 통합됩니다. 소스와 대상 간에 전송되는 모든 데이터는 TLS를 통해 암호화되며, AWS 스토리지에 액세스할 때는 IAM 역할 같은 기본 제공되는 AWS 보안 메커니즘이 적용됩니다. VPC 종단점이 있는 DataSync는 조직과 AWS 간에 전송된 데이터가 퍼블릭 인터넷을 통과하지 않도록 하여 데이터가 네트워크를 통해 복사될 때 데이터의 보안을 강화합니다.
버킷 사이에서 객체를 전송하려는 경우 AWS DataSync, S3 복제, S3 배치 작업은 각각 언제 사용해야 하나요?
AWS는 버킷 간 객체를 복사하는 여러 도구를 제공합니다.
AWS DataSync는 진행 중인 데이터 배포, 데이터 파이프라인 및 데이터 레이크 수집과 다중 버킷 간 데이터 분할 또는 통합에 사용합니다.
S3 복제는 특정 대상 버킷으로 데이터를 연속으로 복제할 때 사용합니다.
S3 배치 작업은 S3 객체에 대한 대규모 배치 작업(예: 객체 복사, 객체 태그 또는 액세스 제어 목록(ACL) 설정, Amazon S3 Glacier Flexible Retrieval(이전의 S3 Glacier)에서 객체 복원 시작, 객체를 사용한 사용자 지정 작업을 수행하기 위해 AWS Lambda 함수 호출, S3 Object Lock 법적 보존 관리 또는 S3 Object Lock 보존 날짜 관리)에 사용합니다.
언제 AWS DataSync를 사용하고 언제 AWS Snowball Edge를 사용해야 하나요?
AWS DataSync는 온라인 데이터 전송에 이상적입니다. DataSync를 사용하여 활성 데이터를 AWS로 마이그레이션하고, 분석 및 처리를 위해 데이터를 클라우드로 전송하며, 데이터를 아카이브하여 온프레미스 스토리지 용량을 확보하거나 비즈니스 연속성을 위해 데이터를 AWS로 복제할 수 있습니다.
AWS Snowball Edge는 오프라인으로 데이터를 전송하거나 대역폭이 제한되어 있거나 원격 환경, 연결이 끊어졌거나 열악한 환경에서 데이터를 전송하는 고객에게 적합합니다.
언제 AWS DataSync를 사용하고 언제 AWS Storage Gateway를 사용해야 하나요?
AWS DataSync를 사용하여 기존 데이터를 Amazon S3로 마이그레이션한 다음, 이후 AWS Storage Gateway의 File Gateway 구성을 사용하여 마이그레이션된 데이터 및 온프레미스 파일 기반 애플리케이션의 지속적인 업데이트에 대한 액세스를 유지합니다.
DataSync와 파일 게이트웨이를 함께 사용하면 온프레미스 애플리케이션을 클라우드 스토리지에 원활하게 연결하면서 온프레미스 인프라를 최소화할 수 있습니다. AWS DataSync는 AWS 스토리지 서비스로의 온라인 데이터 전송을 자동화하고 가속합니다. AWS DataSync를 사용하는 초기 데이터 전송 단계 이후에 파일 게이트웨이는 온프레미스 애플리케이션에서 마이그레이션된 데이터에 대한 액세스의 지연 시간을 줄여줍니다. NFS 공유에서 DataSync를 사용하는 경우 소스 온프레미스 스토리지의 POSIX 메타데이터가 보존되며, 파일 게이트웨이를 사용하여 파일에 액세스할 때 소스 스토리지의 권한이 적용됩니다.
언제 AWS DataSync를 사용하고 언제 Amazon S3 Transfer Acceleration을 사용해야 하나요?
애플리케이션이 이미 Amazon S3 API에 통합되어 있고, S3로의 대용량 파일 전송을 위해 더 높은 처리량을 원할 경우 S3 Transfer Acceleration을 사용할 수 있습니다. 기존 스토리지 시스템(예: Network Attached Storage) 또는 변경될 수 없는 기기(예: DNA 시퀀서, 비디오 카메라)로부터 데이터를 전송하고자 하는 경우 또는 여러 개의 대상을 원하는 경우 AWS DataSync를 사용할 수 있습니다. 또한 DataSync는 데이터 전송을 자동화 및 간소화합니다. 이를 위해 기본 제공 재시도 및 네트워크 복원력 메커니즘, 데이터 무결성 검증, 특정 요구를 충족하는 유연한 구성(예: 대역폭 조절 등)과 같은 추가적인 기능을 제공합니다.
언제 AWS DataSync를 사용하고 언제 AWS Transfer Family를 사용해야 하나요?
현재 SFTP를 동시에 사용하여 다른 사용자와 데이터를 교환하는 경우 AWS Transfer Family를 활용하면 운영 부담을 줄이면서 Amazon S3에서 직접 SFTP, FTPS, FTP 및 AS2를 통한 완전관리형 송수신을 수행할 수 있습니다.
NFS 서버, SMB 파일 공유, Hadoop 클러스터, 자체 관리형 또는 클라우드 객체 스토리지, Amazon S3, Amazon EFS 및 Amazon FSx 간에 데이터 전송을 가속화 및 자동화하려는 경우 AWS DataSync를 사용할 수 있습니다. DataSync는 활성 데이터 세트에 대한 온라인 마이그레이션, 지속적으로 생성되는 데이터에 대한 적시 전송 또는 비즈니스 연속성을 위한 복제가 필요한 고객에게 이상적입니다.