Allgemeines

AWS DataSync ist ein Online-Service zur Datenverschiebung und -erkennung, der die Datenmigration zu AWS sowie die Verschiebung von Daten von und zum On-Premises-Speicher, Edge-Standorten, anderen Cloud-Anbietern und AWS-Speicherservices vereinfacht und beschleunigt.

AWS DataSync Discovery hilft Ihnen, die Migrationsplanung zu vereinfachen und Ihre Datenmigration zu AWS zu beschleunigen, indem es Ihnen Einblick in die Leistung und Auslastung Ihres On-Premises-Speichers gibt und Empfehlungen für die Migration Ihrer Daten zu AWS-Speicherservices bereitstellt. DataSync Discovery ermöglicht es Ihnen, Ihre On-Premises-Speicherleistung und Kapazitätsnutzung durch automatisierte Datenerfassung und -analyse besser zu verstehen. So können Sie die zu migrierenden Daten schnell identifizieren und die generierten Empfehlungen nutzen, um AWS-Speicherservices auszuwählen, die Ihren Leistungs- und Kapazitätsanforderungen entsprechen.

Für Online-Datenübertragungen vereinfacht, automatisiert und beschleunigt AWS DataSync das Kopieren großer Datenmengen zu und von On-Premises-Speichern, Edge-Standorten, anderen Cloud-Anbietern und AWS-Speicher-Services. DataSync kann Daten von und zu NFS-Freigaben (Network File System), SMB-Freigaben (Server Message Block), Hadoop Distributed File Systems (HDFS), selbstverwalteten Objektspeichern, Objektspeichern in anderen Clouds wie Google Cloud Storage und Wasabi Cloud Storage (siehe vollständige Liste der unterstützten Clouds), Azure Files, Azure Blob Storage (einschließlich Azure Data Lake Storage Gen2), Amazon S3-kompatiblen Speichern auf Snow, Amazon Simple Storage Service (Amazon S3), Amazon Elastic File System (Amazon EFS), Amazon FSx für Windows File Server-Dateisysteme, Amazon FSx für Lustre-Dateisysteme, Amazon FSx für OpenZFS-Dateisysteme und Amazon FSx für NetApp ONTAP-Dateisysteme.

AWS DataSync ermöglicht es Ihnen, Ihre Daten zu erkunden und zu verschieben, sicher und schnell. Mit DataSync Discovery können Sie die Auslastung Ihres lokalen Speichers besser verstehen und erhalten Empfehlungen für Ihre Kostenschätzungen und Pläne für die Migration zu AWS. Zur Datenbewegung können Sie DataSync verwenden, um große Datasets mit Millionen von Dateien zu kopieren, ohne benutzerdefinierte Lösungen mit Open Source-Tools erstellen oder teure kommerzielle Netzwerkbeschleunigungssoftware lizenzieren und verwalten zu müssen. Sie können DataSync verwenden, um aktive Daten zu AWS zu migrieren, Daten zu archivieren, um On-Premises Speicherkapazität freizugeben, Daten zur Geschäftskontinuität zu AWS zu replizieren oder Daten zur Analyse und Verarbeitung in die Cloud zu übertragen.

AWS DataSync reduziert die Komplexität und die Kosten der Online-Datenübertragung, indem es die Übertragung von Datensätzen von und zu On-Premises-Speichersystemen, Edge-Standorten anderen Cloud-Anbietern und AWS Storage Services vereinfacht. DataSync verbindet sich mit bestehenden Speichersystemen und Datenquellen über Standard-Speicherprotokolle (NFS, SMB), als HDFS-Client mit der Amazon-S3-API oder mit anderen Cloud-Speicher-APIs. Es verwendet ein speziell entwickeltes Netzwerkprotokoll und eine Scale-Out-Architektur, um die Datenübertragung zwischen Speichersystemen und AWS-Services zu beschleunigen. DataSync verarbeitet das Verschieben von Dateien und Objekten, plant die Datenübertragung, überwacht den Übertragungsfortschritt, verschlüsselt die Datenübertragung, überprüft sie und benachrichtigt Sie bei Problemen.

AWS DataSync reduziert die Komplexität und die Kosten der Online-Datenübertragung, indem es die Übertragung von Datensätzen von und zu On-Premises-Speichersystemen, Edge-Standorten anderen Cloud-Anbietern und AWS Storage Services vereinfacht. DataSync verbindet sich mit bestehenden Speichersystemen und Datenquellen über Standard-Speicherprotokolle (NFS, SMB), als HDFS-Client mit der Amazon-S3-API oder mit anderen Cloud-Speicher-APIs. Es verwendet ein speziell entwickeltes Netzwerkprotokoll und eine Scale-Out-Architektur, um die Datenübertragung zwischen Speichersystemen und AWS-Services zu beschleunigen. DataSync verarbeitet das Verschieben von Dateien und Objekten, plant die Datenübertragung, überwacht den Übertragungsfortschritt, verschlüsselt die Datenübertragung, überprüft sie und benachrichtigt Sie bei Problemen.

Erkennung

AWS DataSync Discovery unterstützt derzeit NetApp Arrays der Serien FAS und AFF mit ONTAP 9.7 oder höher. Die Unterstützung für weitere Speichersysteme wird im Laufe der Zeit hinzugefügt werden.

AWS DataSync Discovery verwendet Ihre Speicherverwaltungs-API-Schnittstelle, um Informationen über Ihr Speichersystem sowie Leistungs- und Nutzungsmetriken zu sammeln. Zu den Systeminformationen gehören Attribute wie die Gesamtspeicherkapazität, die Volume-Konfiguration, Export-/Freigabenamen und mehr. Zu den Metriken des Speichersystems gehören Leistung wie Volume-Durchsatz und IOPS sowie Nutzungsmetriken wie zugewiesene und genutzte Kapazität. DataSync Discovery verwendet die gesammelten Systeminformationen und Metriken, um Empfehlungen für die Migration zu AWS Storage zu erstellen.

AWS DataSync Discovery analysiert die von Ihrem lokalen Speichersystem gesammelten Daten und gleicht sie mit den Features, der Kapazität und den Leistungsmöglichkeiten der AWS-Speicherservices ab. DataSync Discovery wird Ihnen gegebenenfalls einen oder mehrere AWS-Speicherservices empfehlen.

Es gibt keine spürbaren Auswirkungen auf Benutzer und Anwendungen, wenn AWS DataSync Discovery mit Ihren lokalen Speichersystemen verwendet wird.

Die gesammelten Daten werden vom DataSync-Service gespeichert und verwaltet. Die Daten können in der AWS-DataSync-Konsole eingesehen oder über die AWS CLI oder das AWS Software Development Kit (SDK) abgerufen werden.

Die gesammelten Daten und Empfehlungen werden 60 Tage lang nach Beendigung eines Discovery-Auftrags aufbewahrt.

Datenübermittlung

DataSync unterstützt die folgenden Speicherorttypen: NFS-Freigaben (Network File System), SMB-Freigaben (Server Message Block), Hadoop Distributed File Systems (HDFS), selbstverwalteter Objektspeicher, Objektspeicher in anderen Clouds wie Google Cloud Storage und Wasabi Cloud Storage (siehe vollständige Liste der unterstützten Clouds), Azure Files, Azure Blob Storage (einschließlich Azure Data Lake Storage Gen2 ), Amazon S3-kompatibler Speicher auf Snow, Amazon Simple Storage Service (Amazon S3), Amazon Elastic File System (Amazon EFS)-Dateisystemen, Amazon FSx für Windows File Server-Dateisystemen, Amazon FSx für Lustre-Dateisystemen, Amazon FSx für OpenZFS-Dateisystemen und Amazon FSx für NetApp ONTAP-Dateisystemen.

Sie können AWS DataSync verwenden, um Daten, die sich On-Premises, am Edge oder in anderen Clouds befinden, zu Amazon S3, Amazon EFS, Amazon FSx für Windows File Server, Amazon FSx für Lustre, Amazon FSx für OpenZFS und Amazon FSx für NetApp ONTAP zu migrieren. Konfigurieren Sie DataSync so, dass eine erste Kopie Ihres gesamten Datensatzes erstellt wird, und planen Sie nachfolgende inkrementelle Übertragungen von sich ändernden Daten bis zum endgültigen Übergang von On-Premises zu AWS. DataSync enthält Verschlüsselung und Integritätsprüfung, um sicherzustellen, dass Ihre Daten sicher, intakt und einsatzbereit ankommen. Um die Auswirkungen auf Workloads zu minimieren, die von Ihrer Netzwerkverbindung abhängen, können Sie die Migration so planen, dass sie außerhalb der Geschäftszeiten ausgeführt wird, oder die von DataSync verwendete Netzwerkbandbreite durch Konfigurieren der integrierten Bandbreitendrosselung begrenzen. DataSync bewahrt Metadaten zwischen Speichersystemen, die ähnliche Metadatenstrukturen aufweisen, und ermöglicht so einen reibungslosen Übergang von Endbenutzern und Anwendungen zur Nutzung Ihres AWS-Zielspeicherservices.

Lesen Sie den Speicherblog „Migration von Speicher mit AWS DataSync“, um mehr über die bewährten Methoden und Tipps zur Migration zu erfahren.

Mit AWS DataSync können Sie kalte Daten von On-Premise-Speichersystemen direkt in einen dauerhaften und sicheren Langzeitspeicher wie Amazon S3 Glacier Flexible Retrieval (ehemals S3 Glacier) oder Amazon S3 Glacier Deep Archive verschieben. Verwenden Sie die Ausschlussfilter von DataSync, um das Kopieren temporärer Dateien und Ordner auszuschließen, oder verwenden Sie Einschlussfilter oder Manifeste, um nur eine Teilmenge der Dateien von Ihrem Quellspeicherort zu kopieren. Sie können den kostengünstigsten Speicherservice für Ihre Anforderungen auswählen: Übertragen Sie Daten an eine beliebige S3-Speicherklasse oder verwenden Sie DataSync mit EFS Lifecycle Management, um Daten in der Amazon EFS Infrequent Access Storage Class (EFS IA) zu speichern. Verwenden Sie die integrierte Aufgabenplanungsfunktion, um regelmäßig Daten zu archivieren, die zu Compliance- oder Prüfungszwecken aufbewahrt werden sollen, z. B. Protokolle, Rohmaterial oder elektronische Patientenakten. 

Mit AWS DataSync können Sie Dateien regelmäßig in beliebige Amazon-S3-Speicherklassen replizieren oder die Daten an Amazon EFS, Amazon FSx für Windows File Server, Amazon FSx für Lustre oder Amazon FSx für OpenZFS oder amazon FSx für NetApp ONTAP für ein Standby-Dateisystem senden. Benutzen Sie die integrierte Funktion zur Aufgabenplanung, um sicherzustellen, dass Änderungen an Ihrem Datensatz regelmäßig in Ihren Zielspeicher kopiert werden. In diesem AWS-Speicherblog erfahren Sie mehr über den Datenschutz mithilfe von AWS DataSync.

Sie können AWS DataSync für laufende Übertragungen von On-Premise-Systemen in oder aus AWS zur Verarbeitung verwenden. DataSync kann dazu beitragen, Ihre kritischen hybriden Cloud-Speicher-Workflows in Branchen zu beschleunigen, die aktive Dateien schnell in AWS verschieben müssen. Dazu gehören Machine Learning in den Biowissenschaften, Videoproduktion in Medien und Unterhaltung, Big Data Analytik in Finanzdienstleistungen und seismische Forschung in Öl und Gas. DataSync bietet eine zeitnahe Lieferung, um sicherzustellen, dass abhängige Prozesse nicht verzögert werden. Sie können Ein- und Ausschlussfilter oderManifeste angeben, um festzulegen, welche Dateien oder Objekte bei jeder Ausführung Ihrer Aufgabe übertragen werden sollen.

Ja. Mit AWS DataSync können Sie Daten aus Google-Cloud-Speicher mithilfe der Amazon-S3-API, aus Azure-Dateien mithilfe des SMB-Protokolls oder aus Azure-Blob-Speicher einschließlich Azure-Data-Lake-Speicher der 2. Generation kopieren. Sie können auch Daten aus anderen Cloud-Speichern wie Wasabi Cloud Storage, Oracle Cloud Storage, Cloudflare R2 Storage, DigitalOcean Umgebungen und Backblaze B2 Cloud Storage (siehe vollständige Liste der unterstützten Clouds) verschieben. Stellen Sie einfach den DataSync-Agenten in Ihrer Cloud-Umgebung oder in Amazon EC2 bereit, erstellen Sie den Quell- und Zielspeicherort und starten Sie dann Ihre Aufgabe, um mit dem Kopieren der Daten zu beginnen. Weitere Informationen über AWS-Lösungen für Hybrid- und Multi-Cloud-Umgebungen.

Ja. Mit AWS DataSync können Sie ganz einfach Ihren Data Lake entwickeln, indem Sie die Übertragung von On-Premises-Datensätzen oder Daten in anderen Clouds zu Amazon S3 automatisieren. DataSync ermöglicht eine einfache und schnelle Übertragung Ihres gesamten Datensatzes mit Hilfe von Standard-Speicherprotokollen (NFS, SMB) als HDFS-Client mit der Amazon-S3-API oder mit anderen Cloud-Speicher-APIs. Nach der Übertragung Ihres ersten Datensatzes können Sie nachfolgende Übertragungen neuer Daten an AWS planen. DataSync bietet Verschlüsselung und Integritätsprüfung, um sicherzustellen, dass Ihre Daten sicher und unversehrt ankommen und sofort verwendet werden können. Um die Auswirkungen auf Workloads zu minimieren, die von Ihrer Netzwerkverbindung abhängen, können Sie die Übertragungsaufgabe so planen, dass sie außerhalb der Geschäftszeiten ausgeführt wird, oder die von DataSync verwendete Netzwerkbandbreite durch Konfigurieren der integrierten Bandbreitendrosselung begrenzen. Wenn Ihre Daten in Amazon S3 landen, können Sie native AWS-Services verwenden, um Big-Data-Analysen, KI-, ML-, HPC- und Mediendatenverarbeitungsanwendungen auszuführen und um Erkenntnisse aus Ihren unstrukturierten Daten zu gewinnen. Lesen Sie die Webseite zur AWS-Data-Lake-Speicher, um mehr über den Aufbau und die Nutzung Ihres Datenspeichers zu erfahren.

Sie können DataSync verwenden, um Dateien oder Objekte zwischen Amazon S3, Amazon EFS, Amazon FSx für Windows File Server, Amazon FSx für Lustre, Amazon FSx für OpenZFS oder Amazon FSx für NetApp ONTAP innerhalb desselben AWS-Kontos zu übertragen. Sie können Daten zwischen AWS-Services in derselben AWS-Region, zwischen Services in verschiedenen kommerziellen AWS-Regionen (mit Ausnahme von China) oder zwischen AWS-GovCloud-Regionen (US-Ost und US-West) übertragen. Dies erfordert nicht die Bereitstellung eines DataSync-Agenten und kann über die AWS DataSync-Konsole, die AWS Befehlszeilenschnittstelle (CLI) oder das AWS Software Development Kit (SDK) konfiguriert werden.

Ja. AWS DataSync beschleunigt einen für den Amazon WorkDocs Migration Service erforderlichen Schritt, indem es den Datei-Upload in den Amazon S3-Bucket, der für die Migration verwendet wird, automatisiert. DataSync macht es einfacher und schneller, Startverzeichnisse und Abteilungs-Shares zu WorkDocs zu migrieren. Weitere Informationen zur Verwendung von DataSync für Migrationen zu WorkDocs finden Sie im Blog Migrating network file shares to Amazon WorkDocs using AWS DataSync.

Nutzung

Beginnen Sie mit der Bereitstellung eines AWS DataSync-Agenten in Ihrer On-Premises-VM-Umgebung. Konfigurieren Sie DataSync Discovery über die DataSync-Konsole, die Befehlszeilenschnittstelle oder das SDK, um eine Verbindung zu Ihrem lokalen Speicher herzustellen und Discovery-Aufträge auszuführen, um Daten über Ihr Speichersystem sowie Leistungs-, Kapazitäts- und Auslastungskennzahlen zu sammeln. Während Ihre Discovery-Aufträge laufen, können Sie Informationen über Ihre Speichersysteme über Dashboards in der DataSync-Konsole abrufen. Wenn ein Erkennungsauftrag abgeschlossen ist, werden die gesammelten Daten analysiert, um Empfehlungen für die Migration zu AWS-Speicherservices wie Amazon EFS, Amazon FSx und Amazon S3 zu erstellen. Diese Empfehlungen können Ihnen bei der Auswahl von AWS-Storage-Services helfen und Sie können AWS DataSync verwenden, um Ihre Daten zu verschieben.

Mit AWS DataSync können Sie Daten mit nur wenigen Klicks in der AWS-Managementkonsole oder über die AWS Command Line (CLI) (Befehlszeilenschnittstelle) übertragen. Führen Sie die folgenden 3 Schritte aus, um loszulegen:

1. Um Daten zwischen On-Premises-, Edge- oder anderen Cloud-Speichersystemen und AWS-Speicher-Services zu übertragen, stellen Sie einen Agentenbereit – Stellen Sie einen DataSync-Agenten bereit und verknüpfen Sie ihn über die Mangementkonsole oder API mit Ihrem AWS-Konto. Der Agent wird verwendet, um auf Ihren NFS-Server, Ihre SMB-Dateifreigabe, Ihren Hadoop-Cluster oder Ihren selbstverwalteten oder Cloud-Objektspeicher zuzugreifen, um Daten von dort zu lesen oder in ihn zu schreiben. Die Bereitstellung eines Agenten ist nicht erforderlich, um Daten zwischen AWS-Storage-Services innerhalb desselben AWS-Kontos zu übertragen.

2. Eine Datenübertragungsaufgabe erstellen – Erstellen Sie eine Aufgabe, indem Sie den Speicherort der Datenquelle und des Ziels sowie alle Optionen angeben, die Sie zur Konfiguration der Übertragung verwenden möchten, z. B. die Planung der Aufgabe und die Aktivierung von Aufgabenberichten.

3. Die Übertragung starten – Starten Sie die Aufgabe, überwachen Sie die Datenbewegung in der Konsole oder mit Amazon CloudWatch und überprüfen Sie die Übertragungsaufgaben mithilfe von Aufgabenberichten.

Sie stellen einen AWS-DataSync-Agenten auf Ihrem On-Premises-Hypervisor, in Ihrer öffentlichen Cloud-Umgebung oder in Amazon EC2 bereit. Um Daten auf oder von einem On-Premises-Dateiserver oder Amazon S3-kompatiblen Speicher auf Snow zu kopieren, laden Sie das Image der virtuellen Maschine des Agenten von der AWS-Konsole herunter und stellen es auf Ihrem On-Premises-VMware-ESXi, Linux Kernel-based Virtual Machine (KVM) oder Microsoft Hyper-V Hypervisor bereit. Der Agent muss so bereitgestellt werden, dass er mit dem NFS- oder SMB-Protokoll auf Ihren Dateiserver zugreifen kann, auf NameNodes und DataNodes in Ihrem Hadoop-Cluster zugreifen kann oder mit der Amazon S3-API auf Ihren selbstverwalteten Objektspeicher zugreifen kann. Um Transfers zwischen Ihren S3 auf AWS-Outposts-Buckets und S3-Buckets in AWS Regionen einzurichten, stellen Sie den Agenten auf Ihrem Outpost bereit.

Wenn Sie Daten zwischen Ihrer öffentlichen Cloud-Umgebung und AWS-Speicher kopieren, können Sie den DataSync-Agenten entweder in Ihrer Cloud-Umgebung oder auf Amazon EC2 bereitstellen. Da AWS DataSync Daten während der Übertragung zwischen dem AWS-DataSync-Agenten und den AWS-Speicherservices komprimiert, können Sie möglicherweise die Gebühren für ausgehenden Datenverkehr reduzieren, indem Sie den AWS-DataSync-Agenten in Ihrer öffentlichen Cloud-Umgebung einsetzen.  

Die Bereitstellung eines Agenten ist nicht erforderlich, um Daten zwischen AWS-Storage-Services innerhalb desselben AWS-Kontos zu übertragen. Um Daten zu oder von einem selbstverwalteten In-Cloud-Dateiserver oder zwischen AWS Storage-Services in verschiedenen AWS-Konten zu kopieren, starten Sie eine Amazon EC2-Instance mit einem DataSync-Agenten AMI.

Die zum Ausführen des Agenten mindestens erforderlichen Ressourcen finden Sie hier.

AWS DataSync kopiert Daten, wenn Sie eine entsprechende Aufgabe über die AWS-Managementkonsole oder die AWS-Befehlszeilenschnittstelle (CLI) initiieren. Jedes Mal, wenn eine Aufgabe ausgeführt wird, scannt sie Quelle und Ziel nach Änderungen und führt eine Kopie aller Daten und Metadaten-Unterschiede zwischen Quelle und Ziel aus. Sie können konfigurieren, welche Eigenschaften der Quelle verwendet werden, um zu bestimmen, welche Änderungen vorgenommen wurden, Ein- und Ausschlussfilter oder Manifeste definieren, um spezifische Dateien oder Objektdaten übertragen, und steuern, ob Dateien oder Objekte im Ziel überschrieben werden sollen, wenn sie in der Quelle geändert oder gelöscht werden, wenn sie in der nicht gefunden werden Quelle.

Für Aufgaben im Basismodus gelten Quoten für die Anzahl der Dateien und Objekte in einem Datensatz. Im Basismodus werden Dateien und Objekte in einem Datensatz nacheinander vorbereitet, übertragen und überprüft, wodurch er bei den meisten Workloads langsamer ist als der erweiterte Modus. Im erweiterten Modus können Sie Datensätze mit einer praktisch unbegrenzten Anzahl von Objekten mit einer höheren Leistung als im Basismodus übertragen. Aufgaben im erweiterten Modus optimieren und rationalisieren den Datentransferprozess, indem Daten parallel aufgelistet, vorbereitet, übertragen und überprüft werden. Außerdem erhalten Sie erweiterte Metrik- und Berichtsfunktionen, die die Nachverfolgung und Verwaltung großer Datenübertragungen erleichtern. Der erweiterte Modus ist derzeit für Übertragungen zwischen Amazon S3-Standorten verfügbar. Der Basismodus unterstützt alle derzeit verfügbaren DataSync-Standorttypen. In der DataSync-Dokumentation finden Sie eine detaillierte Liste der Unterschiede zwischen den Aufgabenmodi. Auf der DataSync-Preisseite finden Sie Informationen zu den Preisunterschieden zwischen den Aufgabenmodi.

Da AWS DataSync Daten überträgt und speichert, führt es Integritätsprüfungen durch, um sicherzustellen, dass die an das Ziel geschriebenen Daten mit den aus der Quelle gelesenen Daten übereinstimmen. Zusätzlich kann eine optionale Überprüfung durchgeführt werden, um Quelle und Ziel am Ende der Übertragung zu vergleichen. DataSync berechnet und vergleicht die vollständigen Prüfsummen der in der Quelle und im Ziel gespeicherten Daten. Sie können entweder den gesamten Datensatz oder nur die Dateien oder Objekte überprüfen, die DataSync übertragen hat.

Sie können Aufgabenberichte verwenden, um Ihre Datenübertragungsprozesse zu überprüfen, indem Sie die Übertragungsvorgänge bei allen Ihren Aufgabenausführungen verifizieren. Mithilfe von Aufgabenberichten erhalten Sie einen zusammenfassenden Bericht sowie detaillierte Berichte über alle übertragenen, übersprungenen, überprüften und gelöschten Dateien für jede Aufgabenausführung. Aufgabenberichte geben Ihnen die Gesamtzahl der übertragenen Dateien und Bytes an und enthalten ggf. Dateiattribute wie Größe, Pfad, Zeitstempel, Dateiprüfsummen und Objektversions-IDs. Sie können auch AWS Glue, Amazon Athena und Amazon QuickSight nutzen, um Aufgabenberichte automatisch zu katalogisieren, abzufragen und zu visualisieren, um wichtige Einblicke in Ihre Datenübertragungsprozesse zu gewinnen.

Sie können die AWS-Managementkonsole oder die CLI verwenden, um den Status und Fortschritt der übertragenen Daten zu überwachen. Mit Amazon CloudWatch Metrics können Sie die Anzahl der Dateien und die Menge der kopierten Daten anzeigen. Sie können auch die Protokollierung der einzelnen Dateien in CloudWatch Logs aktivieren, um zu erkennen, was zu einem bestimmten Zeitpunkt übertragen wurde, sowie die Ergebnisse der von DataSync durchgeführten Inhaltsintegritätsprüfung.

Zusammen vereinfachen diese Lösungen die Prüfung, Überwachung, Berichterstattung und Problembehebung und ermöglichen es Ihnen, Interessengruppen rechtzeitig auf dem Laufenden zu halten.

Ja. Sie können einen Ein- und Ausschlussfilter angeben, um die Dateien, Ordner und Objekte einzuschränken, die bei jeder Ausführung einer Aufgabe übertragen werden. Alternativ können Sie Manifeste verwenden, um eine Teilmenge von Dateien oder Objekten anzugeben, die von Ihrem Quellspeicherort übertragen werden sollen.

Einschlussfilter geben die Datei- und Ordnerpfade oder Objektschlüssel an, die bei der Ausführung der Aufgabe eingeschlossen werden sollen, und schränken den Umfang dessen ein, was von DataSync an der Quelle und am Ziel gescannt wird. Ausschlussfilter geben die Datei- und Ordnerpfade oder Objektschlüssel an, die vom Kopieren ausgeschlossen werden sollen.  Beim Erstellen oder Aktualisieren einer Aufgabe können Sie sowohl Ausschluss- als auch Einschlussfilter konfigurieren. Wenn Sie eine Aufgabe starten, können Sie die für die Aufgabe konfigurierten Filter außer Kraft setzen und aktualisieren. In diesem AWS-Speicherblog erfahren Sie mehr über die Verwendung allgemeiner Filter mit DataSync.

Ein Manifest ist eine CSV-formatierte Datei, in der die Dateipfade oder Objektschlüssel aufgelistet sind, die bei der Ausführung der Aufgabe berücksichtigt werden sollen, und die den Umfang der Daten einschränkt, die von DataSync an der Quelle und am Ziel gescannt werden. Wenn Sie eine Aufgabe erstellen oder aktualisieren, können Sie eine Manifestdatei mit Millionen von Quelldateien oder -objekten bereitstellen, und DataSync vergleicht und überträgt nur die im Manifest aufgeführten Dateien. Wenn Sie eine Aufgabe starten, können Sie die Manifestdatei überschreiben und aktualisieren. Beim Kopieren von Daten aus Amazon S3 können Sie auch eine optionale S3-Versions-ID für jedes zu übertragende Objekt angeben. Weitere Details finden Sie in diesem Blog.

Beachten Sie, dass Filter und Manifeste nicht zusammen verwendet werden können.

Während ein Manifest eine explizite Liste von Dateien oder Objekten ist, die vom Quellspeicherort übertragen werden sollen, ist ein Einschlussfilter eine Zeichenfolge, die Muster von Dateien und Ordnern angibt, die von der Quelle übertragen werden sollen. Nur Dateien und Ordner, die den Mustern im Filter entsprechen, werden kopiert. Ein Muster kann ein ganzer Datei- oder Ordnerpfad oder ein Präfix sein, das mit einem Platzhalterzeichen (*) endet und angibt, dass alle Dateien oder Objekte, die dem Präfix entsprechen, kopiert werden sollen. Einschlussfilter sind ideal für Kunden, die nur eine kleine Gruppe von Dateien oder Objekten oder einige bestimmte Ordner kopieren möchten. Kunden mit bekannten Datensätzen, z. B. solchen, die im Rahmen eines automatisierten Workflows verschoben wurden, können Manifeste verwenden, um zu vermeiden, dass ihre gesamten Datei- oder Objektspeichersysteme gescannt werden, um Änderungen festzustellen. Mithilfe einer Manifestdatei können Kunden Millionen von Quelldateien oder Objekten angeben, die übertragen werden sollen, und DataSync vergleicht nur die im Manifest aufgeführten Dateien. Kunden können Manifeste auch verwenden, um bestimmte Versionen von Objekten aus ihrem Amazon-S3-Bucket zu kopieren.

Ja. Sie können Ihre Aufgaben mithilfe der AWS DataSync-Konsole oder der AWS Command Line Interface (CLI) planen, ohne Skripts schreiben und ausführen zu müssen, um wiederholte Übertragungen zu verwalten. Die Aufgabenplanung führt Aufgaben automatisch nach dem von Ihnen konfigurierten Zeitplan aus, wobei stündliche, tägliche oder wöchentliche Optionen direkt in der Konsole bereitgestellt werden. Auf diese Weise können Sie sicherstellen, dass Änderungen an Ihrem Dataset automatisch erkannt und in Ihren Zielspeicher kopiert werden.

Ja. Beim Übertragen von Dateien erstellt AWS DataSync auf dem Zielort die gleiche Verzeichnisstruktur wie auf der Struktur des Quellortes.

Wenn eine Aufgabe unterbrochen wird (z. B. wenn die Netzwerkverbindung verloren geht oder der AWS DataSync-Agent neu gestartet wird), werden die fehlenden Dateien bei der nächsten Ausführung der Aufgabe übertragen, und die Daten sind am Ende dieses Laufs vollständig und konsistent. Bei jedem Start einer Aufgabe wird eine inkrementelle Kopie erstellt, sodass nur die Änderungen von der Quelle auf das Ziel übertragen werden.

Sie können AWS DataSync mit Ihrem Direct Connect-Link verwenden, um auf öffentliche Service-Endpunkte oder private VPC-Endpunkte zuzugreifen. Bei der Nutzung von VPC-Endpunkten werden Daten zwischen dem DataSync-Agenten übertragen. AWS-Services durchläuft hierzu nicht das Internet und benötigt keine öffentlichen IP-Adressen, was die Sicherheit der Daten erhöht, da sie über das Netzwerk kopiert werden. DataSync Discovery wird derzeit nur von Endpunkten öffentlicher Dienste unterstützt.

Ja, VPC-Endpunkte werden für Datenübermittlungen unterstützt. Sie können VPC-Endpunkte verwenden, um sicherzustellen, dass Daten, die zwischen Ihrem AWS DataSync-Agenten übertragen werden und entweder On-Premises oder in der Cloud bereitgestellt werden, nicht das öffentliche Internet durchqueren oder öffentliche IP-Adressen benötigen. Die Verwendung von VPC-Endpunkten erhöht die Sicherheit Ihrer Daten, indem der Netzwerkverkehr in Ihrer Amazon Virtual Private Cloud (Amazon VPC) gehalten wird. VPC-Endpunkte für DataSync werden durch AWS PrivateLink ermöglicht, eine hochverfügbare, skalierbare Technologie, mit der Sie Ihre VPC privat mit unterstützten AWS-Services verbinden können.

Um VPC-Endpunkte mit AWS DataSync zu verwenden, erstellen Sie einen VPC-Endpunkt der AWS PrivateLink-Schnittstelle für den DataSync-Service in Ihrer VPC und legen diese Elastic Network-Schnittstelle (ENI) anschließend bei der Einrichtung Ihres DataSync-Agenten fest. Ihr Agent wird mit der zu aktivierenden ENI verbunden und anschließend werden alle vom Agenten übertragenen Daten in Ihrem konfigurierten VPC gespeichert. Sie können entweder die AWS DataSync-Konsole, AWS-Befehlszeilenschnittstelle (CLI) oder AWS SDK verwenden, um VPC-Endpunkte zu konfigurieren. Weitere Informationen finden Sie unter AWS DataSync in einer Virtual Private Cloud verwenden.

Übertragen zu und von AWS Storage

AWS DataSync unterstützt die Übertragung von Daten zu, von, oder zwischen Amazon Simple Storage Service (Amazon S3), Amazon Elastic File System (Amazon EFS), Amazon FSx für Windows File Server, Amazon FSx für Lustre, Amazon FSx für OpenZFS und Amazon FSx für NetApp ONTAP.

Ja. Wenn Sie einen S3-Bucket für die Verwendung mit AWS DataSync konfigurieren, können Sie die S3-Speicherklasse auswählen, die DataSync zum Speichern von Objekten verwendet. DataSync unterstützt das Speichern von Daten direkt in S3 Standard, S3 Intelligent-Tiering, S3 Standard-Infrequent Access (S3 Standard-IA), S3 One Zone-Infrequent Access (S3 One Zone-IA), Amazon S3 Glacier Instant Retrieval, Amazon S3 Glacier Flexible Retrieval und Amazon S3 Glacier Deep Archive (S3 Glacier Deep Archive). Weitere Information zu Amazon-S3-Speicherklassen finden Sie im Entwicklerhandbuch für Amazon Simple Storage Service.

Objekte, die kleiner als die minimale Ladekapazität pro Objekt sind, werden in S3 Standard gespeichert. Beispielsweise werden Ordnerobjekte, die Null Bytes groß sind und nur Metadaten enthalten, im S3 Standard gespeichert. Lesen Sie in unserer Dokumentation mehr über Überlegungen zur Arbeit mit Amazon S3-Speicherklassen und über die Bewertung der S3-Anforderungskosten bei der Verwendung von DataSync. Weitere Informationen zu den Mindestgebühr-Kapazitäten finden Sie unter Amazon S3-Preise.

Ja. Wenn Sie S3 als Quellspeicherort für eine AWS DataSync-Aufgabe verwenden, ruft der Service alle Objekte aus dem Bucket ab, die in das Ziel kopiert werden müssen. Für das Abrufen von Objekten aus dem S3 Standard-IA- und S3 One Zone-IA-Speicher wird eine Abrufgebühr erhoben, die sich nach der Größe der Objekte richtet. Lesen Sie mehr über Fragen zur Arbeit mit Amazon-S3-Speicherklassen in unserer Dokumentation.

Wenn Sie S3 als Quellspeicherort für eine AWS-DataSync-Aufgabe verwenden, versucht der Service, alle Objekte aus dem Bucket abzurufen, die in das Ziel kopiert werden müssen. Für das Abrufen von Objekten, die in der Speicherklasse S3 Glacier Instant Retrieval archiviert sind, fallen je nach Größe der Objekte höhere Abrufgebühren an. Das Abrufen von Objekten, die in der Speicherklasse S3 Glacier Flexible Retrieval oder S3 Glacier Deep Archive archiviert wurden, führt zu einem Fehler. Alle Fehler beim Abrufen archivierter Objekte werden von DataSync protokolliert und führen zu einem fehlerhaften Aufgabenerledigungsstatus. Lesen Sie, welche Überlegungen bei der Arbeit mit Amazon-S3-Speicherklassen und der Bewertung der S3-Anforderungskosten bei der Verwendung von DataSync zu beachten sind, in unserer Dokumentation.

AWS DataSync übernimmt eine von Ihnen angegebene IAM-Rolle. Die Richtlinie, die Sie der Rolle beifügen, bestimmt, welche Aktionen die Rolle ausführen kann. DataSync kann diese Rolle in Ihrem Namen automatisch generieren oder Sie können eine Rolle manuell konfigurieren.

Wenn Dateien oder Ordner in Amazon S3 kopiert werden, wird eine 1:1-Beziehung zwischen einer Datei oder einem Ordner und einem Objekt erstellt. Datei- und Ordner-Zeitstempel und POSIX-Berechtigungen, einschließlich Benutzer-ID, Gruppen-ID und Berechtigungen, werden in S3-Benutzermetadaten gespeichert. Bei NFS-Freigaben sind Dateimetadaten, die in S3-Benutzermetadaten gespeichert sind, vollständig mit File Gateway interoperabel und ermöglichen den dateibasierten On-Premises-Zugriff auf Daten, die in Amazon S3 von AWS DataSync gespeichert worden sind.

Wenn DataSync Objekte, die diese Benutzermetadaten enthalten, zurück auf einen NFS-Server kopiert, werden die Dateimetadaten wiederhergestellt. Symbolische Links und feste Links werden auch beim Zurückkopieren von NFS nach S3 wiederhergestellt.

Beim Kopieren aus einer SMB-Dateifreigabe werden die POSIX-Standardberechtigungen in S3-Benutzermetadaten gespeichert. Beim Zurückkopieren auf eine SMB-Dateifreigabe wird die Eigentümerschaft auf der Grundlage des Benutzers festgelegt, der in DataSync für den Zugriff auf diese Dateifreigabe konfiguriert wurde, und es werden Standardberechtigungen zugewiesen.

Beim Kopieren aus HDFS werden Datei- und Ordnerzeitstempel, Benutzer- und Gruppenbesitz sowie POSIX-Berechtigungen in den S3-Benutzermetadaten gespeichert. Beim Kopieren von Amazon S3 zurück nach HDFS werden die Datei- und Ordner-Metadaten wiederhergestellt.
 

Erfahren Sie in unserer Dokumentation mehr darüber, wie DataSync Dateien und Metadaten speichert.

Beim Übertragen von Objekten zwischen selbstverwaltetem Objektspeicher oder Azure Blob Storage und Amazon S3 kopiert DataSync Objekte zusammen mit Objektmetadaten und Tags.

Bei der Übertragung von Objekten zwischen Amazon S3-Buckets kopiert DataSync die Objekte zusammen mit den Objekt-Metadaten und Tags. DataSync kopiert keine anderen Objektinformationen wie Objekt-ACLs oder frühere Objektversionen.

Einige S3-Speicherklassen haben Verhaltensweisen, die sich auf Ihre Kosten auswirken können, wie z. B. Datenabruf, minimale Speicherkapazitäten und Mindestspeicherdauer. DataSync automatisiert die Verwaltung von Daten, um diese Faktoren zu berücksichtigen, und bietet Einstellungen, um den Datenabruf zu minimieren.

Um eine minimale Kapazitätsgebühr pro Objekt zu vermeiden, speichert AWS DataSync kleine Objekte automatisch in S3 Standard. Um die Gebühren für das Abrufen von Daten zu minimieren, können Sie DataSync so konfigurieren, dass nur Dateien überprüft werden, die von einer bestimmten Aufgabe übertragen wurden. Um Gebühren für die Mindestspeicherdauer zu vermeiden, verfügt DataSync über Steuerelemente zum Überschreiben und Löschen von Objekten. Lesen Sie in unserer Dokumentation mehr über Kostenaspekte bei der Arbeit mit Amazon-S3-Speicherklassen und über die Bewertung der Kosten für S3-Anfragen bei der Verwendung von DataSync.

Ja. Sie können Objekte zwischen Amazon S3 auf AWS Outposts und Amazon S3-Buckets in AWS Regionen kopieren. AWS DataSync kopiert Objekte gemeinsam mit Objekt-Metadaten und Objekt-Tags. Damit DataSync Zugriff auf Amazon S3 auf Outposts-Buckets erhalten kann, stellen Sie in Outpost einen DataSync EC2 Agenten bereit.

Bei der Nutzung von DataSync mit Amazon S3 auf Outposts können Sie Daten in/aus Amazon S3-Buckets nur in AWS Regionen übertragen. Weitere Informationen über unterstützte Quellen und Ziele von und für DataSync-Aufgaben erhalten Sie in der Dokumentation.

AWS DataSync greift über das NFS-Protokoll auf Ihr Amazon EFS-Dateisystem zu. Der DataSync-Service stellt Ihr Dateisystem über vom DataSync-Service verwaltete Elastic Network-Schnittstellen (ENIs) innerhalb Ihrer VPC bereit. Das Erstellen, Verwenden und Löschen dieser EN-Schnittstellen wird in Ihrem Namen vollständig von DataSync verwaltet. Sie können wählen, ob Sie Ihr EFS-Dateisystem über ein Einhängeziel oder einen EFS-Zugriffspunkt einhängen.

Ja. Mit AWS DataSync können Sie Dateien in Amazon EFS kopieren und die Einstellungen für das EFS-Lebenzyklusmanagement so konfigurieren, dass Dateien, auf die über einen festgelegten Zeitraum nicht zugegriffen wurde, in die Speicherklasse für seltenen Zugriff (Infrequent Access, IA) migriert werden.

Sie können sowohl IAM-Identitätsrichtlinien als auch Ressourcenrichtlinien verwenden, um den Client-Zugriff auf Amazon-EFS-Ressourcen auf eine Weise zu steuern, die skalierbar und für Cloud-Umgebungen optimiert ist. Wenn Sie einen DataSync-Speicherort für Ihr EFS-Dateisystem erstellen, können Sie eine IAM-Rolle angeben, die DataSync beim Zugriff auf EFS annehmen soll. Sie können dannEFS-Dateisystemrichtlinien erwenden, um den Zugriff für die IAM-Rolle zu konfigurieren. Da DataSync EFS-Dateisysteme als Root-Benutzer einbindet, muss Ihre IAM-Richtlinie die folgende Aktion erlauben: elasticfilesystem:ClientRootAccess.

Ja. Zusätzlich zu der von Amazon EFS bereitgestellten integrierten Replikation können Sie auch AWS DataSync verwenden, um eine regelmäßige Replikation Ihres Amazon-EFS-Dateisystems auf ein zweites Amazon-EFS-Dateisystem innerhalb desselben AWS-Kontos zu planen. Diese Funktion steht sowohl für die Bereitstellung in derselben Region als auch für die regionsübergreifende Bereitstellung zur Verfügung und erfordert nicht die Verwendung eines DataSync-Agenten.

AWS DataSync kopiert Datei- und Ordner-Zeitstempel und POSIX-Berechtigungen, einschließlich Benutzer-ID, Gruppen-ID und Berechtigungen. Weitere Informationen sowie eine vollständige Liste der kopierten Metadaten finden Sie in unserer Dokumentation.

AWS DataSync kopiert Datei- und Ordner-Zeitstempel und POSIX-Berechtigungen und wendet Standardwerte für Benutzer- und Gruppen-ID an. Weitere Informationen sowie eine vollständige Liste der kopierten Metadaten finden Sie in unserer Dokumentation.

AWS DataSync greift über das SMB-Protokoll auf Ihr Dateisystem von Amazon FSx für Windows File Server zu. Für die Authentifizierung werden dabei die Anmeldedaten verwendet, die Sie zuvor in der AWS-Konsole oder der Befehlszeilenschnittstelle festgelegt haben. Der DataSync-Service stellt Ihr Dateisystem über vom DataSync-Service verwaltete Elastic Network-Schnittstellen (ENIs) innerhalb Ihrer VPC bereit. Das Erstellen, Verwenden und Löschen dieser EN-Schnittstellen wird in Ihrem Namen vollständig von DataSync verwaltet.

Von AWS DataSync werden verschiedene Windows-Metadaten kopiert. Dazu gehören unter anderem Datei-Zeitstempel, Dateibesitzer, Standard-Dateiattribute, Discretionary Access Lists (DACLs) und NTFS-System-Zugriffskontrolllisten (SACLs) für NTFS-Dateisysteme. Weitere Informationen sowie eine vollständige Liste der kopierten Metadaten finden Sie in unserer Dokumentation.

Ja. Sie können AWS DataSync verwenden, um eine periodische Replikation Ihres Amazon FSx for Windows File Server Dateisystems auf ein zweites Dateisystem innerhalb desselben AWS-Kontos zu planen. Diese Funktion steht sowohl für die Bereitstellung in derselben Region als auch für die regionsübergreifende Bereitstellung zur Verfügung und erfordert nicht die Verwendung eines DataSync-Agenten.

Wenn Sie eine DataSync-Aufgabe zum Kopieren in oder aus Ihrem FSx-for-Lustre-Dateisystem erstellen, erstellt der DataSync-Service Elastic Network Interfaces (ENIs) in derselben VPC und demselben Subnetz, in dem sich Ihr Dateisystem befindet.  DataSync verwendet diese ENIs für den Zugriff auf Ihr FSx-for-Lustre-Dateisystem mit dem Lustre-Protokoll als Root-Benutzer.  Wenn Sie eine DataSync-Speicherressource für Ihr FSx-for-Lustre-Dateisystem erstellen, können Sie bis zu fünf Sicherheitsgruppen angeben, die auf die ENIs angewendet werden sollen, und den ausgehenden Zugriff vom DataSync-Service konfigurieren.  Die Sicherheitsgruppen müssen so konfiguriert werden, dass sie den ausgehenden Datenverkehr auf den von FSx für Lustre benötigten Netzwerkports erlauben.  Die Sicherheitsgruppen auf Ihrem FSx-for-Lustre-Dateisystem sollten so konfiguriert werden, dass sie den eingehenden Zugriff von den Sicherheitsgruppen erlauben, die Sie der DataSync-Speicherressource für Ihr FSx for Lustre-Dateisystem zugewiesen haben.

AWS DataSync kopiert Datei- und Ordner-Zeitstempel und POSIX-Berechtigungen, einschließlich Benutzer-ID, Gruppen-ID und Berechtigungen. Weitere Informationen sowie eine vollständige Liste der kopierten Metadaten finden Sie in unserer Dokumentation.

Ja. Sie können AWS DataSync verwenden, um von Ihrem FSx-for-Lustre-Dateisystem auf ein zweites Dateisystem innerhalb desselben AWS-Kontos zu kopieren. Diese Funktion steht sowohl für die Bereitstellung in derselben Region als auch für die regionsübergreifende Bereitstellung zur Verfügung und erfordert nicht die Verwendung eines DataSync-Agenten.

Ja. Sie können AWS DataSync verwenden, um eine regelmäßige Replikation Ihres Amazon-FSx-for-Lustre-Dateisystems auf ein zweites Dateisystem innerhalb desselben AWS-Kontos zu planen. Diese Funktion steht sowohl für die Bereitstellung in derselben Region als auch für die regionsübergreifende Bereitstellung zur Verfügung und erfordert nicht die Verwendung eines DataSync-Agenten.

Nein. Die Dateien werden mit dem Dateilayout und der Striping-Konfiguration auf dem Zieldateisystem verwendet.

Wenn Sie eine DataSync-Aufgabe zum Kopieren in oder aus Ihrem FSx-for-OpenZFS-Dateisystem erstellen, erstellt der DataSync-Service Elastic-Network-Schnittstellen (ENIs) in derselben VPC und demselben Subnetz, in dem sich Ihr Dateisystem befindet.  DataSync verwendet diese ENIs für den Zugriff auf Ihr FSx-for-OpenZFS-Dateisystem mit dem OpenZFS-Protokoll als Root-Benutzer.  Wenn Sie eine DataSync-Speicherressource für Ihr FSx-for-OpenZFS-Dateisystem erstellen, können Sie bis zu fünf Sicherheitsgruppen, die auf die ENIs angewendet werden sollen, angeben, und den ausgehenden Zugriff vom DataSync-Service konfigurieren.  Die Sicherheitsgruppen müssen so konfiguriert werden, dass sie den ausgehenden Datenverkehr auf den von FSx für OpenZFS benötigten Netzwerkports erlauben. Die Sicherheitsgruppen auf Ihrem FSx-for-OpenZFS-Dateisystem sollten so konfiguriert werden, dass sie den eingehenden Zugriff von jenen Sicherheitsgruppen erlauben, die Sie der DataSync-Speicherressource für Ihr FSx-for-OpenZFS-Dateisystem zugewiesen haben.

AWS DataSync kopiert Datei- und Ordner-Zeitstempel und POSIX-Berechtigungen, einschließlich Benutzer-ID, Gruppen-ID und Berechtigungen. Weitere Informationen sowie eine vollständige Liste der kopierten Metadaten finden Sie in unserer Dokumentation.

Ja. Sie können AWS DataSync verwenden, um von Ihrem FSx-for-OpenZFS-Dateisystem auf ein zweites Dateisystem innerhalb desselben AWS-Kontos zu kopieren. Diese Funktion steht sowohl für die Bereitstellung in derselben Region als auch für die regionsübergreifende Bereitstellung zur Verfügung und erfordert nicht die Verwendung eines DataSync-Agenten.

Ja. Sie können AWS DataSync verwenden, um die regelmäßige Replikation Ihres Amazon-FSx-for-OpenZFS-Dateisystems auf ein zweites Dateisystem innerhalb desselben AWS-Kontos zu planen. Diese Funktion steht sowohl für die Bereitstellung in derselben Region als auch für die regionsübergreifende Bereitstellung zur Verfügung und erfordert nicht die Verwendung eines DataSync-Agenten.

Wenn Sie eine Aufgabe erstellen, erstellt DataSync Elastic-Network- Schnittstellen (ENIs) im bevorzugten Subnetz der gleichen VPC, in dem sich Ihr Amazon-FSx-für-NetApp-ONTAP-Dateisystem befindet.. Das bevorzugte Subnetz wird konfiguriert, wenn Sie Ihr FSx-für-ONTAP-Dateisystem erstellen. Außerdem verwendet DataSync die von ihr erstellten ENIs in diesem Subnetz, um auf Ihr FSx-für-ONTAP-Dateisystem zuzugreifen. Wenn Sie eine DataSync-Speicherressource für Ihr FSx-für-ONTAP-Dateisystem erstellen, können Sie bis zu fünf Sicherheitsgruppen, die auf die ENIs angewendet werden sollen, angeben, um den ausgehenden Zugriff vom DataSync-Service konfigurieren. Sie sollten Sicherheitsgruppen auf Ihrem FSx-für-ONTAP-Dateisystem so konfigurieren, dass sie den eingehenden Zugriff von jenen Sicherheitsgruppen erlauben, die Sie der DataSync-Speicherressource für Ihr FSx-für-ONTAP-Dateisystem zugewiesen haben.

AWS DataSync unterstützt die Verwendung von NFSv3, SMB 2.1 und SMB 3. DataSync unterstützt aktuell die Verwendung von NFSv4 oder höher mit FSx für ONTAP nicht.

Ja. AWS DataSync kopiert Datei- und Ordner-Zeitstempel und POSIX-Berechtigungen, einschließlich Benutzer-ID, Gruppen-ID und Berechtigungen bei der Nutzung des NFS-Protokolls. Bei der Nutzung des SMB-Protokolls kopiert DataSync die Zeitstempel der Dateien und der Ordner, Inhaberschaft und ACLs. Weitere Informationen sowie eine vollständige Liste der kopierten Metadaten finden Sie in unserer Dokumentation.

Verwenden Sie bei der Migration von Windows-Servern oder NAS-Freigaben, die den Benutzern beim SMB-Protokoll helfen, einen DataSync-SMB-Quellort und das SMB-Protokoll für Ihren FSx-für-ONTAP-Standort. Dadurch wird sichergestellt, dass der Sicherheitsstil für Ihr FSx-für-ONTAP-Volume für NTFS konfiguriert ist. Verwenden Sie bei der Migration aus Unix- oder Linux-Servern oder NAS-Freigaben, die die den Benutzern beim NFS-Protokoll helfen, einen DataSync-NFS-Quellort und das NFS-Protokoll für Ihren FSx-für-ONTAP-Standort. Dadurch sichergestellt, dass der Sicherheitsstil für Ihr FSx-für-ONTAP-Volume für Unix konfiguriert ist. Für die Migration von mehreren Protokollen sollten Sie die bewährten Methoden nochmals durchlesen, die im Blog Aktivierung von Workloads von mehreren Protokollen mit Amazon FSx für NetApp ONTAP behandelt werden. Verwenden Sie außerdem das SMB-Protokoll, um die Dateisystem-Metadaten mit der höchsten Genauigkeit zu speichern. Weitere Informationen zur Konfiguration der Sicherheitsstile für Ihre FSx-für-ONTAP-Volumen finden Sie in der Dokumentation zur Verwaltung von FSx-für-ONTAP-Volumen.

Ja. Jedoch muss ein separater DataSync-Ort und Aufgaben-Ressource für jedes Protokoll erstellt werden (NFS oder SMB). Um Probleme von überschriebenen Daten und Datenverifizierung zu vermeiden, wird die Verwendung von mehreren DataSync-Aufgaben zum gleichzeitigen Kopieren des gleichen Volumenpfads nicht empfohlen (egal, ob das gleiche Protokoll oder verschiedene Protokolle verwendet werden).

Nein. DataSync unterstützt nur das Kopieren von Datendateien zu oder aus FSx für ONTAP-Volumen mit NFS oder SMB-Protokollen.

Ja. Sie können AWS DataSync verwenden, um von Ihrem FSx-für-ONTAP-Dateisystem auf ein zweites Dateisystem innerhalb desselben AWS-Kontos zu kopieren. Diese Funktion steht sowohl für die Bereitstellung in derselben Region als auch für die regionsübergreifende Bereitstellung zur Verfügung und erfordert nicht die Verwendung eines DataSync-Agenten.

Obwohl DataSync zum Replizieren von Daten zwischen Dateisystemen verwendet werden kann, empfehlen wir die Verwendung von NetApp SnapMirror, um zwischen Ihren FSx-für-ONTAP-Dateisystemen zu replizieren. Mit SnapMirror können Sie niedrige RPOs erzielen, unabhängig von der Anzahl oder Größe der Dateien in Ihrem Dateisystem.

DataSync schließt automatisch Ordner mit der Bezeichnung „.snapshot“ aus. Es ist auch möglich, Filter auszuschließen, um das Kopieren von Dateien und Ordnern zu vermeiden, die mit den von Ihnen angegebenen Mustern übereinstimmen.

Wechsel zu und von Geräten der AWS Snow Family

Stellen Sie zunächst einen DataSync-Agenten in Ihrer On-Premises-Umgebung bereit. Aktivieren Sie den Agenten mithilfe der AWS-Managementkonsole oder CLI und richten Sie Ihre DataSync-Aufgabe ein, um Daten zwischen einem Bucket auf Ihrem Amazon-S3-kompatiblen Speicher und Amazon S3, Amazon EFS oder einem beliebigen Amazon-FSx-Dateisystem zu verschieben.

Leistung

Die Geschwindigkeit, mit der AWS DataSync einen vorhandenen Datensatz kopieren kann, ist eine Funktion aus der Datenmenge, der E/A-Bandbreite, die auf den Quell- und Zielspeichern unterstützt wird, der verfügbaren Netzwerkbandbreite sowie den Netzwerkbedingungen. Für den Datentransfer zwischen On-Premises und AWS-Speicher-Services kann eine einzige DataSync-Aufgabe eine 10-Gbit/s-Netzwerkverbindung voll ausnutzen.

Ja. Sie können die Menge der Netzwerkbandbreite steuern, die von AWS DataSync beansprucht wird. Konfigurieren Sie dazu die integrierte Bandbreitendrosselung. Sie können dieses Limit erhöhen oder verringern, während Ihre Datenübertragungsaufgabe läuft. Damit können Sie die Auswirkungen auf andere Benutzer oder Anwendungen minimieren, die von der gleichen Netzwerkverbindung abhängig sind.

AWS DataSync generiert Amazon CloudWatch-Metriken, um eine detaillierte Übersicht über den Übertragungsprozess zu erhalten. Mithilfe dieser Metriken können Sie die Anzahl der Dateien und die Menge der kopierten Daten sowie den Fortschritt der Dateierkennung und -überprüfung anzeigen. Sie können CloudWatch-Diagramme mit diesen Metriken direkt in der DataSync-Konsole anzeigen.

Abhängig von der Kapazität Ihres On-Premises-Dateispeichers sowie der Menge und der Größe der zu übertragenden Dateien kann sich AWS DataSync auf die Reaktionszeit anderer Clients auswirken, wenn diese auf den gleichen Quelldatenspeicher zugreifen, da der Agent Daten auf diesem Speichersystem liest und überschreibt. Wenn Sie eine Bandbreitenbegrenzung für eine Aufgabe konfigurieren, können Sie diese Auswirkung durch die E/A-Begrenzung auf Ihrem Speichersystem reduzieren.

Sicherheit und Compliance

AWS DataSync Discovery verwendet den DataSync-Agenten für den Zugriff auf die Management-/API-Schnittstellen Ihrer Speichersysteme. Jeder Zugriff ist schreibgeschützt. In der DataSync-Dokumentation finden Sie weitere Informationen zu den APIs, die für den Zugriff auf Ihren Speicher verwendet werden.

Wenn Sie AWS DataSync Discovery so konfigurieren, dass es Ihr Speichersystem erkennt, geben Sie einen Benutzernamen und ein Passwort für den Zugriff auf die API-Schnittstelle Ihres Speichers an. AWS DataSync Discovery erstellt dann automatisch ein Geheimnis in AWS Secrets Manager, um die Anmeldeinformationen zu speichern. Wenn DataSync Discovery einen Discovery-Auftrag ausführt, ruft es das Passwort aus dem Geheimnis ab, verschlüsselt es erneut und sendet das verschlüsselte Passwort an den für Ihren Auftrag verwendeten Agenten. Das Passwort wird nur für die Dauer des Auftrags im Speicher des Agenten aufbewahrt und befindet sich zu keinem Zeitpunkt außerhalb des Speichers.

Ja. Alle Daten, die zwischen der Quelle und dem Ziel übertragen werden, werden über das TLS-Protokoll (Transport Layer Security) verschlüsselt, wobei TLS das SSL-Protokoll (Secure Sockets Layer) abgelöst hat. Daten werden niemals dauerhaft bei AWS DataSync selbst gespeichert. Der Service unterstützt die Verwendung der Standardverschlüsselung für S3-Buckets, die für Amazon EFS-Dateisysteme verfügbare Verschlüsselung von gespeicherten Daten und die für Amazon FSx verfügbare Verschlüsselung von Daten während der Speicherung und Übertragung.

AWS DataSync verwendet einen Agenten, den Sie in Ihrer IT-Umgebung oder auf Amazon EC2 über das NFS- oder SMB-Protokoll für den Zugriff auf Ihre Dateien bereitgestellt haben. Dieser Agent verbindet sich mit DataSync-Serviceendpunkten innerhalb von AWS und wird sicher über die AWS-Managementkonsole oder CLI verwaltet.

AWS DataSync verwendet einen Agenten, den Sie in Ihrer IT-Umgebung oder in Amazon EC2 bereitstellen, um auf Ihren Hadoop-Cluster zuzugreifen. Der DataSync-Agent fungiert als HDFS-Client und kommuniziert mit den NameNodes und DataNodes in Ihren Clustern. Wenn Sie eine Aufgabe starten, fragt DataSync den primären NameNode ab, um die Speicherorte von Dateien und Ordnern im Cluster zu ermitteln. DataSync kommuniziert dann mit den DataNodes im Cluster, um Dateien und Ordner in oder aus HDFS zu kopieren.

AWS DataSync verwendet einen Agenten, den Sie in Ihrer IT-Umgebung oder in Amazon EC2 bereitstellen, um über die Amazon-S3-API auf Ihre Objekte zuzugreifen. Dieser Agent verbindet sich mit DataSync-Serviceendpunkten innerhalb von AWS und wird sicher über die AWS-Managementkonsole oder CLI verwaltet.

AWS DataSync verwendet einen Agenten, den Sie in Ihrer Azure-Umgebung oder in Amazon EC2 bereitstellen, um auf Objekte in Ihren Azure-Blob-Storage-Containern zuzugreifen. Dieser Agent verbindet sich mit DataSync-Serviceendpunkten innerhalb von AWS und wird nach der Aktivierung sicher über die AWS-Managementkonsole oder CLI verwaltet. Der Agent authentifiziert sich bei Ihrem Azure-Container mithilfe eines SAS-Tokens, das Sie bei der Erstellung eines Azure-Blob-Standorts für DataSync angeben.

Nein. Wenn Sie Daten zu oder von Ihrem Standort kopieren, müssen Sie kein VPN/Tunnel einrichten oder eingehende Verbindungen zulassen. Ihr AWS DataSync-Agent kann so konfiguriert werden, dass er über Standardnetzwerkports durch eine Firewall geleitet wird. Sie können mithilfe von VPC-Endpunkten innerhalb Ihrer Amazon Virtual Private Cloud (Amazon VPC) DataSync bereitstellen. Bei Verwendung von VPC-Endpunkten müssen Daten, die zwischen dem DataSync-Agenten und AWS-Services übertragen werden, weder das öffentliche Internet durchlaufen noch öffentliche IP-Adressen benötigen.

Ihr AWS DataSync-Agent stellt eine Verbindung zu DataSync-Service-Endpunkten in Ihrer ausgewählten AWS-Region her. Sie können festlegen, dass der Agent eine Verbindung zu öffentlichen Internet-Endpunkten, FIPS-validierten Endpunkten (Federal Information Processing Standards) oder Endpunkten innerhalb einer Ihrer VPCs herstellt. Wenn Sie Ihren Agenten aktivieren, wird er sicher mit Ihrem AWS-Konto verknüpft. Weitere Informationen finden Sie in den Abschnitten zum Auswählen eines Serviceendpunkts (Choose a Service Endpoint) und Aktivieren Ihres Agenten (Activate Your Agent).

Aktualisierungen der Agenten-VM, einschließlich des zugrunde liegenden Betriebssystems und der AWS DataSync-Softwarepakete, werden von AWS automatisch angewendet, sobald der Agent aktiviert ist. Updates werden unterbrechungsfrei durchgeführt, wenn sich der Agent im Leerlauf befindet und keine Datenübertragungsaufgabe ausführt.

AWS verfügt über das am längsten laufende Compliance-Programm in der Cloud. AWS ist bestrebt, Kunden bei der Navigation ihrer Anforderungen zu unterstützen. Der AWS DataSync-Service wurde geprüft und erfüllt die weltweiten und branchenspezifischen Sicherheitsstandards. DataSync erfüllt die Standards PCI DSS, ISO 9001, 27001, 27017 und 27018 sowie SOC 1, 2 und 3 und ist darüber hinaus konform mit dem HIPAA. DataSync hat ebenfalls in den AWS-Regionen USA Ost und USA West die FedRAMP-Autorisierungsstufe "Moderate" sowie in den GovCloud (US)-Regionen von AWS die FedRAMP-Autorisierungsstufe "High" erhalten. So ist es für Sie einfacher, die Sicherheit unserer Services zu überprüfen und Ihre eigenen Verpflichtungen zu erfüllen. Weitere Informationen und Ressourcen finden Sie auf unseren Compliance-Seiten. Eine vollständige Liste der Services und Zertifikate finden Sie außerdem auf der Seite Services in Scope nach Compliance-Programm.

Ja. AWS DataSync ist PCI-DSS-konform; dies bedeutet, dass Sie es für die Übertragung von Zahlungsdaten verwenden können. Sie können das PCI Compliance Package in AWS Artifact herunterladen, um mehr darüber zu erfahren, wie Sie PCI-Compliance auf AWS erreichen können.

Ja. AWS DataSync ist konform zu HIPAA. Wenn Sie also mit AWS eine Geschäftspartnervereinbarung in Bezug auf HIPAA abgeschlossen haben, können Sie DataSync für die Übertragung von geschützten Gesundheitsdaten (Protected Health Information, PHI) verwenden.

Ja. AWS DataSync hat in den AWS-Regionen USA Ost und USA West eine vorläufige Betriebserlaubnis (Provisional Authority to Operate, P-ATO) des Joint Authorization Board (JAB) im Rahmen des Federal Risk and Authorization Management Program (FedRAMP) gemäß den Grundanforderungen der Stufe "Moderate" erhalten. Als Bundesbehörde oder kommerzieller Kunde können Sie AWS DataSync für Datenübertragungen innerhalb der für die AWS-Regionen USA Ost und USA West geltenden Autorisierungsgrenzen der Stufe "Moderate" verwenden.

Ja. AWS DataSync hat in der AWS-Region GovCloud (US) eine vorläufige Betriebserlaubnis (Provisional Authority to Operate, P-ATO) des Joint Authorization Board (JAB) im Rahmen des Federal Risk and Authorization Management Program (FedRAMP) gemäß den Grundanforderungen der Stufe "Moderate" erhalten. Als Bundesbehörde oder kommerzieller Kunde können Sie AWS DataSync für Datenübertragungen innerhalb der für die Region AWS GovCloud (USA) geltenden Autorisierungsgrenzen der Stufe "High" verwenden.

Entscheidungshilfe für AWS DataSync

Mit AWS DataSync wird die Verschiebung großer aktiver Datensätze zu AWS vollständig automatisiert und beschleunigt. Es ist nativ in Amazon S3, Amazon EFS, Amazon FSx, Amazon CloudWatch und AWS CloudTrail integriert und bietet einen nahtlosen und sicheren Zugriff auf Ihre Speicherservices sowie eine detaillierte Überwachung der Übertragung.

DataSync benutzt ein speziell entwickeltes Netzwerkprotokoll und eine Aufskalierungs-Architektur für die Datenübertragung. Für den Datentransfer zwischen On-Premises und AWS-Speicher-Services kann eine einzige DataSync-Aufgabe eine 10-Gbit/s-Netzwerkverbindung voll ausnutzen.

DataSync automatisiert die Datenübertragung vollständig. Es verfügt über Wiederholungs- und Netzwerkresilienzmechanismen, Netzwerkoptimierungen, integrierte Aufgabenplanung, Prüfung über Aufgabenberichte, Überwachung über die DataSync-API und -Konsole sowie CloudWatch-Metriken, -Ereignisse und -Protokolle, die detaillierte Einblicke in den Übertragungsprozess bieten. DataSync führt eine Verifizierung der Datenintegrität sowohl während der Übertragung als auch nach dem Abschluss durch.

DataSync bietet umfassende Sicherheit und lässt sich direkt in AWS-Speicherdienste integrieren. Alle Daten, die zwischen Quelle und Ziel übertragen werden, werden über TLS verschlüsselt, und der Zugriff auf Ihren AWS-Speicher wird über integrierte AWS-Sicherheitsmechanismen wie IAM-Rollen ermöglicht. Mit DataSync mit VPC-Endpunkten wird sichergestellt, dass zwischen einer Organisation und AWS übertragene Daten nicht das öffentliche Internet durchdringen, wodurch die Sicherheit von Daten beim Kopieren über das Netzwerk weiter erhöht wird.

AWS bietet mehrere Werkzeuge zum Kopieren von Objekten zwischen Ihren Buckets.

Verwenden Sie AWS DataSync für die laufende Datenverteilung, Datenpipelines und Data Lake Ingest sowie für die Konsolidierung oder Aufteilung von Daten auf mehrere Buckets.

Verwenden Sie die S3-Replikation für die kontinuierliche Replikation von Daten in einen bestimmten Ziel-Bucket.

Verwenden Sie S3-Batchvorgänge für umfangreiche Batchvorgänge mit S3-Objekten, z. B. zum Kopieren von Objekten, Festlegen von Objekt-Tags oder Zugriffskontrolllisten (ACLs), Initiieren von Objektwiederherstellungen aus Amazon S3 Glacier Flexible Retrieval (ehemals S3 Glacier), Aufrufen einer AWS-Lambda-Funktion zur Durchführung benutzerdefinierter Aktionen mit Ihren Objekten, Verwalten von S3-Object-Lock-Rechtsbeständen oder Verwalten von S3-Object-Lock--Aufbewahrungsdaten.

AWS DataSync ist ideal für Online-Datenübertragungen. Mit DataSync können Sie aktive Daten nach AWS migrieren, Daten zur Analyse und Verarbeitung in die Cloud übertragen, Daten archivieren, um On-Premise-Speicherkapazitäten freizugeben, oder Daten für die Geschäftskontinuität nach AWS replizieren.

AWS Snowball Edge eignet sich ideal für die Offline-Datenübertragung, für Kunden mit eingeschränkter Bandbreite oder für die Übertragung von Daten aus entfernten, getrennten oder strengen Umgebungen. 

Verwenden Sie AWS DataSync, um vorhandene Daten nach Amazon S3 zu migrieren, und verwenden Sie dann die File Gateway-Konfiguration von AWS Storage Gateway, um den Zugriff auf die migrierten Daten beizubehalten und um fortlaufende Aktualisierungen von Ihren On-Premise dateibasierten Anwendungen durchzuführen.

Sie können eine Kombination aus DataSync und File Gateway verwenden, um Ihre On-Premise-Infrastruktur zu minimieren und gleichzeitig On-Premise-Anwendungen nahtlos mit Ihrem Cloud-Speicher zu verbinden. Mit AWS DataSync können Sie die Online-Datenübertragung an AWS Storage Services automatisieren und beschleunigen. Nach der anfänglichen Datentransferphase mit AWS DataSync bietet File Gateway Ihren On-Premise-Anwendungen mit geringer Latenzzeit Zugriff auf die migrierten Daten. Bei der Verwendung von DataSync mit NFS-Freigaben bleiben die POSIX-Metadaten aus Ihrem Quellspeicher On-Premise erhalten, und die Berechtigungen aus dem Quellspeicher gelten beim Zugriff auf Ihre Dateien über File Gateway.

Wenn Ihre Anwendungen bereits in die Amazon S3-API integriert sind und Sie einen höheren Durchsatz für die Übertragung größerer Dateien nach S3 wünschen, können Sie S3 Transfer Acceleration verwenden. Wenn Sie Daten von vorhandenen Speichersystemen (z. B. Network Attached Storage) oder von Instrumenten, die nicht geändert werden können (z. B. DNA-Sequenzierer, Videokameras), übertragen möchten, oder wenn Sie mehrere Ziele konfigurieren möchten, sollten Sie sich für AWS DataSync entscheiden. Darüber hinaus automatisiert und vereinfacht DataSync die Datenübertragung, indem zusätzliche Funktionen bereitgestellt werden, z. B. integrierte Wiederholungs- und Ausfallsicherungsmechanismen für das Netzwerk, Überprüfung der Datenintegrität und flexible Konfiguration entsprechend Ihren spezifischen Anforderungen, einschließlich Bandbreitenbeschränkung usw.

Wenn Sie derzeit SFTP zum Austausch von Daten mit Dritten verwenden, bietet AWS Transfer Family eine vollständig verwaltete SFTP-, FTPS-, FTP- und AS2-Übertragung direkt in und aus Amazon S3 und reduziert gleichzeitig Ihren Betriebsaufwand.

Wenn Sie eine beschleunigte und automatisierte Datenübertragung zwischen NFS-Servern, SMB-Dateifreigaben, Hadoop-Clustern, selbstverwaltetem oder Cloud-Objektspeicher, Amazon S3, Amazon EFS und Amazon FSx wünschen, können Sie AWS DataSync verwenden. DataSync ist ideal für Kunden, die Online-Migrationen für aktive Datensätze, zeitnahe Übertragungen für kontinuierlich erzeugte Daten oder Replikationen für die Geschäftskontinuität benötigen.