Domande generali

AWS DataSync è un servizio di trasferimento e rilevamento di dati online che semplifica e accelera le migrazioni di dati verso AWS, nonché il trasferimento di dati tra archiviazione on-premises, posizioni edge, altri fornitori di servizi cloud e AWS Storage.

AWS DataSync Discovery semplifica la pianificazione della migrazione e accelera la migrazione dei dati verso AWS fornendo visibilità sulle prestazioni e l'utilizzo dell'archiviazione on-premise. Inoltre, offre consigli per la migrazione dei dati verso servizi di AWS Storage. DataSync Discovery permette di comprendere più a fondo le prestazioni e l'utilizzo della capacità dell'archiviazione on-premise attraverso funzioni automatizzate di raccolta e l'analisi dei dati. In tal modo, potrai identificare rapidamente i dati da migrare e utilizzare i suggerimenti generati per selezionare i servizi di AWS Storage conformi ai tuoi requisiti di prestazioni e capacità.

Per i trasferimenti di dati online, AWS DataSync semplifica, automatizza e accelera la copia di grandi quantità di dati tra archiviazione on-premise, posizioni edge o altri fornitori cloud e i servizi di AWS Storage. DataSync può copiare i dati su e da condivisioni Network File System (NFS), condivisioni di Server Message Block (SMB), file system distribuiti Hadoop (HDFS), archiviazione di oggetti autogestiti, archiviazione di oggetti in altri cloud come Google Cloud Storage e Wasabi Cloud Storage (consulta l’elenco completo di cloud di supporto), Azure Files, Azure Blob Storage (compreso Azure Data Lake Storage Gen2), archiviazione compatibile con Amazon S3 su Snow, Amazon Simple Storage Service (Amazon S3), file system Amazon Elastic File System (Amazon EFS), file system Amazon FSx per Windows File Server, file system Amazon FSx per Lustre, file system Amazon FSx per OpenZFS e file system Amazon FSx per NetApp ONTAP.

AWS DataSync permette di individuare e trasferire i dati in modo rapido e sicuro. Utilizzando DataSync Discovery, è possibile comprendere più a fondo l'utilizzo dell'archiviazione on-premise e ricevere consigli utili alle stime sui costi e ai piani per effettuare la migrazione in AWS. Per il trasferimento dei dati, puoi usare DataSync per copiare grandi set di dati con milioni di file senza dover creare soluzioni personalizzate con strumenti open source o acquistare licenze e gestire costosi software commerciali di accelerazione della rete. Puoi utilizzare DataSync per eseguire la migrazione di dati attivi verso AWS, archiviare i dati per liberare la capacità di archiviazione on-premise, replicare i dati in AWS per garantire la continuità aziendale o trasferire i dati al cloud per l'analisi e l'elaborazione.

AWS DataSync riduce la complessità e i costi del trasferimento di dati online, semplificando il trasferimento di set di dati tra sistemi di archiviazione on-premises, posizioni edge, altri fornitori cloud e servizi di AWS Storage. DataSync si connette ai sistemi di archiviazione e alle origini dati esistenti tramite protocolli di archiviazione standard (NFS, SMB) come un client HDFS, utilizzando l'API Amazon S3 o altre API di archiviazione cloud. Utilizza un protocollo di rete specifico e un'architettura scalabile per accelerare il trasferimento di dati tra i sistemi di archiviazione e i servizi AWS. DataSync gestisce le risorse spostando i file e gli oggetti, programmando i trasferimenti dei dati, monitorando l'avanzamento dei trasferimenti, la crittografia e la verifica dei trasferimenti di dati e avvisando di eventuali errori.

AWS DataSync riduce la complessità e i costi del trasferimento di dati online, semplificando il trasferimento di set di dati tra sistemi di archiviazione on-premises, posizioni edge, altri fornitori cloud e servizi di AWS Storage. DataSync si connette ai sistemi di archiviazione e alle origini dati esistenti tramite protocolli di archiviazione standard (NFS, SMB) come un client HDFS, utilizzando l'API Amazon S3 o altre API di archiviazione cloud. Utilizza un protocollo di rete specifico e un'architettura scalabile per accelerare il trasferimento di dati tra i sistemi di archiviazione e i servizi AWS. DataSync gestisce le risorse spostando i file e gli oggetti, programmando i trasferimenti dei dati, monitorando l'avanzamento dei trasferimenti, la crittografia e la verifica dei trasferimenti di dati e avvisando di eventuali errori.

Rilevamento

Attualmente AWS DataSync Discovery supporta array di serie NetApp FAS e AFF che eseguono ONTAP 9.7 o versioni successive. Nel corso del tempo verrà implementato il supporto per ulteriori sistemi di archiviazione.

AWS DataSync Discovery utilizza la tua interfaccia API di gestione dell'archiviazione per raccogliere informazioni sul sistema di archiviazione insieme a parametri su prestazioni e utilizzo. Le informazioni sul sistema includono attributi quali capacità di archiviazione totale, configurazione del volume, nomi di esportazioni/condivisioni e altro ancora. I parametri del sistema di archiviazione includono prestazioni quali velocità di trasmissione effettiva e IOPS del volume, insieme a parametri di utilizzo quali capacità allocata e utilizzata. DataSync Discovery sfrutta le informazioni e i parametri sul sistema raccolti per generare suggerimenti per la migrazione verso AWS Storage.

AWS DataSync Discovery analizza i dati raccolti dal sistema di archiviazione on-premise e li confronta con le funzionalità, la capacità e le caratteristiche prestazionali dei servizi di archiviazione AWS. Laddove appropriato, DataSync Discovery proporrà uno o più servizi di archiviazione AWS da valutare.

Se AWS DataSync Discovery viene usato con i sistemi di archiviazione on-premise, non vi sarà alcun impatto significativo su utenti e applicazioni.

I dati raccolti saranno archiviati e gestiti dal servizio DataSync. I dati sono visibili nella console AWS DataSync o accessibili utilizzando AWS CLI o AWS Software Development Kit (SDK).

I dati raccolti e i suggerimenti verranno mantenuti per 60 giorni dal termine del processo di individuazione.

Trasferimento dati

DataSync supporta i seguenti tipi di posizione di archiviazione: condivisioni di Network File System (NFS), condivisioni di Server Message Block (SMB), file system distribuiti Hadoop (HDFS), archiviazione di oggetti autogestiti, archiviazione di oggetti in altri cloud come Google Cloud Storage e Wasabi Cloud Storage (consulta l’elenco completo di cloud di supporto), Azure Files, Azure Blob Storage (compreso Azure Data Lake Storage Gen2), archiviazione compatibile con Amazon S3 su Snow, Amazon Simple Storage Service (Amazon S3), file system Amazon Elastic File System (Amazon EFS), file system Amazon FSx per Windows File Server, file system Amazon FSx per Lustre, file system Amazon FSx per OpenZFS e file system Amazon FSx per NetApp ONTAP.

AWS DataSync ti permette di migrare i tuoi dati on-premise, su edge o in altri cloud ad Amazon S3, Amazon EFS, Amazon FSx per Windows File Server, Amazon FSx per Lustre, Amazon FSx per OpenZFS e Amazon FSx per NetApp ONTAP. Configura DataSync per effettuare una copia iniziale dell'intero set di dati e programmare il seguente trasferimento incrementale di dati di modifica fino al trasferimento finale da on-premise ad AWS. DataSync include la crittografia e la verifica di integrità dei dati, per accertare che vengano trasmessi in modo sicuro e completo e siano subito pronti all'uso. Per minimizzare l'impatto sui carichi di lavoro che necessitano della connessione di rete, puoi programmare l'esecuzione della migrazione durante le ore non lavorative o limitare il totale della larghezza di banda della rete utilizzata da DataSync configurando il throttling della larghezza di banda integrato. DataSync preserva i metadati tra sistemi di storage che hanno strutture di metadati simili, consentendo una transizione senza problemi di utenti finali e applicazioni all'utilizzo del tuo servizio di storage AWS di destinazione.

Consulta il blog sull'archiviazione "Migrazione dell'archiviazione con AWS DataSync" per ulteriori informazioni su best practice e suggerimenti sulla migrazione.

R: Puoi utilizzare AWS DataSync per spostare i dati inattivi da sistemi di archiviazione on-premise direttamente ad archiviazioni a lungo termine sicure e durevoli, ad esempio recupero flessibile Amazon S3 Glacier (precedentemente S3 Glacier) o Amazon S3 Glacier Deep Archive. Utilizza i filtri di esclusione di DataSync per escludere la copia di file e cartelle temporanei o utilizza i filtri di inclusione o i manifesti per copiare solo un sottoinsieme di file dalla posizione di origine. Puoi selezionare il servizio di archiviazione più economico secondo le tue necessità: trasferisci i dati a una classe di archiviazione S3 o utilizza DataSync con EFS Lifecycle Management per archiviare i dati nella classe di archiviazione ad accesso infrequente di Amazon EFS (EFS IA). Utilizza la funzionalità di programmazione delle attività integrata per archiviare regolarmente i dati che devono essere conservati per questioni di conformità o audit, come i log, i filmati grezzi o le cartelle cliniche elettroniche. 

AWS DataSync ti permette di replicare i file periodicamente in tutte le classi di archiviazione di Amazon S3 o inviare i dati ad Amazon EFS, Amazon FSx per Windows File Server, Amazon FSx per Lustre, Amazon FSx per OpenZFS o Amazon FSx per NetApp ONTAP per un file system in standby. Utilizza la funzionalità programmata delle attività integrate per assicurarti che le modifiche al set di dati vengano regolarmente copiate nella tua archiviazione di destinazione. Leggi questo articolo del blog sull’archiviazione AWS per scoprire di più sulla protezione dei dati con AWS DataSync.

Puoi utilizzare AWS DataSync per i trasferimenti continui da sistemi on-premises in AWS o all'esterno di AWS per l'elaborazione. DataSync può velocizzare i flussi di lavoro di storage nel cloud ibrido più critici in settori che devono spostare file attivi in AWS molto rapidamente. Alcuni esempi sono il machine learning nelle scienze biologiche, la produzione video nel settore multimediale e dell'intrattenimento, l'analisi dei Big Data per i servizi finanziari e la ricerca sismica nel settore Oil & Gas. DataSync fornisce un risultato rapido per evitare il ritardo dei processi interni. È possibile specificare filtri o manifesti di inclusione ed esclusione per specificare quali file o oggetti devono essere trasferiti ogni volta che viene eseguita l'attività.

Sì. Utilizzando AWS DataSync, puoi copiare dati da Google Cloud Storage utilizzando l'API Amazon S3, da Azure Files utilizzando il protocollo SMB o da Azure Blob Storage (incluso Azure Data Lake Storage Gen 2). Puoi anche spostare i dati da altri cloud storage come Wasabi Cloud Storage, Oracle Cloud Storage, Cloudflare R2 Storage, DigitalOcean Spaces e Backblaze B2 Cloud Storage (consulta l'elenco completo dei cloud di supporto). Implementa l'agente DataSync nel tuo ambiente cloud o su Amazon EC2, crea le tue posizioni di origine e destinazione, quindi avvia l'attività per iniziare a copiare i dati. Scopri di più sulle soluzioni AWS per ambienti ibridi e multicloud.

Sì. Con AWS DataSync, puoi costruire facilmente il tuo data lake automatizzando il trasferimento di set di dati on-premise o dei dati in altri cloud su Amazon S3. DataSync abilita un trasferimento semplice e rapido dell'intero set di dati mediante protocolli di archiviazione standard (NFS, SMB) come un client HDFS, utilizzando l'API Amazon S3 o utilizzando l’API di archiviazione cloud. Dopo aver trasferito il set di dati iniziale, puoi pianificare i successivi trasferimenti di nuovi dati ad AWS. DataSync include la crittografia e la verifica di integrità dei dati, per accertare che vengano trasmessi in modo sicuro e completo e siano subito pronti all'uso. Per minimizzare l'impatto sui carichi di lavoro che necessitano della connessione di rete, puoi programmare l'esecuzione dei trasferimenti durante le ore non lavorative o limitare il totale della larghezza di banda della rete utilizzata da DataSync configurando il throttling della larghezza di banda integrato. Una volta che i tuoi dati sono giunti su Amazon S3, puoi utilizzare i servizi AWS nativi per eseguire analisi di Big Data, intelligenza artificiale (IA), machine learning (ML), high-performance computing (HPC) e applicazioni di elaborazione dei dati multimediali per ottenere informazioni dai tuoi set di dati non strutturati. Leggi la pagina Web sull'archiviazione di data lake di AWS per saperne di più sulla costruzione e lo sfruttamento del tuo data lake.

DataSync ti permette di trasferire file o oggetti tra Amazon S3, Amazon EFS, Amazon FSx per Windows File Server, Amazon FSx per Lustre, Amazon FSx per OpenZFS o Amazon FSx per NetApp ONTAP all'interno dello stesso account AWS. Puoi trasferire i dati tra i servizi AWS nella stessa regione AWS, tra servizi in regioni commerciali AWS diverse (tranne la Cina) o tra regioni AWS GovCloud (Stati Uniti orientali e Stati Uniti occidentali). Per questo processo non è richiesto un agente DataSync e puoi effettuare la configurazione end to end utilizzando la console AWS DataSync, l'interfaccia a riga di comando (CLI) AWS o AWS Software Development Kit (SDK).

Sì. AWS DataSync accelera le fasi necessarie per il servizio di migrazione Amazon WorkDocs automatizzando il caricamento dei file nel bucket di Amazon S3 utilizzato per la migrazione. DataSync semplifica e velocizza la migrazione di home directory e di condivisioni di dipartimenti su WorkDocs. Per ulteriori informazioni sull'utilizzo di DataSync per le migrazioni su WorkDocs, leggi il blog Migrazione delle condivisioni di file di rete verso Amazon WorkDocs con AWS DataSync.

Utilizzo

Comincia a implementare un agente AWS DataSync nel tuo ambiente VM on-premises. Utilizzando la console DataSync, la CLI o l'SDK, configura DataSync Discovery affinché si colleghi alla tua archiviazione on-premise ed esegui processi di individuazione per raccogliere dati sul tuo sistema di archiviazione insieme a parametri su prestazioni, capacità e utilizzo. Durante l'esecuzione dei processi di individuazione, le informazioni sui sistemi di archiviazione sono visibili nei pannelli di controllo all'interno della console DataSync. Al termine di un processo di individuazione, i dati raccolti vengono analizzati per generare suggerimenti per la migrazione verso servizi di archiviazione AWS come Amazon EFS, Amazon FSx e Amazon S3. Tali suggerimenti possono agevolare la scelta dei servizi di AWS Storage ed è possibile utilizzare AWS DataSync per trasferire i dati.

È possibile avviare un trasferimento di dati con AWS DataSync con pochi clic nella Console di gestione AWS oppure attraverso l'interfaccia a riga di comando di AWS (CLI). Per iniziare, segui questi 3 passaggi:

1. Per trasferire i dati tra i sistemi di archiviazione on-premises, edge o altri cloud e i servizi di archiviazione AWS, devi implementare un agente: implementa un agente DataSync e associalo all'account AWS tramite la console di gestione o l'API. L'agente sarà utilizzato per accedere al server NFS, alla condivisione file SMB, al cluster Hadoop o all'archiviazione di oggetti autogestiti o cloud per leggere e scrivere dati. La distribuzione dell'agente non è obbligatoria per trasferire i dati tra servizi di storage AWS all'interno dello stesso account AWS.

2. Creazione di un'attività di trasferimento dati: crea un'attività specificando il percorso dell'origine e della destinazione dei dati ed eventuali opzioni di configurazione del trasferimento, ad esempio la pianificazione dell'attività e l’abilitazione dei report sulle attività.

3. Avvia il trasferimento: avvia l'attività, monitora il movimento dei dati nella console o con Amazon CloudWatch e controlla le attività di trasferimento audit utilizzando i report delle attività.

Puoi implementare un agente AWS DataSync verso un hypervisor on-premises, nell’ambiente cloud pubblico o su Amazon EC2. Per copiare i dati da o verso un file server on-premise o nello spazio di archiviazione compatibile con Amazon S3 su Snow, è necessario scaricare l'immagine della macchina virtuale dell'agente dalla console AWS e implementarla on-premise sull'hypervisor VMware ESXi, su macchine virtuali basate su kernel (KVM) di Linux o su Microsoft Hyper-V. L'agente deve essere implementato in modo che possa accedere al tuo server di file utilizzando il protocollo NFS, SMB, accedere a NameNodes e DataNodes nel tuo cluster Hadoop o accedere all'archiviazione di oggetti utilizzando l'API di Amazon S3. Per impostare i trasferimenti tra S3 sui bucket AWS Outposts e i bucket S3 nelle regioni AWS, implementa l'agente sul tuo Outpost.

Quando copi i dati tra il tuo ambiente cloud pubblico e l’archiviazione AWS, puoi distribuire l'agente DataSync nel tuo ambiente cloud o su Amazon EC2. Poiché AWS DataSync comprime i dati in transito tra l'agente AWS DataSync e i servizi di archiviazione AWS, potresti essere in grado di ridurre le tariffe in uscita distribuendo l'agente AWS DataSync nel tuo ambiente cloud pubblico.  

L'implementazione dell'agente non è obbligatoria per trasferire i dati tra servizi di archiviazione AWS all'interno dello stesso account AWS. Per copiare i dati da o su un file server in cloud gestito dal cliente o tra servizi di storage AWS in account AWS diversi, devi avviare un'istanza Amazon EC2 utilizzando l'AMI di un agente DataSync.

È possibile trovare qui le risorse minime richieste per eseguire l'agente.

AWS DataSync avvia la copia dei dati quando viene eseguita un'attività tramite la Console di gestione AWS o l'interfaccia a riga di comando AWS (CLI). A ogni esecuzione dell'attività, ricerca eventuali modifiche nei file di origine e di destinazione ed esegue una copia delle differenze dei metadati tra l'origine e la destinazione. È possibile configurare quali caratteristiche dell'origine vengono utilizzate per determinare le variazioni, definire filtri di inclusione ed esclusione o manifesti per trasferire dati di file e oggi specifici e controllare se i file o gli oggetti nella destinazione debbano essere sovrascritti quando vengono modificati nell'origine o eliminati se non si trovano più all'origine.

Un'attività in modalità Basic è soggetta a quote sul numero di file e oggetti in un set di dati. La modalità base prepara, trasferisce e verifica in sequenza i file e gli oggetti in un set di dati, risultando più lenta della modalità avanzata per la maggior parte dei carichi di lavoro. Con la modalità avanzata, è possibile trasferire set di dati con un numero praticamente illimitato di oggetti a livelli di prestazioni più elevati rispetto alla modalità base. Le attività in modalità avanzata ottimizzano e semplificano il processo di trasferimento dei dati eseguendo l'elencazione, la preparazione, il trasferimento e la verifica dei dati in parallelo. Ottieni anche parametri e funzionalità di reporting migliorati, che semplificano il monitoraggio e la gestione di trasferimenti di dati di grandi dimensioni. La modalità avanzata è attualmente disponibile per i trasferimenti tra sedi Amazon S3. La modalità base supporta tutti i tipi di posizione DataSync disponibili oggi. Consulta la documentazione di DataSync per un elenco dettagliato delle differenze tra le modalità di attività. Consulta la pagina dei prezzi di DataSync per le differenze di prezzo tra le modalità di attività.

Mentre AWS DataSync trasferisce e archivia i dati, esegue i controlli di integrità per assicurarsi che i dati scritti nella destinazione corrispondano ai dati letti all'origine. Inoltre, può essere effettuato un ulteriore controllo di verifica per comparare l'origine e la destinazione alla fine del trasferimento. DataSync calcolerà e comparerà la checksum dei file completa dei dati archiviati nell'origine e nella destinazione. È possibile verificare sia il set di dati completo sia soltanto i file o gli oggetti trasferiti da DataSync.

È possibile utilizzare i report sulle attività per controllare i processi di trasferimento dei dati verificando le operazioni di trasferimento in tutte le esecuzioni delle attività. Utilizzando i report sulle attività, è possibile ottenere un rapporto di riepilogo insieme a report dettagliati per tutti i file trasferiti, ignorati, verificati ed eliminati, per ogni esecuzione di attività. I report sulle attività forniscono il numero totale di file e byte trasferiti e includono attributi di file come dimensione, percorso, timestamp, checksum dei file e ID delle versioni degli oggetti, ove applicabile. Puoi anche sfruttare AWS Glue, Amazon Athena e Amazon QuickSight per catalogare, interrogare e visualizzare automaticamente i report delle attività per ottenere informazioni critiche sui processi di trasferimento dei dati.

Durante il trasferimento dei dati, è possibile monitorare lo stato e l’avanzamento tramite la Console di gestione AWS o la CLI. Grazie ai parametri di Amazon CloudWatch è possibile visualizzare il numero di file e la quantità di dati già copiati. Puoi anche abilitare la registrazione di singoli file su CloudWatch Logs per identificare ciò che è stato trasferito in un determinato momento, nonché i risultati della verifica dell'integrità del contenuto eseguita da DataSync.

Queste soluzioni insieme semplificano il controllo, il monitoraggio, la reportistica e la risoluzione dei problemi e consentono di fornire aggiornamenti tempestivi alle parti interessate.

Sì. È possibile specificare un filtro di esclusione, un filtro di inclusione o entrambi per limitare quali file, cartelle o oggetti vengono trasferiti ogni volta che viene eseguito un processo. In alternativa, puoi utilizzare i manifesti per specificare un sottoinsieme di file o oggetti che devono essere trasferiti dalla posizione di origine.

I filtri di inclusione specificano i percorsi di file e cartelle o le chiavi degli oggetti da includere quando il processo viene eseguito e limitano l'ambito di ciò che viene analizzato da DataSync nell’origine e nella destinazione. I filtri di esclusione specificano i percorsi di file e cartelle o le chiavi degli oggetti da escludere dalla copia.  Quando si crea o si aggiorna un processo, è possibile configurare sia i filtri di esclusione che di inclusione. Quando si avvia un processo, è possibile ignorare e aggiornare i filtri configurati sull’attività. Leggi questo articolo del blog di archiviazione AWS per scoprire di più sull'utilizzo dei filtri più comuni con DataSync.

Un manifesto è un file formattato in CSV che specifica i percorsi dei file o le chiavi degli oggetti da includere quando viene eseguita l’attività e limitano l'ambito di ciò che viene analizzato da DataSync nell’origine e nella destinazione. Quando si crea o si aggiorna un'attività, è possibile fornire un file manifesto con milioni di file o oggetti di origine e DataSync confronterà e trasferirà solo i file elencati nel manifesto. Quando si avvia un'operazione, è possibile sovrascrivere e aggiornare il file manifesto. Quando vengono copiati dati da Amazon S3, è anche possibile specificare un ID di versione S3 facoltativo di ciascun oggetto da trasferire. Per maggiori dettagli, leggi questo post del blog.

Tieni presente che i filtri e i manifesti non possono essere usati insieme.

Mentre un manifesto è un elenco esplicito di file o oggetti da trasferire dalla posizione di origine, un filtro include è una stringa che specifica i modelli di file e cartelle da trasferire dall'origine. Vengono copiati solo i file e le cartelle che corrispondono ai modelli del filtro. Un modello può essere un intero percorso di file o cartella o un prefisso che termina con un carattere jolly (*), a indicare che tutti i file o gli oggetti che corrispondono al prefisso devono essere copiati. I filtri di inclusione sono ideali per i clienti che desiderano copiare solo un piccolo set di file o oggetti o alcune cartelle specifiche. I clienti con set di dati noti, ad esempio quelli spostati nell'ambito di un flusso di lavoro automatizzato, possono utilizzare i manifesti per evitare di scansionare l'intero sistema di storage di file o oggetti per determinare le modifiche. Utilizzando un file manifesto, i clienti possono specificare milioni di file o oggetti di origine da trasferire e DataSync confronterà solo i file elencati nel manifesto. I clienti possono anche utilizzare i manifest per copiare versioni specifiche di oggetti dal loro bucket Amazon S3.

Sì. Puoi programmare le tue attività utilizzando la console di AWS DataSync o l'interfaccia a riga di comando AWS (CLI) senza la necessità di scrivere o eseguire script per gestire i trasferimenti ripetuti. La pianificazione delle attività esegue automaticamente le attività secondo il programma configurato, con opzioni orarie, giornaliere o settimanali fornite direttamente nella console. Questo ti permette di assicurarti che le modifiche al tuo set di dati vengano automaticamente individuate e copiate nello storage di destinazione.

Sì. Durante il trasferimento dei file, AWS DataSync crea nella destinazione la stessa struttura della directory della posizione originale.

Se un'attività viene interrotta, ad esempio se la connessione di rete viene persa o l'agente AWS DataSync viene riavviato, l'esecuzione successiva dell'attività proseguirà con il trasferimento dei file mancanti e, al termine, i dati saranno completi e coerenti. Ogni volta che un'attività viene avviata, eseguirà una copia incrementale, in cui vengono trasferiti solo i file modificati.

Puoi utilizzare AWS DataSync con il tuo collegamento Direct Connect per accedere agli endpoint del servizio pubblico o agli endpoint VPC privati. Quando si utilizzano endpoint VPC, i dati trasferiti tra l'agente DataSync e il servizio AWS non attraversano la rete Internet pubblica né richiedono indirizzi IP pubblici, il che aumenta la sicurezza dei dati quando vengono copiati sulla rete. Al momento DataSync Discovery è supportato solo con gli endpoint del servizio pubblico.

Sì, gli endpoint VPC sono supportati per i casi d'uso di trasferimento dati. È possibile utilizzare gli endpoint VPC per garantire che i dati trasferiti tra l'agente AWS DataSync, indifferentemente se implementati on-premises o nel cloud, non attraversino la rete Internet pubblica o non richiedano indirizzi IP pubblici. L'uso degli endpoint VPC aumenta la sicurezza dei dati mantenendo il traffico di rete all'interno del tuo Amazon Virtual Private Cloud (Amazon VPC). Gli endpoint VPC per DataSync si basano su AWS PrivateLink, una tecnologia scalabile altamente disponibile che consente di connettere privatamente il VPC ai servizi AWS supportati.

Per utilizzare gli endpoint VPC con AWS DataSync, è necessario creare un endpoint VPC di interfaccia AWS PrivateLink per il servizio DataSync nel VPC prescelto, quindi scegliere questa interfaccia di rete elastica (ENI) dell'endpoint durante la creazione dell'agente DataSync. Per l'attivazione, l'agente si connetterà all'ENI scelta e successivamente tutti i dati trasferiti dall'agente rimarranno all'interno del VPC configurato. Per configurare gli endpoint VPC, puoi utilizzare la console AWS DataSync, l'interfaccia a riga di comando (CLI) AWS or AWS SDK. Per saperne di più, consulta Uso di AWS DataSync in un Virtual Private Cloud.

Trasferimento da e verso AWS Storage

AWS DataSync supporta il trasferimento da, verso o tra Amazon Simple Storage Service (Amazon S3), Amazon Elastic File System (Amazon EFS), Amazon FSx per Windows File Server, Amazon FSx per Lustre, Amazon FSx per OpenZFS e Amazon FSx per NetApp ONTAP.

Sì. Quando si configura un bucket S3 da utilizzare con AWS DataSync, è possibile selezionare la classe di storage S3 che DataSync utilizza per archiviare gli oggetti. DataSync supporta l'archiviazione di dati direttamente in S3 Standard, S3 Intelligent-Tiering, S3 Standard-Infrequent Access (S3 Standard-IA), S3 One Zone-Infrequent Access (S3 One Zone-IA), recupero istantaneo Amazon S3 Glacier, recupero flessibile Amazon S3 Glacier e Deep Archive Amazon S3 Glacier (Deep Archive S3 Glacier). Per ulteriori informazioni sulle classi di archiviazione di Amazon S3, consulta la guida per gli sviluppatori di Amazon Simple Storage Service.

Gli oggetti di dimensioni inferiori alla capacità della tariffa minima per oggetto verranno archiviate in S3 Standard. Ad esempio, gli oggetti cartella, con dimensioni di zero byte e che contengono soltanto metadati, verranno archiviati in S3 Standard. Leggi le considerazioni relative all'utilizzo delle classi di archiviazione Amazon S3 nella nostra documentazione e alla valutazione dei costi delle richieste S3 quando usi DataSync. Per ulteriori informazioni sulle capacità di ricarica minime, consulta i prezzi di Amazon S3.

Sì. Quando si utilizza S3 come posizione di origine per un'attività di AWS DataSync, il servizio recupera dal bucket tutti gli oggetti che devono essere copiati nella destinazione. Il recupero degli oggetti dallo storage Standard-IA S3 e One Zone-IA S3 è soggetto a un costo di recupero basato sulla dimensione degli oggetti. Consulta le considerazioni sull'utilizzo delle classi di archiviazione Amazon S3 nella nostra documentazione.

Quando si utilizza S3 come posizione di origine per un'attività di AWS DataSync, il servizio prova a recuperare dal bucket tutti gli oggetti che devono essere copiati nella destinazione. Il recupero di oggetti archiviati nella classe di archiviazione S3 Glacier Instant Retrieval comporterà costi di recupero più elevati in base alle dimensioni degli oggetti. Recuperare gli oggetti archiviati nella classe di storage S3 Glacier Flexible Retrieval o S3 Glacier Deep Archive può comportare un errore. Eventuali errori nel recupero degli oggetti archiviati verranno registrati da DataSync e risulteranno nello stato di completamento dell'attività non riuscito. Leggi le considerazioni relative all'utilizzo delle classi di archiviazione Amazon S3 e alla valutazione dei costi delle richieste S3 quando usi DataSync nella nostra documentazione.

AWS DataSync assume il ruolo IAM da te fornito. La policy che alleghi al ruolo determina le azioni che il ruolo può eseguire. Questo ruolo può essere auto-generato da DataSync per tuo conto oppure puoi configurarlo manualmente.

Quando i file o le cartelle vengono copiati su Amazon S3, esiste una relazione uno a uno tra un file o una cartella e un oggetto. I timestamp dei file e delle cartelle e le autorizzazioni POSIX, inclusi ID utente, ID gruppo e autorizzazioni, sono archiviati nei metadati utente S3. Per le condivisioni NFS, i metadati dei file archiviati nei metadati utente S3 sono completamente interoperativi con Gateway di file e forniscono accesso basato su file on-premises ai dati archiviati in Amazon S3 da AWS DataSync.

Quando DataSync copia gli oggetti che contengono questi metadati utente su un server NFS, i metadati del file vengono ripristinati. I link simbolici e i link fissi possono anche essere recuperati durante la copia da NFS a S3.

Quando si copia da una condivisione file SMB, le autorizzazioni POSIX predefinite vengono archiviate nei metadati utente S3. Quando si copia su una condivisione file SMB, la proprietà viene impostata in base all'utente configurato in DataSync per accedere a quella condivisione file, e vengono assegnate autorizzazioni di default.

Quando si esegue la copia da HDFS, timestamp di file e cartelle, la proprietà di utenti e gruppi e le autorizzazioni POSIX vengono archiviate nei metadati dell'utente S3. Quando si esegue la copia da Amazon S3 a HDFS, vengono ripristinati metadati di file e cartelle.
 

Scopri ulteriori informazioni su come DataSync archivia file e metadati nella nostra documentazione.

Quando si trasferiscono oggetti tra lo spazio di archiviazione di oggetti gestito dal cliente e Amazon S3, DataSync copia gli oggetti insieme ai relativi metadati e tag.

Quando si trasferiscono oggetti tra bucket Amazon S3, DataSync copia gli oggetti insieme ai relativi metadati e tag. DataSync non copia le altre informazioni degli oggetti, come le liste di controllo degli accessi o le precedenti versioni degli oggetti.

Alcune classi di archiviazione S3 hanno comportamenti che possono influenzare il costo, come il recupero dei dati, la capacità minima di archiviazione e la durata minima dell’archiviazione. DataSync automatizza la gestione dei dati per risolvere questi fattori e fornisce le impostazioni per ridurre al minimo il recupero dei dati.

Per evitare costi relativi alla capacità minima per oggetto, AWS DataSync archivia automaticamente gli oggetti più piccoli in S3 Standard. Per minimizzare i costi del recupero dei dati, puoi configurare DataSync per verificare solo i file che sono stati trasferiti da un'attività specifica. Per evitare costi relativi alla durata minima dello storage, DataSync fornisce controlli per gli oggetti sovrascritti o eliminati. Leggi le considerazioni sui costi quando lavori con le classi di archiviazione di Amazon S3 nella nostra documentazione e valuta i costi delle richieste S3 quando usi DataSync.

Sì. Puoi copiare oggetti tra Amazon S3 su AWS Outposts e i bucket Amazon S3 nelle Regioni AWS. AWS DataSync copia gli oggetti insieme ai metadati e ai tag degli oggetti. Affinché DataSync possa accedere ad Amazon S3 sui bucket Outposts, implementa un agente DataSync EC2 nel tuo Outpost.

Quando utilizzi DataSync con Amazon S3 su Outposts, puoi trasferire dati da e verso i bucket Amazon S3 solo nelle Regioni AWS. Maggiori informazioni sulle origini e sulle destinazioni supportate per le attività DataSync sono disponibili nella nostra documentazione.

AWS DataSync accede al file system Amazon EFS tramite il protocollo NFS. Per farlo, il servizio DataSync monta il file system internamente al VPC utilizzando interfacce di rete elastiche (ENI) gestite dal servizio stesso. DataSync, infatti, gestisce la creazione, l'utilizzo e l'eliminazione di queste interfacce in modo automatico. Puoi scegliere di montare il file system EFS utilizzando una destinazione di montaggio o un punto di accesso EFS.

Sì. Puoi utilizzare AWS DataSync per copiare i file in Amazon EFS e configurare la Gestione del ciclo di vita EFS per effettuare la migrazione dei file ai quali non è stato effettuato l'accesso per un dato periodo di tempo nella classe di archiviazione ad accesso infrequente (IA).

Puoi utilizzare sia le policy di identità IAM che le policy di risorse per controllare l'accesso del client alle risorse Amazon EFS in modo scalabile e ottimizzato per gli ambienti cloud. Quando crei un percorso DataSync per il file system EFS, puoi specificare un ruolo IAM che DataSync dovrà assumere durante l'accesso a EFS. In seguito puoi utilizzare le policy del file system EFS per configurare l'accesso per il ruolo IAM. Dal momento che DataSync monta i file system EFS come utente root, è necessario che la policy IAM consenta l'azione seguente: elasticfilesystem:ClientRootAccess.

Sì. Oltre alla replica integrata fornita da Amazon EFS, puoi utilizzare AWS DataSync per pianificare repliche periodiche del tuo file system di Amazon EFS in un secondo file system di Amazon EFS nello stesso account AWS. Questa funzionalità è disponibile per distribuzioni all'interno della stessa regione o tra regioni diverse e non richiede l'utilizzo di un agente DataSync.

AWS DataSync copia i timestamp dei file e delle cartelle e le autorizzazioni POSIX, inclusi ID utente, ID gruppo e autorizzazioni. Per maggiori informazioni e per consultare l'elenco completo dei metadati copiati fai riferimento alla nostra documentazione.

AWS DataSync copia i timestamp dei file e delle cartelle e le autorizzazioni POSIX e applica valori di default per ID utenti e gruppi. Per maggiori informazioni e per consultare l'elenco completo dei metadati copiati fai riferimento alla nostra documentazione.

AWS DataSync accede a un file system Amazon FSx per Windows File Server tramite il protocollo SMB, effettuando l'autenticazione con il nome utente e la password configurati nella Console AWS o nell'interfaccia a linea d comando. Per farlo, il servizio DataSync monta il file system internamente al VPC utilizzando interfacce di rete elastiche (ENI) gestite dal servizio stesso. DataSync, infatti, gestisce la creazione, l'utilizzo e l'eliminazione di queste interfacce in modo automatico.

AWS DataSync copia i metadati di Windows, inclusi i timestamp del file, il proprietario del file, gli attributi standard del file, la lista degli accessi discrezionali (DACL) di NTFS e le liste di controllo degli accessi al sistema NTFS (SACL). Per maggiori informazioni e per consultare l'elenco completo dei metadati copiati fai riferimento alla nostra documentazione.

Sì. Puoi utilizzare AWS DataSync per pianificare repliche periodiche del tuo file system di Amazon FSx for Windows File Server in un secondo file system nello stesso account AWS. Questa funzionalità è disponibile per sia per le implementazioni all'interno della stessa regione sia per quelle tra regioni diverse e non richiede l'utilizzo di un agente DataSync.

Quando crei un processo DataSync per copiare da o verso il tuo file system FSx per Lustre, il servizio DataSync creerà delle interfacce di rete elastiche (ENI) nello stesso VPC e nella stessa sottorete dove si trova il tuo file system.  DataSync usa queste ENI per accedere al tuo file system FSx for Lustre usando il protocollo Lustre come utente root.  Quando crei una risorsa di ubicazione DataSync per il tuo file system FSx for Lustre, puoi specificare fino a cinque gruppi di sicurezza da applicare alle ENI e configurare l'accesso in uscita dal servizio DataSync.  I gruppi di sicurezza devono essere configurati per permettere il traffico in uscita sulle porte di rete richieste da FSx per Lustre.  I gruppi di sicurezza sul tuo file system FSx for Lustre dovrebbero essere configurati per permettere l'accesso in entrata dai gruppi di sicurezza che hai assegnato alla risorsa di ubicazione DataSync per il tuo file system FSx for Lustre.

AWS DataSync copia i timestamp dei file e delle cartelle e le autorizzazioni POSIX, inclusi ID utente, ID gruppo e autorizzazioni. Per maggiori informazioni e per consultare l'elenco completo dei metadati copiati fai riferimento alla nostra documentazione.

Sì. Puoi usare AWS DataSync per copiare dal tuo file system FSx for Lustre a un secondo file system all'interno dello stesso account AWS. Questa funzionalità è disponibile per distribuzioni all'interno della stessa regione o tra regioni diverse e non richiede l'utilizzo di un agente DataSync.

Sì. Puoi utilizzare AWS DataSync per pianificare repliche periodiche del tuo file system di Amazon FSx for Lustre in un secondo file system nello stesso account AWS. Questa funzionalità è disponibile per distribuzioni all'interno della stessa regione o tra regioni diverse e non richiede l'utilizzo di un agente DataSync.

No. I file sono scritti usando la configurazione di layout e striping del file system della destinazione.

Quando crei un'attività DataSync per copiare da o verso il tuo file system FSx for OpenZFS, il servizio DataSync creerà delle interfacce di rete elastiche (ENI, Elastic Network Interface) nello stesso VPC e nella stessa sottorete dove si trova il tuo file system.  DataSync usa queste ENI per accedere al tuo file system FSx for OpenZFS usando il protocollo OpenZFS come utente root.  Quando crei una risorsa di ubicazione DataSync per il tuo file system FSx for OpenZFS, puoi specificare fino a cinque gruppi di sicurezza da applicare alle ENI e configurare l'accesso in uscita dal servizio DataSync.  I gruppi di sicurezza devono essere configurati per permettere il traffico in uscita sulle porte di rete richieste da FSx per OpenZFS. I gruppi di sicurezza sul tuo file system FSx for OpenZFS dovrebbero essere configurati per permettere l'accesso in entrata dai gruppi di sicurezza che hai assegnato alla risorsa di ubicazione DataSync per il tuo file system FSx for OpenZFS.

AWS DataSync copia i timestamp dei file e delle cartelle e le autorizzazioni POSIX, inclusi ID utente, ID gruppo e autorizzazioni. Per maggiori informazioni e per consultare l'elenco completo dei metadati copiati fai riferimento alla nostra documentazione.

Sì. Puoi usare AWS DataSync per copiare dal tuo file system FSx for OpenZFS a un secondo file system all'interno dello stesso account AWS. Questa funzionalità è disponibile per distribuzioni all'interno della stessa regione o tra regioni diverse e non richiede l'utilizzo di un agente DataSync.

Sì. Puoi utilizzare AWS DataSync per pianificare repliche periodiche del tuo file system di Amazon FSx for OpenZFS in un secondo file system nello stesso account AWS. Questa funzionalità è disponibile per sia per le implementazioni all'interno della stessa regione sia per quelle tra regioni diverse e non richiede l'utilizzo di un agente DataSync.

Durante la creazione di un'attività, DataSync crea interfacce di rete elastiche (ENI) nella sottorete preferita dello stesso VPC in cui si trova il tuo file system Amazon FSx per NetApp ONTAP. La sottorete preferita è configurata quando crei il file system FSx per ONTAP, e DataSync utilizza le ENI che crea in quella sottorete per accedere al tuo file system FSx per ONTAP. Quando crei una risorsa di ubicazione DataSync per il tuo file system FSx per ONTAP, puoi specificare fino a 5 gruppi di sicurezza da applicare alle ENI per configurare l'accesso in uscita dal servizio DataSync. Dovresti configurare i gruppi di sicurezza sul tuo file system FSx per ONTAP in modo tale da permettere l'accesso in entrata dai gruppi di sicurezza che hai assegnato alla risorsa di ubicazione DataSync per il tuo file system FSx per ONTAP.

AWS DataSync supporta l'utilizzo di NFSv3, SMB 2.1 e SMB 3. Attualmente, DataSync non supporta l'utilizzo di NFSv4 o versione successiva con FSx per ONTAP.

Sì, AWS DataSync copia i timestamp dei file e delle cartelle e le autorizzazioni POSIX, inclusi ID utente, ID gruppo e autorizzazioni quando si utilizza il protocollo NFS. Quando si utilizza il protocollo SMB, DataSync copia i timestamp dei file e delle cartelle, proprietà e ACL. Per maggiori informazioni e per consultare l'elenco completo dei metadati copiati fai riferimento alla nostra documentazione.

Durante la migrazione dai server Windows o dalle condivisioni NAS che servono gli utenti attraverso il protocollo SMB, utilizza una posizione di origine SMB DataSync e il protocollo SMB per la posizione FSx per ONTAP, assicurandoti che la sicurezza del tuo volume FSx per ONTAP sia configurata per NTFS. Durante la migrazione dai server Unix o Linux o dalle condivisioni NAS che servono gli utenti attraverso il protocollo NFS, utilizza una posizione di origine NFS DataSync e il protocollo NFS per la posizione FSx per ONTAP, assicurandoti che la sicurezza del tuo volume FSx per ONTAP sia configurata per Unix. Per le migrazioni multi-protocollo, consulta le best practice descritte nel blog Abilitazione dei carichi di lavoro multiprotocollo con Amazon FSx per NetApp ONTAP e utilizza il protocollo SMB per conservare i metadati del file system con l'accuratezza maggiore. Per ulteriori informazioni sulla configurazione della sicurezza per i volumi FSx per ONTAP, vedere la documentazione sulla gestione dei volumi FSx per ONTAP.

Sì, tuttavia dovrai creare una posizione DataSync e una risorsa attività separate per ciascun protocollo (NFS o SMB). Per evitare problemi con la sovrascrittura e la verifica dei dati, consigliamo di non utilizzare contemporaneamente attività DataSync multiple per copiare lo stesso percorso del volume (indipendentemente dal fatto che tu stia utilizzando lo stesso protocollo o protocolli diversi).

No, DataSync supporta solo la copia di dati dei file da e verso volumi FSx per ONTAP con i protocolli NFS o SMB.

Sì. AWS DataSync ti permette di copiare dal tuo file system FSx per ONTAP a un secondo file system all'interno dello stesso account AWS. Questa funzionalità è disponibile per implementazioni all'interno della stessa regione o tra regioni diverse e non richiede l'utilizzo di un agente DataSync.

Puoi usare DataSync per la replica dei dati tra i tuoi file system, ma ti consigliamo di usare NetApp SnapMirror per la replica tra i tuoi file system FSx per ONTAP. SnapMirror ti permette di avere RPO ridotti, indipendentemente dal numero o dalla dimensione dei file nel file system.

DataSync esclude automaticamente le cartelle ".snapshot". È anche possibile usare i filtri di esclusione per evitare di copiare file e cartelle che corrispondono a modelli specificati.

Spostamento da e verso i dispositivi della famiglia AWS Snow

Inizia implementando un agente DataSync nel tuo ambiente on-premises. Attiva l'agente utilizzando la Console di gestione AWS o la CLI e configura l'attività DataSync per spostare i dati tra un bucket nello spazio di archiviazione compatibile con Amazon S3 e Amazon S3, Amazon EFS o qualsiasi file system Amazon FSx.

Prestazioni

La velocità con cui AWS DataSync è in grado di copiare un determinato set di dati dipende dalla quantità di dati, dalla larghezza di banda I/O disponibile a livello di archiviazione di origine e di destinazione, dalla larghezza di banda della rete disponibile e dalle condizioni di rete. Per il trasferimento dei dati tra servizi di storage locali o AWS, una sola attività DataSync può utilizzare totalmente un link di rete di 10 Gbps.

Sì. È possibile controllare la quantità di larghezza di banda della rete che AWS DataSync utilizzerà configurando il throttling della larghezza di banda incorporato. Puoi aumentare o diminuire questo limite durante l'esecuzione dell'attività di trasferimento dei dati. In questo modo è possibile ridurre al minimo l'impatto su altri utenti o applicazioni che operano sulla stessa connessione di rete.

AWS DataSync genera parametri Amazon CloudWatch per fornire informazioni dettagliate all'interno del processo di trasferimento. Utilizzando questi parametri, è possibile visualizzare il numero di file e il totale dei dati copiati, ma anche i processi di scoperta e verifica dei file. Puoi vedere i grafici CloudWatch con questi parametri direttamente nella console di DataSync.

A seconda della capacità dell'archivio file on-premises e della quantità e dimensione dei file da trasferire, AWS DataSync può influire sui tempi di risposta di altri client quando accedono allo stesso data store di origine, a causa delle sue operazioni di lettura e scrittura dal sistema di archiviazione. Ti consigliamo di configurare una limitazione alla larghezza di banda per ridurre le operazioni di I/O sul sistema di archiviazione.

Sicurezza e conformità

AWS DataSync Discovery utilizza l'agente DataSync per accedere alle interfacce di gestione/API dei sistemi di archiviazione. Tutti gli accessi sono di sola lettura. Per maggiori informazioni sulle API usate per accedere allo spazio di archiviazione, consulta la documentazione su DataSync.

Quando configuri AWS DataSync Discovery per rilevare il tuo sistema di archiviazione, fornisci un nome utente e una password per accedere all'interfaccia API dell’archiviazione. AWS DataSync Discovery creerà quindi automaticamente un segreto in AWS Secrets Manager per archiviare le credenziali. Quando esegue un processo di individuazione, DataSync Discovery recupera la password dal segreto, la crittografa nuovamente e invia la password crittografata all'agente impiegato per il processo. La password viene mantenuta in memoria sull'agente solo per la durata del processo e non viene mai conservata all'esterno della memoria.

Sì. Tutti i dati trasferiti tra origine e destinazione sono crittografati tramite Transport Layer Security (TLS), che sostituisce il protocollo SSL (Secure Socket Layer). I dati non vengono mai conservati in AWS DataSync. Il servizio supporta l'utilizzo della crittografia di default per i bucket S3, la crittografia di file system Amazon EFS dei dati inattivi e la crittografia dei dati a riposo e in transito di Amazon FSx.

AWS DataSync impiega un agente da distribuire nell'ambiente IT o in Amazon EC2 per accedere ai file tramite il protocollo NFS o SMB. Tali agenti si connettono agli endpoint del servizio DataSync all'interno di AWS e possono essere gestiti in modo sicuro tramite la Console di gestione AWS o la CLI.

AWS DataSync impiega un agente da implementare nell'ambiente IT o in Amazon EC2 per accedere al cluster Hadoop. L'agente DataSync funge da client HDFS e comunica con NameNodes e DataNodes nei cluster. Quando avvii un processo, DataSync interroga il NameNode primario per determinare le posizioni di file e cartelle nel cluster. DataSync comunica quindi con i DataNode nel cluster per copiare file e cartelle su o da HDFS.

AWS DataSync impiega un agente da implementare nel data center o nell'ambiente cloud pubblico o in Amazon EC2 per accedere agli oggetti utilizzando l'API Amazon S3. Tali agenti si connettono agli endpoint del servizio DataSync all'interno di AWS e possono essere gestiti in modo sicuro tramite la Console di gestione AWS o la CLI.

AWS DataSync utilizza un agente che viene implementato nel tuo ambiente Azure o in Amazon EC2 per accedere agli oggetti nei tuoi container Azure Blob Storage. Tali agenti si connettono agli endpoint del servizio DataSync all'interno di AWS e possono essere gestiti in modo sicuro tramite la Console di gestione AWS o la CLI. L'agente esegue l'autenticazione nel container di Azure utilizzando un token SAS specificato durante la creazione di una posizione BLOB di Azure DataSync.

No. Quando i dati vengono copiati da o sul sistema locale, non c'è bisogno di impostare una VPN/tunnel o consentire le connessioni in entrata. Il tuo agente AWS DataSync può essere configurato per effettuare il routing attraverso un firewall utilizzando porte di rete standard. È finalmente possibile implementare DataSync nel tuo Amazon Virtual Private Cloud (Amazon VPC) utilizzando gli endpoint VPC. Quando si utilizzano gli endpoint VPC, i dati trasferiti tra l'agente DataSync e il servizio AWS non devono attraversare la rete Internet pubblica né richiedono indirizzi IP pubblici.

Il tuo agente AWS DataSync si connette agli endpoint del servizio DataSync nella regione AWS prescelta. Puoi scegliere di avere un agente che si colleghi a endpoint rivolti verso una rete Internet pubblica, endpoint convalidati FIPS (Federal Information Processing Standards) o a endpoint in uno dei tuoi VPC. Durante l'attivazione, il tuo agente viene associato in modo sicuro al tuo account AWS. Per saperne di più, consulta Scegliere un endpoint del servizio e Attivare l’agente.

Gli aggiornamenti alla macchina virtuale agente, tra cui il sistema operativo sottostante e i pacchetti software AWS DataSync, sono applicati automaticamente da AWS una volta attivato l'agente. Gli aggiornamenti vengono applicati in modo non invadente quando l'agente è a riposo e non sta eseguendo alcuna attività di trasferimento dati.

AWS ha il programma di conformità più longevo del cloud. AWS si impegna ad aiutare i clienti soddisfacendo i loro requisiti. AWS DataSync è stato sottoposto a valutazioni che certificano la sua conformità agli standard di sicurezza globali e di settore. DataSync è conforme agli standard PCI DSS, ISO 9001, 27001, 27017, 27018 e SOC 1, 2 e 3 ed è idoneo ai fini HIPAA. DataSync è inoltre conforme al programma FedRAMP Moderate nelle regioni AWS Stati Uniti orientali e occidentali e al programma FedRamp High nelle regioni AWS GovCloud (Stati Uniti). In questo modo è più semplice verificare la nostra sicurezza e soddisfare i tuoi obblighi normativi. Per ulteriori informazioni e risorse, consulta le pagine sulla conformità. Puoi anche passare alla pagina Servizi AWS coperti dal programma di conformità per consultare un elenco completo di servizi e certificazioni.

Sì. AWS DataSync è conforme allo standard PCI-DSS e può pertanto essere utilizzato per il trasferimento di informazioni di pagamento. Per informazioni su come ottenere la conformità PCI su AWS, scarica il pacchetto di conformità PCI in AWS Artifact.

Sì. AWS DataSync è idoneo ai fini HIPAA, perciò se disponi di un BAA HIPAA con AWS potrai impiegare DataSync per trasferire informazioni sanitarie protette.

Sì. AWS DataSync ha ottenuto un'autorizzazione P-ATO (Provisional Authority to Operate) dal Joint Authorization Board (JAB) in virtù della baseline Moderate del Federal Risk and Authorization Management Program (FedRAMP) per le regioni degli Stati Uniti occidentali e orientali. Se sei un cliente federale o commerciale, puoi usare AWS DataSync nel confine di autorizzazione delle regioni AWS Stati Uniti orientali e occidentali per i dati fino a un livello di impatto moderato.

Sì. AWS DataSync ha ottenuto un'autorizzazione P-ATO (Provisional Authority to Operate) dal Joint Authorization Board (JAB) in virtù della baseline High del Federal Risk and Authorization Management Program (FedRAMP) per la regione GovCloud (Stati Uniti). Se sei un cliente federale o commerciale, puoi usare AWS DataSync nel confine di autorizzazione delle regioni AWS GovCloud (Stati Uniti) per i dati fino a un livello di impatto elevato.

Quando scegliere AWS DataSync

AWS DataSync automatizza e accelera completamente lo spostamento di grandi set di dati attivi in AWS. È da sempre integrato con Amazon S3, Amazon EFS, Amazon FSx, Amazon CloudWatch e AWS CloudTrail, che fornisce un accesso continuo e sicuro ai tuoi servizi di archiviazione e un monitoraggio dettagliato del trasferimento.

DataSync utilizza un protocollo di rete specifico e un'architettura scalabile per trasferire i dati. Per il trasferimento dei dati tra servizi di storage locali o AWS, una sola attività DataSync può utilizzare totalmente un link di rete di 10 Gbps.

DataSync automatizza completamente il processo di trasferimento dei dati. Il servizio è fornito con meccanismi incorporati per effettuare più tentativi e garantire la resilienza della rete, ottimizzazioni di rete, pianificazione delle attività integrata, controllo tramite i report sulle attività, monitoraggio tramite l'API e la console di DataSync e parametri, eventi e log di CloudWatch che forniscono una visibilità granulare sul processo di trasferimento. DataSync verifica l'integrità dei dati sia durante il trasferimento che al termine dello stesso.

DataSync fornisce sicurezza end-to-end e si integra direttamente con i servizi di archiviazione AWS. Tutti i dati trasferiti tra l'origine e la destinazione sono crittografati utilizzando TLS ed è possibile accedere allo spazio di archiviazione AWS attraverso meccanismi di sicurezza AWS integrati quali i ruoli IAM. L'abilitazione degli endpoint VPC su DataSync assicura che i dati trasferiti tra l'organizzazione e AWS non attraversino la rete Internet pubblica, il che aumenta la sicurezza dei dati quando vengono copiati sulla rete.

AWS fornisce vari strumenti per copiare gli oggetti tra i bucket.

Utilizza AWS DataSync per la distribuzione di dati continua, le pipeline di dati e l'acquisizione di data lake, ma anche per il consolidamento e la suddivisione dei dati tra più bucket.

Utilizza la replica di S3 per le repliche continue dei dati in un bucket di destinazione specifico.

Utilizza invece Operazioni batch S3 per le operazioni in batch su larga scala sugli oggetti S3, ad esempio per copiare gli oggetti, impostare i tag degli oggetti o le liste di controllo degli accessi (ACL), attivare il ripristino degli oggetti da Recupero flessibile Amazon S3 Glacier (ex S3 Glacier), richiamare una funzione AWS Lambda per effettuare operazioni personalizzate con i tuoi oggetti, gestire la conservazione a fini legali di S3 Object Lock o gestire le date di conservazione di S3 Object Lock.

AWS DataSync è ideale per i trasferimenti di dati online. Puoi utilizzare DataSync per migrare i dati attivi in AWS, trasferire i dati al cloud per l'analisi e l'elaborazione, archiviare i dati per liberare la capacità di storage locale o replicare i dati in AWS per la business continuity.

Edge AWS Snowball è ideale per i trasferimenti di dati offline, per i clienti che hanno problemi di limitazione di banda o per quelli che devono trasferire dati da ambienti remoti, privi di connessione o proibitivi. 

Utilizza AWS DataSync per migrare i dati esistenti in Amazon S3 e poi utilizza la configurazione di Gateway di file di Gateway di archiviazione AWS per ritenere l'accesso ai dati migrati e per gli aggiornamenti continui dalle tue applicazioni basate su file on-premises.

Puoi utilizzare una combinazione di DataSync e File Gateway per minimizzare la tua infrastruttura in locale durante la connessione continua delle applicazioni locali al tuo storage in cloud. AWS DataSync ti permette di automatizzare e accelerare il trasferimento di dati online nei servizi di storage di AWS. Dopo la fase iniziale di trasferimento dei dati con AWS DataSync, File Gateway fornisce alle tue applicazioni in locale un accesso a bassa latenza ai dati migrati. Quando utilizzi DataSync con le condivisioni NFS, i metadati POSIX del tuo storage in locale di origine vengono conservati e vengono applicate le autorizzazioni dello storage di origine durante l'accesso ai file con File Gateway.

Se le applicazioni sono già integrate con l'API Amazon S3 e desideri un throughput maggiore per il trasferimento di file di grandi dimensioni in S3, puoi utilizzare S3 Transfer Acceleration. Se vuoi trasferire dati da sistemi di archiviazione esistenti (ad esempio Network Attached Storage) oppure da strumenti non modificabili (ad esempio sequenziatori di DNA e videocamere) o se invece desideri più destinazioni, ti consigliamo di utilizzare AWS DataSync. DataSync inoltre automatizza e semplifica il trasferimento dei dati offrendo funzionalità aggiuntive come meccanismi incorporati per effettuare più tentativi e garantire la resilienza della rete, verifiche per l'integrità dei dati e configurazione flessibile per rispondere alle tue necessità specifiche, inclusa la limitazione della larghezza di banda della rete e così via.

Se al momento utilizzi SFTP per scambiare dati con parti terze, AWS Transfer Family fornisce un trasferimento SFTP, FTPS, FTP e AS2 completamente gestito direttamente da e verso Amazon S3, riducendo così il tuo carico operativo.

Se è necessario un trasferimento di dati accelerato e automatizzato tra server NFS, condivisioni di file SMB, cluster Hadoop, archiviazione di oggetti autogestito o archiviazione di oggetti nel cloud, Amazon S3, Amazon EFS e Amazon FSx, consigliamo l'utilizzo di AWS DataSync. DataSync è ideale per i clienti che necessitano di migrazioni online per set di dati attivi, trasferimenti tempestivi di dati in costante generazione e replica per mantenere la continuità aziendale.