Preguntas frecuentes sobre AWS DataSync

Aspectos generales

¿Qué es AWS DataSync?

AWS DataSync es un servicio de detección y transferencia de datos en línea que simplifica y acelera las migraciones de datos a AWS, además de transferir datos desde y hacia el almacenamiento local, las ubicaciones periféricas, otros proveedores de servicios en la nube y servicios de almacenamiento de AWS.

AWS DataSync Discovery le permite simplificar la planificación de la migración y acelerar la migración de sus datos a AWS al brindarle visibilidad sobre el rendimiento y la utilización de su almacenamiento local, además de brindar recomendaciones para migrar sus datos a los servicios de almacenamiento de AWS. DataSync Discovery le permite comprender mejor el uso de la capacidad y el rendimiento del almacenamiento local a través de la recopilación y el análisis automatizados de datos, lo que le permite identificar rápidamente datos que debe migrar y recomendaciones generadas por el uso para seleccionar servicios de almacenamiento de AWS que se ajusten a sus necesidades de rendimiento y de capacidad.

Para las transferencias de datos en línea, AWS DataSync simplifica, automatiza y agiliza la copia de grandes cantidades de datos desde y hacia el almacenamiento local, las ubicaciones periféricas, otros proveedores de servicios en la nube y servicios de almacenamiento de AWS. DataSync puede copiar datos a y desde recursos compartidos del Sistema de archivos de red (NFS), recursos compartidos del Bloque de mensajes de servidor (SMB), Sistemas de archivos distribuidos de Hadoop (HDFS), almacenamiento de objetos autoadministrados, almacenamiento de objetos en otras nubes como Google Cloud Storage y Wasabi Cloud Storage (consulte la lista completa de nubes compatibles), Azure Files, Azure Blob Storage (incluidas Azure Data Lake Storage Gen2), Almacenamiento compatible con Amazon S3 en Snow, Amazon Simple Storage Service (Amazon S3), sistemas de archivos Amazon Elastic File System (Amazon EFS), sistemas de archivos Amazon FSx para Windows File Server, sistemas de archivos Amazon FSx para Lustre, sistemas de archivos Amazon FSx para OpenZFS y sistemas de archivos Amazon FSx para NetApp ONTAP.

¿Por qué debería usar AWS DataSync?

AWS DataSync le permite detectar y transferir sus datos de forma rápida y segura. Con DataSync Discovery, puede comprender mejor el uso de su almacenamiento local y recibir recomendaciones con las que fundamentar sus estimaciones de costos y planes para migrar a AWS. Para la transferencia de datos, puede usar DataSync para copiar grandes conjuntos de datos con millones de archivos sin tener que crear soluciones personalizadas con herramientas de código abierto o adquirir licencias y administrar un costoso software de aceleración de redes comerciales. Puede usar DataSync para migrar datos activos a AWS, archivar datos para liberar capacidad de almacenamiento local, replicar datos en AWS para la continuidad empresarial o transferir datos a la nube para su análisis y procesamiento.

¿Qué problemas resuelve AWS DataSync?

AWS DataSync reduce la complejidad y el costo de la transferencia de datos en línea. De este modo, se simplifica la transferencia de conjuntos de datos desde y hacia el almacenamiento local, las ubicaciones periféricas, otros proveedores de servicios en la nube y servicios de almacenamiento de AWS. DataSync se conecta a los sistemas de almacenamiento existentes y a los orígenes de datos con protocolos de almacenamiento estándar (NFS, SMB), como cliente de HDFS, mediante la API de Amazon S3 o mediante otras API de almacenamiento de otras nubes. Usa un protocolo de red personalizado y arquitectura escalable para acelerar la transferencia de datos entre los sistemas de almacenamiento y el servicio de AWS. DataSync maneja el traslado de archivos y objetos, la programación de las transferencias de datos, el monitoreo del progreso de las transferencias, el cifrado, la verificación de las transferencias de datos y su notificación sobre cualquier problema.

¿Qué problema resuelve AWS DataSync Discovery?

Detección

¿Qué sistemas de almacenamiento son compatibles con AWS DataSync Discovery?

AWS DataSync Discovery es compatible actualmente con las matrices de las series FAS y AFF de NetApp que ejecutan ONTAP 9.7 o una versión posterior. Con el tiempo se agregará compatibilidad con sistemas de almacenamiento adicionales.

¿Qué información recopila AWS DataSync Discovery sobre mi sistema de almacenamiento?

AWS DataSync Discovery usa su interfaz API de administración de almacenamiento para recopilar información sobre su sistema de almacenamiento junto con métricas de rendimiento y uso. La información del sistema incluye atributos como la capacidad de almacenamiento total, la configuración del volumen, exportar o compartir nombres, etc. Las métricas del sistema de almacenamiento incluyen el rendimiento, como el rendimiento del volumen y las IOPS, junto con las métricas de uso, como la capacidad asignada y usada. DataSync Discovery usa la información y las métricas recopiladas del sistema para generar recomendaciones para migrar al almacenamiento de AWS.

¿Cómo determina AWS DataSync Discovery sus recomendaciones?

AWS DataSync Discovery analiza los datos recopilados de su sistema de almacenamiento local y los compara con las características, la capacidad y las funciones de rendimiento de los servicios de almacenamiento de AWS. Cuando corresponda, DataSync Discovery recomendará uno o más servicios de almacenamiento de AWS para su consideración.

¿Puedo usar AWS DataSync Discovery con mis sistemas de producción? ¿Qué efecto tendrá en mis usuarios y aplicaciones?

El uso de AWS DataSync Discovery con sus sistemas de almacenamiento local no afectará de forma notable a los usuarios ni a las aplicaciones.

¿Dónde almacena AWS DataSync Discovery los datos recopilados sobre mis sistemas de almacenamiento?

El servicio DataSync almacenará y administrará los datos recopilados. Los datos se pueden ver en la consola de AWS DataSync o se puede acceder a ellos mediante la AWS CLI o el kit de desarrollo de software (SDK) de AWS.

¿Cuánto tiempo almacena AWS DataSync Discovery los datos recopilados por un trabajo de detección?

Los datos recopilados y las recomendaciones se retendrán durante los 60 días siguientes a la finalización de un trabajo de detección.

Migración de datos

¿A dónde y desde dónde se pueden transferir los datos?

DataSync admite los siguientes tipos de ubicaciones de almacenamiento: Recursos compartidos de Network File System (NFS), recursos compartidos de Server Message Block (SMB), sistema de archivos distribuidos de Hadoop (HDFS), almacenamiento de objetos autoadministrado, almacenamiento de objetos en otras nubes como Google Cloud Storage y Wasabi Cloud Storage (consulte la lista completa de nubes compatibles), Azure Files, Azure Blob Storage (incluido Azure Data Lake Storage Gen2), almacenamiento compatible con Amazon S3 en Snow, Amazon Simple Storage Service (Amazon S3), sistemas de archivos Amazon Elastic File System (Amazon EFS), sistemas de archivos Amazon FSx para Windows File Server, sistemas de archivos de Amazon FSx para Lustre, sistemas de archivos Amazon FSx para OpenZFS y sistemas de archivos Amazon FSx para NetApp ONTAP.

¿Cómo se usa AWS DataSync para migrar datos a AWS?

Puede usar AWS DataSync para migrar datos ubicados de forma local, en la periferia o en otras nubes a Amazon S3, Amazon EFS, Amazon FSx para Windows File Server, Amazon FSx para Lustre, Amazon FSx para OpenZFS y Amazon FSx para NetApp ONTAP. Configure DataSync para hacer una copia inicial de todo el conjunto de datos, y programe transferencias progresivas posteriores de datos cambiantes hasta la transición final desde los datos en las instalaciones a AWS. DataSync incluye cifrado y validación de integridad para ayudarlo a garantizar que sus datos lleguen de manera segura, intacta y lista para usar. A fin de disminuir el impacto sobre las cargas de trabajo que utilizan su conexión de red, puede programar su migración para que se ejecute durante las horas no pico, o limitar el ancho de banda de la red que DataSync usa mediante la configuración del limitador de ancho de banda integrado. DataSync conserva los metadatos entre sistemas de almacenamiento que tienen estructuras de metadatos similares, lo que permite realizar una transición suave de usuarios finales y aplicaciones al usar su servicio de almacenamiento de AWS de destino.

Lea la publicación del blog de almacenamiento, “Migrating storage with AWS DataSync” (Migración de almacenamiento con AWS DataSync) para obtener consejos y más información sobre las prácticas recomendadas de migración.

¿Cómo uso AWS DataSync para archivar datos inactivos?

Puede utilizar AWS DataSync para transferir datos inactivos desde los sistemas de almacenamiento locales directamente hasta ubicaciones de almacenamiento a largo plazo duraderas y seguras, como Amazon S3 Glacier Flexible Retrieval (antes conocido como S3 Glacier) o Amazon S3 Glacier Deep Archive. Use los filtros de exclusión de DataSync para excluir la copia de archivos y carpetas temporales o use los filtros de inclusión o manifiestos para copiar solo un subconjunto de archivos de su ubicación de origen. Puede seleccionar el servicio de almacenamiento más rentable según sus necesidades: transfiera datos a cualquier clase de almacenamiento de S3 o use DataSync con la administración del ciclo de vida de EFS para almacenar los datos en la clase de almacenamiento Amazon EFS Infrequent Access (EFS IA). Use la funcionalidad para programación de tareas integrada si desea archivar periódicamente los datos que se deben retener con fines de conformidad o auditoría, como registros, imágenes de video sin procesar o registros médicos electrónicos.

¿Cómo uso AWS DataSync para replicar los datos en AWS a fin de garantizar la continuidad empresarial?

Con AWS DataSync, puede replicar periódicamente archivos en cualquier clase de almacenamiento de Amazon S3 o enviar los datos a Amazon EFS, Amazon FSx para Windows File Server, Amazon FSx para Lustre, Amazon FSx para OpenZFS o Amazon FSx para NetApp ONTAP para un sistema de archivos en espera. Use la funcionalidad para programación de tareas integrada a fin de garantizar que los cambios en el conjunto de datos se copien periódicamente en el almacenamiento de destino. Lea esta publicación del blog sobre AWS Storage para obtener más información acerca de cómo proteger los datos con AWS DataSync.

¿Cómo utilizo AWS DataSync para transferencias recurrentes entre el almacenamiento local y AWS para flujos de trabajo continuos?

Puede usar AWS DataSync para transferencias continuas desde sistemas locales a AWS o desde AWS para su procesamiento. DataSync permite acelerar los flujos de trabajo de almacenamiento híbrido y crítico en la nube en sectores que necesitan transferir archivos a AWS rápidamente. Eso incluye aprendizaje automático en ciencias biológicas, creación de videos con contenido multimedia y de entretenimiento, análisis de big data en servicios financieros e investigación sísmica en el área de petróleo y gas. DataSync ofrece una entrega oportuna para garantizar que los procesos dependientes no se demoren. Puede especificar filtros de exclusión o inclusión o manifiestos para especificar qué archivos u objetos se deben transferir cada vez que se ejecute la tarea.

¿Se puede utilizar AWS DataSync para copiar datos procedentes de otras nubes en AWS?

Sí. Con AWS DataSync, puede copiar datos de Google Cloud Storage mediante la API de Amazon S3, de Azure Files mediante el protocolo SMB o de Azure Blob Storage, incluido Azure Data Lake Storage Gen 2. También puede transferir datos de otros sistemas de almacenamiento en la nube, como Wasabi Cloud Storage, Cloudflare R2 Storage, DigitalOcean Spaces y Backblaze B2 Cloud Storage (consulte la lista completa de nubes compatibles). Implemente el agente de DataSync en el entorno en la nube o en Amazon EC2, cree las ubicaciones de origen y destino y, a continuación, inicie la tarea para comenzar a copiar los datos. Obtenga más información sobre las soluciones de AWS para entornos híbridos y multinube.

¿Se puede utilizar AWS DataSync para crear un lago de datos?

Sí. Es fácil crear un lago de datos con AWS DataSync, mediante la automatización de la transferencia de conjuntos de datos locales o de datos en otras nubes a Amazon S3. DataSync permite una transferencia sencilla y rápida de todo el conjunto de datos mediante protocolos de almacenamiento estándar (NFS, SMB), como cliente de HDFS, la API de Amazon S3 o usando otras API de almacenamiento de otras nubes. Después de transferir el conjunto de datos inicial, puede programar transferencias posteriores de nuevos datos a AWS. DataSync incluye el cifrado y la validación de la integridad para garantizar que los datos lleguen seguros, intactos y listos para su uso. A fin de disminuir el impacto sobre las cargas de trabajo que utilizan su conexión de red, puede programar las tareas de transferencia para que se ejecuten durante las horas de menor demanda, o limitar el ancho de banda de la red que DataSync usa mediante la configuración del limitador de ancho de banda integrado. Cuando los datos estén depositados en Amazon S3, podrá usar servicios de AWS nativos para ejecutar aplicaciones de análisis de big data, inteligencia artificial (IA), aprendizaje automático, informática de alto rendimiento y procesamiento de datos multimedia para obtener información a partir de conjuntos de datos no estructurados. Consulte la página web sobre almacenamiento en lagos de datos de AWS para obtener más información sobre la creación y cómo sacarle partido a su lago de datos.

¿Cómo uso AWS DataSync para transferir datos entre los servicios de AWS Storage?

Puede usar DataSync para transferir archivos u objetos entre Amazon S3, Amazon EFS, Amazon FSx para Windows File Server, Amazon FSx para Lustre, Amazon FSx para OpenZFS o Amazon FSx para NetApp ONTAP dentro de la misma cuenta de AWS. Puede transferir datos entre los servicios de AWS en la misma región de AWS, entre los servicios en regiones comerciales diferentes de AWS en China o entre regiones de AWS GovCloud (Este y Oeste de EE. UU.). Esto no requiere implementar un agente de DataSync y se puede configurar de extremo a extremo mediante la consola de AWS DataSync, la interfaz de línea de comandos (CLI) o el kit de desarrollo de software (SDK) de AWS.

¿Puedo usar AWS DataSync para migrar a Amazon WorkDocs?

Sí. AWS DataSync acelera un paso necesario para el servicio de migración de Amazon WorkDocs mediante la automatización de la carga de archivos al bucket de Amazon S3 que se usa para la migración. DataSync facilita y agiliza la migración de directorios principales y archivos compartidos de departamentos a WorkDocs. Para obtener más información acerca de cómo usar DataSync para migrar a WorkDocs, lea la publicación de blog “Migrating network file shares to Amazon WorkDocs using AWS DataSync” (Migración de archivos compartidos de red a Amazon WorkDocs mediante AWS DataSync).

Uso

¿Cómo comienzo a usar AWS DataSync Discovery?

Comience por desplegar un agente de AWS DataSync en su entorno de VM local. Con la consola, la CLI o el SDK de DataSync, configure DataSync Discovery para conectarse a su almacenamiento local y ejecutar trabajos de detección para recopilar datos sobre su sistema de almacenamiento junto con métricas de rendimiento, capacidad y uso. La información sobre sus sistemas de almacenamiento se puede ver desde los tableros en la consola de DataSync mientras se ejecutan los trabajos de detección. Los datos recopilados se analizan para generar recomendaciones para migrar a los servicios de almacenamiento de AWS, como Amazon EFS, Amazon FSx y Amazon S3 al completar un trabajo de detección. Estas recomendaciones se pueden usar para guiar su selección de servicios de AWS Storage y puede usar AWS DataSync para transferir sus datos.

¿Cómo comienzo a transferir mis datos con AWS DataSync?

Puede transferir los datos mediante AWS DataSync con unos pocos clics en la Consola de administración de AWS o mediante la interfaz de la línea de comandos (CLI) de AWS. Para comenzar, siga estos tres pasos:

1. Para transferir datos entre sistemas de almacenamiento locales, en la periferia o en otras nubes y los servicios de almacenamiento de AWS, despliegue un agente: despliegue un agente de DataSync y asócielo a la cuenta de AWS mediante la consola de administración o la API. El agente se utilizará para acceder al servidor NFS, al recurso compartido de archivos SMB, al clúster Hadoop o al almacenamiento de objetos autoadministrado o en la nube para leer o escribir datos. No es necesario implementar un agente para transferir datos entre los servicios de almacenamiento de AWS en la misma cuenta de AWS.

2. Cree una tarea de transferencia de datos: cree una tarea especificando la ubicación del origen y el destino de los datos, y cualquier opción que desee usar para configurar la transferencia, como la programación de las tareas y la habilitación de los informes de tareas.

3. Inicie la transferencia: inicie la tarea, monitoree la transferencia de datos en la consola o con Amazon CloudWatch y audite las tareas de transferencia mediante informes de tareas.

¿Cómo despliego un agente de AWS DataSync?

Despliegue un agente de AWS DataSync en el hipervisor local, en el entorno de la nube pública o en Amazon EC2. Para copiar datos en un servidor de archivos local o en un almacenamiento compatible con Amazon S3 en Snow, o desde estos, descargue la imagen de la máquina virtual del agente desde la consola de AWS e impleméntela en VMware ESXi, la máquina virtual basada en el kernel (KVM) de Linux o en el hipervisor Microsoft Hyper-V local. El agente debe desplegarse para que pueda acceder al servidor de archivos mediante los protocolos NFS y SMB, acceder a NameNodes y DataNodes en el clúster de Hadoop o acceder al almacenamiento de objetos mediante la API de Amazon S3. Para configurar transferencias entre el S3 en los buckets de AWS Outposts y los buckets de S3 en las regiones de AWS, despliegue el agente en su Outpost.

Al copiar datos entre su entorno de nube pública y AWS Storage, puede implementar el agente DataSync en su entorno de nube o en Amazon EC2. Dado que AWS DataSync comprime los datos en vuelo entre el agente de AWS DataSync y los servicios de almacenamiento de AWS, es posible que pueda reducir las tarifas de salida mediante la implementación del agente de AWS DataSync en su entorno de nube pública.

No es necesario implementar un agente para transferir datos entre los servicios de almacenamiento de AWS en la misma cuenta de AWS. Para copiar datos de un servidor de archivos autoadministrados en la nube o en él, o entre los servicios de AWS Storage en diferentes cuentas de AWS, lance una instancia de Amazon EC2 con una AMI del agente de DataSync.

¿Cuáles son los recursos necesarios para ejecutar el agente de AWS DataSync?

Los recursos mínimos que necesita para ejecutar el agente se pueden consultar aquí.

¿Cómo inicio una tarea de transferencia de datos de AWS DataSync?

AWS DataSync copia los datos cuando se inicia una tarea mediante la Consola de administración de AWS o la Interfaz de la línea de comandos (CLI) de AWS. Cada vez que se ejecuta una tarea, se analizan el origen y el destino en busca de cambios y se realiza una copia de cualquier diferencia entre los datos y los metadatos del origen y el destino. Puede configurar qué características del origen se usarán para determinar las diferencias, definir filtros de inclusión y exclusión o manifiestos para transferir los datos de archivos y objetos específicos y controlar si los archivos u objetos en el destino deben sobrescribirse cuando se cambian en el origen o eliminarse cuando no se encuentran en el origen.

¿Cuál es la diferencia entre las tareas del modo Básico y las del modo Mejorado?

Una tarea del modo Básico está sujeta a cuotas en cuanto al número de archivos y objetos de un conjunto de datos. El modo Básico prepara, transfiere y verifica de forma secuencial los archivos y objetos de un conjunto de datos, lo que lo hace más lento que el modo mejorado para la mayoría de las cargas de trabajo. Con el modo Mejorado, puede transferir conjuntos de datos con un número prácticamente ilimitado de objetos a niveles de rendimiento más altos que en el modo Básico. Las tareas del modo Mejorado optimizan y agilizan el proceso de transferencia de datos al enumerar, preparar, transferir y verificar los datos en paralelo. También obtiene capacidades mejoradas de métricas e informes, lo que facilita el seguimiento y la administración de grandes transferencias de datos. El modo Mejorado está disponible actualmente para las transferencias entre ubicaciones de Amazon S3. El modo Básico admite todos los tipos de ubicación de DataSync disponibles en la actualidad. Consulte la documentación de DataSync para obtener una lista detallada de las diferencias entre los modos de tarea. Consulte la página de precios de DataSync para ver las diferencias de precios entre los modos de tarea.

¿Cómo se asegura AWS DataSync de que mis archivos se hayan copiado de forma correcta?

Como AWS DataSync transfiere y almacena datos, realiza controles de integridad para garantizar que los datos escritos en el destino coincidan con los datos leídos en el origen. Además, se puede realización un control de verificación opcional para comparar el origen y el destino una vez finalizada la transferencia. DataSync calculará y comparará las sumas de comprobación de todos los archivos de los datos almacenados en el origen y en el destino. Puede verificar todo el conjunto de datos o solo los archivos u objetos que DataSync transfirió.

¿Cómo puedo auditar y monitorear el estado de los datos que AWS DataSync está transfiriendo?

Puede usar los informes de tareas para auditar sus procesos de transferencia de datos verificando las operaciones de transferencia en todas las ejecuciones de tareas. Con los informes de tareas, puede obtener un informe resumido junto con informes detallados de todos los archivos transferidos, omitidos, verificados y eliminados, para cada ejecución de tareas. Los informes de tareas proporcionan el número total de archivos y bytes transferidos, e incluyen los atributos del archivo, como el tamaño, la ruta, las marcas temporales, las sumas de comprobación de los archivos y los ID de versión del objeto, si procede. También puede aprovechar AWS Glue, Amazon Athena y Amazon QuickSight para catalogar, consultar y visualizar automáticamente los informes de tareas a fin de obtener información fundamental sobre sus procesos de transferencia de datos.

R: Puede usar la consola de administración de AWS o AWS CLI para controlar el estado y el progreso de los datos que se están transfiriendo. Con las métricas de Amazon CloudWatch, puede ver el número de archivos y de datos que se ha copiado. También puede activar el registro de archivos individuales en Registros de CloudWatch para identificar las transferencias que se han producido en un momento específico, además de los resultados de verificación de integridad del contenido que realiza DataSync.

En conjunto, estas soluciones simplifican la auditoría, la supervisión, la generación de informes y la solución de problemas, y le permiten proporcionar actualizaciones oportunas a las partes interesadas.

¿Puedo filtrar los archivos y las carpetas que transfiere AWS DataSync?

Sí. Puede especificar un filtro de exclusión, un filtro de inclusión, o ambos, para limitar qué archivos, carpetas u objetos deben transferirse cada vez que se ejecute una tarea. Como alternativa, puede usar manifiestos para especificar un subconjunto de archivos u objetos que se deben transferir desde su ubicación de origen.

Los filtros de inclusión especifican las rutas de archivo y carpeta o claves de objeto que deben incluirse cuando la tarea se ejecuta y limita el alcance de lo que DataSync analiza en el origen y el destino. Los filtros de exclusión especifican las rutas de archivo y carpeta o las claves de objeto que deben excluirse de la copia. Al crear o actualizar una tarea, puede configurar los filtros de exclusión e inclusión. Al comenzar una tarea, puede anular y actualizar los filtros configurados en la tarea. Consulte este blog sobre almacenamiento de AWS para obtener más información sobre el uso de filtros comunes con DataSync.

Un manifiesto es un archivo con formato CSV que enumera las rutas de archivo o claves de objeto que deben incluirse cuando se ejecuta la tarea y limita el alcance de lo que DataSync analiza en el origen y el destino. Al crear o actualizar una tarea, puede proporcionar un archivo de manifiesto con millones de archivos u objetos de origen y DataSync solo comparará y transferirá los archivos que figuran en el manifiesto. Al iniciar una tarea, puede anular y actualizar el archivo de manifiesto. Al copiar datos de Amazon S3, también puede especificar un ID de versión de S3 opcional de cada objeto que desee transferir. Para obtener más información, lea este blog.

Tenga en cuenta que los filtros y los manifiestos no se pueden usar juntos.

¿En qué se diferencia el uso de un archivo de manifiesto del uso de filtros de inclusión?

Un manifiesto es una lista explícita de archivos u objetos que se van a transferir desde la ubicación de origen, mientras que un filtro de inclusión es una cadena que especifica los patrones de archivos y carpetas que se van a transferir desde el origen. Solo se copian los archivos y carpetas que coinciden con los patrones del filtro. Un patrón puede ser una ruta completa de archivo o carpeta, o un prefijo que termine con un carácter comodín (*), lo que indica que se deben copiar todos los archivos u objetos que coincidan con el prefijo. Los filtros de inclusión son ideales para los clientes que solo desean copiar un pequeño conjunto de archivos u objetos, o algunas carpetas específicas. Los clientes con conjuntos de datos conocidos, como los que se mueven como parte de un flujo de trabajo automatizado, pueden usar manifiestos para evitar escanear todos sus sistemas de almacenamiento de archivos u objetos para determinar los cambios. Con un archivo de manifiesto, los clientes pueden especificar millones de archivos u objetos de origen para transferirlos y DataSync solo comparará los archivos que figuren en el manifiesto. Los clientes también pueden usar manifiestos para copiar versiones específicas de objetos de su bucket de Amazon S3.

¿Puedo configurar AWS DataSync para transferir según una programación?

Sí. Puede organizar sus tareas con la consola AWS DataSync o la interfaz de línea de comandos (CLI) AWS, sin necesidad de escribir ni ejecutar scripts para administrar las transferencias repetidas. La organización de las tareas ejecuta, de manera automática, las tareas según el programa que configuró, con opciones cada hora, por día o semanales, que se indican directamente en la consola. Esto le permite garantizar que los cambios en el conjunto de datos se detectan y copian automáticamente en el almacenamiento de destino.

¿AWS DataSync conserva la estructura del directorio cuando copia archivos?

Sí. Cuando transfiere archivos, AWS DataSync crea la misma estructura de directorio en el destino que en la ubicación de origen.

¿Qué sucede si se interrumpe una tarea de AWS DataSync?

Si se interrumpe una tarea (por ejemplo, si la conexión de red falla o el agente de AWS DataSync se reinicia), la siguiente ejecución de la tarea transferirá los archivos faltantes y los datos estarán completos y serán congruentes al finalizar la ejecución. Cada vez que se inicia una tarea, se realiza una copia gradual y se transfieren únicamente los cambios desde el origen al destino.

¿Puedo usar AWS DataSync con AWS Direct Connect?

Puede usar AWS DataSync con su enlace de Direct Connect para obtener acceso a los puntos de enlace de los servicios públicos o los puntos de enlace de VPC privados. Con los puntos de conexión de VPC, los datos transferidos entre el agente de DataSync y los servicios de AWS no recorren la Internet pública ni necesitan direcciones IP públicas, lo que aumenta la seguridad de los datos a medida que se copian a través de la red. Actualmente, DataSync Discovery solo es compatible con puntos de conexión de servicio público.

¿AWS DataSync admite los puntos de enlace de VPC o de AWS PrivateLink?

Sí, los puntos de enlace de VPC son compatibles con los casos de uso de transferencia de datos. Puede usar los puntos de enlace de VPC para garantizar que la transferencia de datos con su agente de AWS DataSync, desplegado de forma local o en la nube, no atraviese redes públicas de Internet ni requiera el uso de direcciones de IP públicas. El uso de los puntos de enlace de VPC aumenta la seguridad de sus datos ya que mantiene el tráfico de la red dentro de su Amazon Virtual Private Cloud (Amazon VPC). Los puntos de enlace de VPC para DataSync funcionan con AWS PrivateLink, una tecnología escalable de alta disponibilidad que le permite conectar de forma privada su VPC a los servicios de AWS compatibles.

¿Cómo configuro AWS DataSync para poder utilizar los puntos de enlace de VPC?

Para poder utilizar los puntos de enlace de VPC con AWS DataSync, debe crear un punto de enlace de la VPC de interfaz AWS PrivateLink para el servicio DataSync en la VPC de su elección y, a continuación, elegir esta interfaz de red elástica (ENI) de punto de enlace al momento de crear el agente de DataSync. El agente se conectará con esta ENI para activarse y, posteriormente, todos los datos transferidos por el agente permanecerán dentro de la VPC que configuró. Puede utilizar la consola de AWS DataSync, la interfaz de línea de comandos de AWS (CLI) o AWS SDK para configurar los puntos de enlace de la VPC. Para obtener más información, consulte Utilizar AWS DataSync en una nube virtual privada.

Transferencias desde y hacia el almacenamiento de AWS

¿Qué servicios de AWS Storage son compatibles con AWS DataSync?

AWS DataSync admite la transferencia de datos hacia, desde o entre Amazon Simple Storage Service (Amazon S3), Amazon Elastic File System (Amazon EFS), Amazon FSx para Windows File Server, Amazon FSx para Lustre, Amazon FSx para OpenZFS y Amazon FSx para NetApp ONTAP.

¿Puedo copiar mis datos a Amazon S3 Glacier Instant Retrieval, Amazon S3 Glacier Flexible Retrieval (antes conocido como S3 Glacier), Amazon S3 Glacier Deep Archive u otras clases de almacenamiento de S3?

Sí. Durante la configuración de un bucket de S3 para usar con AWS DataSync, puede seleccionar la clase de almacenamiento de S3 que DataSync usa para almacenar objetos. DataSync admite el almacenamiento de datos directamente en S3 Standard, S3 Intelligent-Tiering, S3 Standard-Infrequent Access (S3 Standard-IA), S3 One Zone-Infrequent Access (S3 One Zone-IA), Amazon S3 Glacier Instant Retrieval, Amazon S3 Glacier Flexible Retrieval y Amazon S3 Glacier Deep Archive (S3 Glacier Deep Archive). Puede encontrar más información sobre los Tipos de almacenamiento de Amazon S3 en la Guía para desarrolladores de Amazon Simple Storage Service.

Los objetos más pequeños que la capacidad de carga mínima por objeto se almacenarán en S3 Estándar. Por ejemplo, los objetos de carpeta, que tienen un tamaño de cero bytes y contienen solo metadatos, se almacenarán en S3 Standard. Consulte nuestra documentación sobre las consideraciones a la hora de trabajar con las clases de almacenamiento de Amazon S3 y cómo evaluar los costos de las solicitudes de S3 al utilizar DataSync. Para obtener más información sobre las capacidades de carga mínimas, consulte los precios de Amazon S3.

¿Puedo copiar los datos de las clases de almacenamiento S3 Standard-IA y S3 One Zone-IA?

Sí. Al usar S3 como la ubicación de origen para una tarea AWS DataSync, el servicio recuperará todos los objetos del bucket que deben copiarse en el destino. La recuperación de objetos del almacenamiento Estándar - Acceso poco frecuente de S3 y Única zona - Acceso poco frecuente de S3 generará una tarifa de recuperación basada en el tamaño de los objetos. Consulte nuestra documentación sobre las consideraciones al trabajar con los tipos de almacenamiento de Amazon S3.

¿Puedo copiar datos de Amazon S3 Glacier Instant Retrieval? Amazon S3 Glacier Flexible Retrieval (antes conocido como S3 Glacier) y Amazon S3 Glacier Deep Archive?

Al usar S3 como la ubicación de origen para una tarea de AWS DataSync, el servicio intentará recuperar todos los objetos del bucket que deben copiarse en el destino. La recuperación de objetos archivados en la clase de almacenamiento S3 Glacier Instant Retrieval generará tarifas de recuperación más altas en función del tamaño de los objetos. La recuperación de objetos archivados en la clase de almacenamiento S3 Glacier Flexible Retrieval o S3 Glacier Deep Archive produce un error. DataSync registrará cualquier error al recuperar objetos archivados y dará como resultado un estado de finalización de tarea fallido. Consulte nuestra documentación sobre las consideraciones a la hora de trabajar con las clases de almacenamiento de Amazon S3 y cómo evaluar los costos de las solicitudes de S3 al usar DataSync.

¿Cómo obtiene acceso AWS DataSync a mi bucket de Amazon S3?

AWS DataSync asume un rol de IAM que usted proporciona. La política que adjunte al rol determina qué acciones puede realizar el rol. DataSync puede generar de forma automática este rol en su nombre o puede configurarlo manualmente.

¿Cómo hace AWS DataSync para convertir archivos y carpetas desde o hacia objetos en Amazon S3?

Cuando los archivos o las carpetas se copian a Amazon S3, existe una relación de uno a uno entre un archivo o una carpeta y un objeto. Las marcas de tiempo de los archivos y las carpetas y los permisos POSIX, que incluyen ID de usuarios, ID de grupos y permisos, se almacenan en los metadatos de los usuarios de S3. Para compartir con NFS, los metadatos de archivos almacenados en los metadatos de usuario en S3 son totalmente interoperables con el File Gateway, lo que permite que AWS DataSync ofrezca acceso local basado en archivos a los datos almacenados en Amazon S3.

Cuando DataSync vuelve a copiar objetos que contienen los metadatos de este usuario en el servidor NFS, los metadatos del archivo se restauran. También se restauran los enlaces simbólicos y duros cuando se copian desde NFS a S3.

Cuando se realiza una copia desde un archivo compartido de SMB, los permisos POSIX predeterminados se almacenan en los metadatos del usuario de S3. Cuando se vuelve a hacer una copia en un archivo compartido de SMB, el propietario se establece según el usuario que estaba habilitado para acceder a ese archivo compartido en DataSync y se le asignan permisos predeterminados.

Al copiar desde HDFS, las marcas de tiempo de archivos y carpetas, la propiedad de usuarios y grupos y los permisos POSIX se almacenan en los metadatos de usuario de S3. Al copiar de Amazon S3 a HDFS, se restablecen los metadatos de archivos y carpetas.

Obtenga más información sobre cómo DataSync almacena archivos y metadatos en nuestra documentación.

¿Qué metadatos de objetos se conservan al transferir objetos entre el almacenamiento de objetos autoadministrados o Azure Blob Storage y Amazon S3?

Cuando se transfieren objetos entre el almacenamiento de datos autoadministrado o Azure Blob Storage y Amazon S3, DataSync copia los objetos junto con las etiquetas y los metadatos del objeto.

¿Qué metadatos de los objetos se preservan cuando se transfieren objetos entre los buckets de Amazon S3?

Cuando se transfieren objetos entre los buckets de Amazon S3, DataSync copia los objetos junto con las etiquetas y los metadatos del objeto. DataSync no copia otra información de los objetos, como su ACL o sus versiones anteriores.

¿Qué costos de solicitud y almacenamiento de Amazon S3 se aplican cuando se usan los tipos de almacenamiento de S3 con AWS DataSync?

Algunas clases de almacenamiento de S3 tienen comportamientos que pueden afectar su costo, como la recuperación de datos, las capacidades mínimas de almacenamiento y las duraciones mínimas de almacenamiento. DataSync automatiza la gestión de datos para abordar estos factores y proporciona configuraciones para minimizar la recuperación de datos.

A fin de evitar la carga por objeto de capacidad mínima, AWS DataSync automáticamente almacena los objetos pequeños en S3 estándar. A fin de disminuir las tarifas de recuperación de datos, puede configurar DataSync de manera que solamente valide los archivos que transfirió una tarea determinada. A fin de evitar los cargos mínimos por duración de almacenamiento, DataSync posee controles para la sobrescritura y eliminación de objetos. Consulte nuestra documentación sobre las consideraciones de costos al trabajar con las clases de almacenamiento de Amazon S3 y cómo evaluar los costos de las solicitudes de S3 al usar DataSync.

¿Puedo copiar datos de objetos desde y hacia los buckets de Amazon S3 en AWS Outposts?

Sí. Puede copiar objetos entre Amazon S3 en AWS Outposts y buckets de Amazon S3 en las regiones de AWS. AWS DataSync copia objetos junto con los metadatos y las etiquetas del objeto. Para que DataSync acceda a su Amazon S3 en los buckets de Outposts, despliegue un agente de DataSync EC2 en su Outpost.

Al usar DataSync con Amazon S3 en Outposts, solo puede transferir datos hacia y desde buckets de Amazon S3 en las regiones de AWS. Puede obtener más información sobre los orígenes y destinos admitidos para las tareas de DataSync en nuestra documentación.

¿Cómo obtiene acceso AWS DataSync a mi sistema de archivos de Amazon EFS?

AWS DataSync obtiene acceso a su sistema de archivos Amazon EFS mediante el protocolo NFS. El servicio de DataSync organiza su sistema de archivos desde su VPC desde interfaces de red elásticas (ENI) que administra el servicio DataSync. DataSync se encarga de administrar por completo la creación, el uso y la eliminación de estas ENI. Puede elegir montar su sistema de archivos EFS mediante un destino de montaje o un punto de acceso a EFS.

¿Puedo usar AWS DataSync con todos los tipos de almacenamiento de Amazon EFS?

Sí. Puede usar AWS DataSync a fin de copiar archivos en Amazon EFS y configurar la administración del ciclo de vida de EFS para migrar los archivos a los que no se accedió durante un período determinado al tipo de almacenamiento de acceso poco frecuente.

¿Cómo se utiliza AWS DataSync con las políticas de recursos del sistema de archivos de Amazon EFS?

Puede utilizar tanto las políticas de identidad de IAM como las políticas de recursos para controlar el acceso de los clientes a los recursos de Amazon EFS de manera que sea escalable y se optimice para los entornos en la nube. Cuando crea una ubicación de DataSync para su sistema de archivos de EFS, puede especificar un rol de IAM que DataSync deberá asumir cuando acceda a EFS. A continuación, podrá utilizar las políticas del sistema de archivos de EFS para configurar el acceso para el rol de IAM. Dado que DataSync monta sistemas de archivos de EFS como usuarios raíz, su política de IAM debe permitir la siguiente acción: elasticfilesystem:ClientRootAccess.

¿Puedo usar AWS DataSync para replicar el sistema de archivos de Amazon EFS en una región de AWS diferente?

Sí. Además de la replicación integrada que ofrece Amazon EFS, también puede utilizar AWS DataSync para programar la replicación periódica del sistema de archivos de Amazon EFS en un sistema de archivos de Amazon EFS secundario dentro de la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

¿Qué metadatos se preservan cuando se copian datos entre el recurso compartido de NFS y Amazon EFS o entre dos sistemas de archivos de Amazon EFS?

AWS DataSync copia las marcas de tiempo de los archivos y las carpetas y los permisos POSIX, que incluyen ID de usuarios, ID de grupos y permisos. Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

¿Qué metadatos se conservan al copiar datos entre HDFS y Amazon EFS?

AWS DataSync copia las marcas de tiempo de archivos y carpetas y los permisos POSIX y aplica valores predeterminados para el ID de usuario y el ID de grupo. Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

¿Cómo accede AWS DataSync a mi sistema de archivos de Amazon FSx para Windows File Server?

AWS DataSync accede a su sistema de archivos de Amazon FSx para Windows File Server mediante el protocolo SMB, a través de la autenticación con el nombre de usuario y la contraseña que configure en la consola de AWS o en la CLI. El servicio de DataSync organiza su sistema de archivos desde su VPC desde interfaces de red elásticas (ENI) que administra el servicio DataSync. DataSync se encarga de administrar por completo la creación, el uso y la eliminación de estas ENI por usted.

¿Qué metadatos de Windows se transfieren cuando se hacen copias de un recurso compartido de SMB al sistema de archivos de Amazon FSx para Windows File Server o entre dos sistemas de archivos de Amazon FSx?

AWS DataSync copia los metadatos de Windows, incluidas las marcas de tiempo del archivo, el propietario del archivo, los atributos de archivo estándar, las listas de acceso discrecional (DACL) de NTFS y las listas de control de acceso al sistema de NFTS (SACL). Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

¿Puedo usar AWS DataSync para replicar el sistema de archivos de Amazon FSx para Windows File Server en otra región de AWS?

Sí. Puede usar AWS DataSync para programar replicaciones periódicas del sistema de archivos de Amazon FSx for Windows File Server en otro sistema de archivos en la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

¿Cómo obtiene acceso AWS DataSync a mi sistema de archivos de Amazon FSx para Lustre?

Cuando crea una tarea de DataSync para copiar hacia o desde su sistema de archivos FSx para Lustre, el servicio DataSync creará interfaces de red elásticas (ENI) en la misma VPC y subred donde se encuentra el sistema de archivos. DataSync utiliza estas ENI para acceder al sistema de archivos FSx for Lustre mediante el protocolo Lustre como usuario raíz. Cuando crea un recurso de ubicación DataSync para su sistema de archivos FSx for Lustre, puede especificar hasta cinco grupos de seguridad para aplicar a los ENI y configurar el acceso de salida desde el servicio DataSync. Los grupos de seguridad deben ser configurados para permitir el tráfico saliente en los puertos de red requeridos por FSx para Lustre. Los grupos de seguridad del sistema de archivos de FSx for Lustre deben configurarse para permitir el acceso entrante desde los grupos de seguridad que se asignaron al recurso de ubicación de DataSync para el sistema de archivos FSx for Lustre.

¿Qué metadatos se conservan al copiar datos entre un recurso compartido NFS o un sistema de archivos de Amazon EFS y Amazon FSx para Lustre, o entre dos sistemas de archivos de Amazon FSx para Lustre?

¿Puedo usar AWS DataSync para migrar datos de un sistema de archivos FSx para Lustre a otro?

Sí. Puede utilizar AWS DataSync para copiar desde su sistema de archivos FSx for Lustre a un segundo sistema de archivos dentro de la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

¿Puedo usar AWS DataSync para replicar el sistema de archivos de Amazon FSx para Lustre en una región de AWS diferente?

Sí. Puede usar AWS DataSync para programar replicaciones periódicas del sistema de archivos de Amazon FSx for Lustre en otro sistema de archivos en la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

¿DataSync copiará las configuraciones de segmentación o disposición cuando se copie de un sistema de archivos de Amazon FSx para Lustre a otro?

No. Los archivos se escriben con la configuración de distribución y segmentación de archivos en el sistema de archivos de destino.

¿Cómo obtiene acceso AWS DataSync a mi sistema de archivos de Amazon FSx para OpenZFS?

Cuando crea una tarea de DataSync para copiar hacia o desde su sistema de archivos FSx para OpenZFS, el servicio DataSync creará interfaces de red elásticas (ENI) en la misma VPC y subred donde se encuentra el sistema de archivos. DataSync utiliza estas ENI para acceder al sistema de archivos FSx for OpenZFS mediante el protocolo OpenZFS como usuario raíz. Cuando crea un recurso de ubicación DataSync para su sistema de archivos FSx for OpenZFS, puede especificar hasta cinco grupos de seguridad para aplicar a los ENI y configurar el acceso de salida desde el servicio DataSync. Los grupos de seguridad deben estar configurados para permitir el tráfico saliente en los puertos de red requeridos por FSx para OpenZFS. Los grupos de seguridad del sistema de archivos de FSx for OpenZFS deben configurarse para permitir el acceso entrante desde los grupos de seguridad que se asignaron al recurso de ubicación de DataSync para el sistema de archivos FSx for OpenZFS.

¿Qué metadatos se conservan al copiar datos entre un recurso compartido NFS o un sistema de archivos de Amazon EFS y Amazon FSx para OpenZFS, o entre dos sistemas de archivos de Amazon FSx para OpenZFS?

¿Puedo utilizar AWS DataSync para migrar datos de un sistema de archivos FSx para OpenZFS a otro?

Sí. Puede utilizar AWS DataSync para copiar desde su sistema de archivos FSx for OpenZFS a un segundo sistema de archivos dentro de la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

¿Puedo usar AWS DataSync para replicar el sistema de archivos de Amazon FSx para OpenZFS en una región de AWS diferente?

Sí. Puede usar AWS DataSync para programar replicaciones periódicas del sistema de archivos de Amazon FSx for OpenZFS en otro sistema de archivos en la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

¿Cómo accede AWS DataSync a mi sistema de archivos de Amazon FSx para NetApp ONTAP?

Cuando crea una tarea, DataSync genera interfaces de red elástica (ENI) en la subred preferida de la misma VPC en la que se encuentra su sistema de archivos de Amazon FSx para NetApp ONTAP. La subred preferida se configura cuando se crea el sistema de archivos FSx para ONTAP, y DataSync usa las ENI que crea en esa subred para acceder al sistema de archivos de FSx para ONTAP. Al crear un recurso de ubicación de DataSync para su sistema de archivos de FSx para ONTAP, puede especificar hasta 5 grupos de seguridad para aplicar a las ENI para configurar el acceso saliente desde el servicio DataSync. Debe configurar los grupos de seguridad de su sistema de archivos de FSx para ONTAP para permitir el acceso entrante desde los grupos de seguridad que asignó al recurso DataSync Location para su sistema de archivos de FSx para ONTAP.

¿Qué versiones de protocolo puede usar AWS DataSync con Amazon FSx para NetApp ONTAP?

AWS DataSync admite usar NFSv3, SMB 2.1 y SMB 3. Actualmente, DataSync no admite usar NFSv4 o posterior con FSx para ONTAP.

¿Conserva AWS DataSync los metadatos del sistema de archivos cuando se copian datos a o desde mi sistema de archivos de Amazon FSx para NetApp ONTAP?

Sí, AWS DataSync copia las marcas de tiempo de archivos y carpetas y los permisos POSIX, incluidos el ID de usuario, el ID de grupo y los permisos, cuando se usa el protocolo NFS. Al usar el protocolo SMB, DataSync copia las marcas de tiempo de archivos y carpetas, la propiedad y las ACL. Puede obtener más información y ver la lista completa de metadatos copiados en nuestra documentación.

¿Qué protocolo debo usar al migrar mis datos a Amazon FSx para NetApp ONTAP?

Al migrar desde servidores Windows o recursos compartidos NAS que sirven a los usuarios a través del protocolo SMB, use una ubicación de origen de DataSync SMB y el protocolo SMB para su ubicación de FSx para ONTAP, y asegúrese de que el estilo de seguridad de su volumen de FSx para ONTAP esté configurado para NTFS. Al migrar desde servidores Unix o Linux o recursos compartidos NAS que sirven a los usuarios a través del protocolo NFS, use una ubicación de origen NFS de DataSync y el protocolo NFS para su ubicación de FSx para ONTAP, y asegúrese de que el estilo de seguridad de su volumen FSx para ONTAP está configurado para Unix. En el caso de las migraciones multiprotocolo, debería revisar las prácticas recomendadas que se tratan en el blog Enabling multiprotocol workloads with Amazon FSx for NetApp ONTAP (Habilitación de cargas de trabajo multiprotocolo con Amazon FSx para NetApp ONTAP), y usar el protocolo SMB para preservar los metadatos del sistema de archivos con la mayor fidelidad. Para obtener más información sobre la configuración de los estilos de seguridad para sus volúmenes de FSx para ONTAP, consulte la documentación sobre la administración de los volúmenes de FSx para ONTAP.

¿Puedo usar AWS DataSync para acceder al mismo sistema de archivos de Amazon FSx para NetApp ONTAP mediante diferentes protocolos?

Sí, pero tendrá que crear una ubicación de DataSync y un recurso de tarea distintos para cada protocolo (NFS o SMB). Para evitar problemas de sobrescritura de datos y verificación de datos, no recomendamos usar varias tareas DataSync para copiar en la misma ruta de volumen al mismo tiempo (ya sea con el mismo protocolo o con protocolos diferentes).

¿Puedo usar AWS DataSync para transferir datos a o desde LUN iSCSI de Amazon FSx para NetApp ONTAP?

No, DataSync solo admite la copia de datos de archivos hacia o desde volúmenes de FSx para ONTAP mediante los protocolos NFS o SMB.

¿Puedo usar AWS DataSync para copiar datos de un sistema de archivos de Amazon FSx para NetApp ONTAP a otro?

Sí. Puede usar AWS DataSync para copiar desde su sistema de archivos de FSx para ONTAP a un segundo sistema de archivos dentro de la misma cuenta de AWS. Esta capacidad está disponible para implementaciones tanto en la misma región como en diferentes regiones y no requiere el uso de un agente de DataSync.

¿Puedo usar AWS DataSync para replicar mi sistema de archivos de Amazon FSx para NetApp ONTAP a un sistema de archivos diferente en otra región de AWS?

Aunque DataSync puede usarse para replicar datos entre sus sistemas de ficheros, recomendamos usar NetApp SnapMirror para replicar entre sus sistemas de archivos de FSx para ONTAP. SnapMirror le permite conseguir un RPO bajo, independientemente del número o el tamaño de los archivos de su sistema de archivos.

¿Cómo puedo configurar AWS DataSync para que no copie los directorios de instantáneas?

DataSync excluirá automáticamente las carpetas con nombre “.snapshot”. También puede usar filtros de exclusión para evitar la copia de archivos y carpetas que coincidan con los patrones que especifique.

Transferencia desde y hacia dispositivos de la familia de productos AWS Snow

¿Cómo puedo transferir datos entre el almacenamiento compatible con Amazon S3 en Snow y los servicios de almacenamiento de AWS?

Comience por desplegar un agente de DataSync en su entorno local. Active el agente mediante la consola de administración de AWS o la CLI y configure la tarea de DataSync para transferir datos entre un bucket de su almacenamiento compatible con Amazon S3 y Amazon S3, Amazon EFS o cualquier sistema de archivos de Amazon FSx.

Rendimiento

¿Con qué velocidad AWS DataSync copia mi sistema de archivos a AWS?

La velocidad con la cual AWS DataSync puede copiar un conjunto de datos determinado depende de la cantidad de datos, del ancho de banda de E/S que se pueda alcanzar desde el origen y el almacenamiento de destino, del ancho de banda de la red disponible y de las condiciones de la red. Para transferir archivos entre servicios en las instalaciones y de AWS Storage, una sola tarea de DataSync puede usar todo un enlace de red de 10 Gbps.

¿Puedo controlar la cantidad de ancho de banda de la red que puede usar una tarea de AWS DataSync?

Sí. Puede controlar la cantidad de ancho de banda de la red que AWS DataSync usará. Para ello, configure el limitador de ancho de banda integrado. Puede aumentar o reducir este límite mientras la tarea de transferencia de datos se esté ejecutando. Esto le permite minimizar el impacto en los demás usuarios o aplicaciones que utilizan la misma conexión de red.

¿Cómo puedo monitorear el rendimiento de AWS DataSync?

AWS DataSync genera métricas de Amazon CloudWatch para ofrecer visibilidad granular en el proceso de transferencia. Mediante estas métricas, puede ver la cantidad de archivos y de datos que se han copiado, además de la detección de archivos y el progreso de validación. En la consola de DataSync se muestran directamente gráficos de CloudWatch con estas métricas.

¿AWS DataSync afectará el rendimiento de mi sistema de archivos de origen?

Según la capacidad del almacén de archivos local y la cantidad y el tamaño de los archivos a transferir, AWS DataSync podría afectar el tiempo de respuesta de los demás clientes cuando obtengan acceso al mismo almacén de datos de origen debido a que el agente lee o escribe los datos desde dicho sistema de almacenamiento. Configurar un límite de ancho de banda para una tarea reducirá este impacto al restringir las operaciones de E/S que se realizarán en su sistema de almacenamiento.

Seguridad y cumplimiento

¿Cómo accede AWS DataSync Discovery a mi almacenamiento local?

AWS DataSync Discovery usa el agente de DataSync para acceder a las interfaces de administración o API de sus sistemas de almacenamiento. Todos los accesos son de solo lectura. Consulte la documentación de DataSync para obtener más información sobre las API usadas para acceder a su almacenamiento.

Cuando uso AWS DataSync Discovery, ¿cómo especifico las credenciales para mis sistemas de almacenamiento local y cómo se protegen?

Cuando configure AWS DataSync Discovery para que detecte su sistema de almacenamiento, proporcione un nombre de usuario y una contraseña para acceder a la interfaz de API de su almacenamiento. A continuación, AWS DataSync Discovery creará automáticamente un secreto en AWS Secrets Manager para almacenar las credenciales. Cuando DataSync Discovery ejecuta un trabajo de detección, recupera la contraseña del secreto, la vuelve a cifrar y envía la contraseña cifrada al agente usado para su trabajo. La contraseña se retiene en la memoria del agente solo mientras dure el trabajo y en ningún momento se conserva la contraseña fuera de la memoria.

¿Se cifran mis datos a medida que se transfieren y almacenan?

Sí. Todos los datos transferidos entre el origen y el destino se cifran mediante Transport Layer Security (TLS, que reemplazó a Capa de conexión segura, SSL) Los datos nunca persisten por sí mismos en AWS DataSync. El servicio admite usar el cifrado predeterminado para los buckets de S3, el cifrado del sistema de archivos de Amazon EFS de los datos en reposo y el cifrado de Amazon FSx en reposo y en tránsito.

¿Cómo accede AWS DataSync a mi servidor NFS o a mis archivos compartidos de SMB?

AWS DataSync usa un agente que usted despliega en su entorno de TI o en Amazon EC2 para obtener acceso a sus archivos mediante el protocolo NFS o el protocolo SMB. Este agente se conecta con los puntos de conexión del servicio DataSync dentro de AWS y se administran de manera segura desde la Consola de administración de AWS o la CLI.

¿Cómo accede AWS DataSync a HDFS en mi clúster de Hadoop?

AWS DataSync usa un agente que despliega en su entorno de TI o en Amazon EC2 para acceder a su clúster de Hadoop. El agente DataSync actúa como un cliente HDFS y se comunica con NameNodes y DataNodes en sus clústeres. Cuando inicia una tarea, DataSync consulta el NameNode principal para determinar las ubicaciones de los archivos y carpetas en el clúster. A continuación, DataSync se comunica con los DataNodes del clúster para copiar archivos y carpetas en o desde HDFS.

¿Cómo accede AWS DataSync a mi almacenamiento de objetos autoadministrado o en la nube que admite el protocolo de Amazon S3?

AWS DataSync usa un agente que se despliega en su centro de datos o en el entorno de nube pública, o en Amazon EC2 para acceder a los objetos mediante la API de Amazon S3. Este agente se conecta con los puntos de conexión del servicio DataSync dentro de AWS y se administran de manera segura desde la Consola de administración de AWS o la CLI.

¿Cómo accede AWS DataSync a mis contenedores de Azure Blob Storage?

AWS DataSync usa un agente que se despliega en su entorno de Azure o en Amazon EC2 para acceder a los objetos de sus contenedores de Azure Blob Storage. Este agente se conecta con los puntos de conexión del servicio DataSync dentro de AWS y se administran de manera segura desde la Consola de administración de AWS o la CLI. El agente se autentica en su contenedor de Azure mediante un token SAS que usted especifica al crear una ubicación de DataSync Azure Blob.

¿Requiere AWS DataSync la configuración de una VPN para conectarse a mi almacenamiento de destino?

No. Cuando se copian datos desde o hacia sus instalaciones, no es necesario configurar una VPN o un túnel, ni permitir las conexiones de entrada. Su agente de AWS DataSync puede configurarse para enrutarse a través de un firewall que usa puertos de red estándar. Puede desplegar DataSync en su Amazon Virtual Private Cloud (Amazon VPC) mediante los puntos de enlace de VPC. Con los puntos de enlace de la VPC, los datos transferidos entre el agente de DataSync y los servicios de AWS no atraviesan la Internet pública ni las direcciones IP públicas.

¿Cómo se conectan de manera segura los agentes de AWS DataSync con AWS?

Los agentes de AWS DataSync se conectan con los puntos de enlace del servicio dentro de la región de AWS elegida. Cuando crea un agente, puede elegir que este se conecte con los puntos de enlace disponibles para Internet pública, los puntos de enlace validados según los Estándares de procesamiento de la información federal (FIPS) o los puntos de enlace dentro de una de sus VPC. La activación de su agente lo asocia de manera segura con su cuenta AWS. Para obtener más información, consulte Elegir un punto de enlace del servicio y Activar su agente.

¿Cómo se repara y actualiza mi agente de AWS DataSync?

Una vez que se activa el agente, AWS aplica automáticamente las actualizaciones de la VM del agente, incluidos el sistema operativo subyacente y los paquetes de software de AWS DataSync. Las actualizaciones se aplican sin interrupciones cuando el agente está inactivo y no está ejecutando una tarea de transferencia de datos.

¿A qué programas de conformidad adhiere AWS DataSync?

AWS posee el programa de conformidad de mayor duración en la nube. AWS está comprometida con ayudar a los clientes con sus requisitos. AWS DataSync ha sido evaluado para verificar el cumplimiento de estándares de seguridad globales y del sector. DataSync cumple con los requisitos de PCI DSS, ISO 9001, 27001, 27017 y 27018; SOC 1, 2 y 3; y cumple con los requisitos de la HIPAA. DataSync también está autorizado en las regiones EE.UU. Este y Oeste de AWS bajo FedRAMP Moderate y en AWS GovCloud (EE.UU.) bajo FedRamp High. Esto le facilita la verificación de nuestra seguridad y el cumplimiento de sus propias obligaciones. Si desea obtener más información y recursos, visite las páginas sobre temas de conformidad. También puede ir a la página Servicios en el ámbito del programa de conformidad para ver una lista completa de servicios y certificaciones.

¿AWS DataSync cumple los requisitos normativos de PCI?

Sí. AWS DataSync cumple con PCI-DSS, lo que significa que puede usarlo para transferir información de pago. Puede descargar el Paquete de conformidad con PCI en AWS Artifact para obtener más información sobre cómo lograr la conformidad con PCI en AWS.

¿AWS DataSync es compatible con HIPAA?

Sí. AWS DataSync es compatible con HIPAA, lo que significa que si tiene un HIPAA BAA establecido con AWS, puede usar DataSync para transferir información protegida de salud (PHI).

¿AWS DataSync tiene autorización provisional moderada de FedRAMP JAB en las regiones Este y Oeste de EE. UU. de AWS?

Sí. AWS DataSync recibió una autorización provisional para operar (P-ATO) por parte del Consejo Conjunto de Autorización (JAB) en el Programa Federal de Administración de Autorizaciones y Riesgos (FedRAMP) de referencia moderada en las regiones del Este y Oeste de EE. UU. Si es un cliente federal o comercial, puede usar AWS DataSync en los límites de autorización de las regiones Este y Oeste de AWS con datos hasta un nivel de impacto moderado.

¿AWS DataSync tiene autorización provisional alta de FedRAMP JAB en las regiones AWS GovCloud (EE. UU.)?

Sí. AWS DataSync recibió una autorización provisional para operar (P-ATO) por parte del Consejo Conjunto de Autorización (JAB) en el Programa Federal de Administración de Autorizaciones y Riesgos (FedRAMP) de referencia alta en la región GovCloud de EE. UU. Si es un cliente federal o comercial, puede usar AWS DataSync en los límites de autorización de la región AWS GovCloud (EE. UU.) con datos hasta un nivel de impacto alto.

Cuándo elegir AWS DataSync

¿Qué diferencias existen entre AWS DataSync y el uso de herramientas de línea de comandos como rsync o la interfaz de línea de comando de Amazon S3?

AWS DataSync automatiza y acelera completamente el traslado de grandes conjuntos de datos activos a AWS. Se integra de forma nativa con Amazon S3, Amazon EFS, Amazon FSx, Amazon CloudWatch y AWS CloudTrail, lo que proporciona un acceso perfecto y seguro a sus servicios de almacenamiento, así como un monitoreo detallado de la transferencia.

DataSync usa un protocolo de red personalizado y una arquitectura escalable para transferir datos. Para transferir archivos entre servicios en las instalaciones y de AWS Storage, una sola tarea de DataSync puede usar todo un enlace de red de 10 Gbps.

DataSync automatiza por completo la transferencia de datos. Incluye mecanismos de resiliencia de red y repetición de intentos, optimizaciones de red, programación de tareas integrada, auditoría mediante informes de tareas, supervisión a través de la consola y la API de DataSync, y registros, eventos y métricas de CloudWatch que ofrecen una visibilidad detallada sobre el proceso de transferencia. DataSync verifica la integridad de los datos tanto durante la transferencia como al momento de su finalización.

DataSync ofrece seguridad total y se integra directamente con los servicios de almacenamiento de AWS. Todos los datos transferidos entre el origen y el destino se cifran con TLS y el acceso a su almacenamiento de AWS se activa mediante mecanismos de seguridad de AWS integrados, como roles de IAM. Data Sync con los puntos de enlace de la VPC están activados para garantizar que los datos transferidos entre una organización y AWS no atraviesan la Internet pública, lo que aumenta la seguridad de los datos a medida que se copian a través de la red.

Para transferir objetos entre los buckets, ¿cuándo debo usar AWS DataSync, cuándo debo usar la replicación de S3 y cuándo las operaciones por lote de S3?

AWS ofrece varias herramientas para copiar objetos entre los buckets.

Use AWS DataSync para la distribución continua, las canalizaciones y la incorporación de lagos de datos y también para consolidar o separar los datos en varios buckets.

Utilice la replicación de S3 a fin de replicar de forma continua los datos en un bucket de destino específico.

Use las operaciones por lote de S3 para realizar operaciones por lotes a gran escala en objetos de S3, como copiar objetos, establecer etiquetas de objetos o listas de control de acceso (ACL), iniciar restauraciones de objetos desde Amazon S3 Glacier Flexible Retrieval (anteriormente S3 Glacier), invocar una función de AWS Lambda para realizar acciones personalizadas con sus objetos, administrar la retención legal de S3 Object Lock o administrar las fechas de retención de S3 Object Lock.

¿Cuándo utilizo AWS DataSync y cuándo AWS Snowball Edge?

AWS DataSync es perfecto para transferencias de datos en línea. DataSync puede migrar datos activos hacia AWS, transferir datos a la nube a fin de realizar tareas de análisis, archivar datos para liberar espacio de almacenamiento en las instalaciones o replicar datos en AWS para la continuidad empresarial.

AWS Snowball Edge es perfecto para transferencias de datos sin conexión para clientes que tienen restricciones de ancho de banda o que transfieren los datos desde entornos remotos, sin conexión a Internet o limitados.

¿Cuándo uso AWS DataSync y cuándo AWS Storage Gateway?

Use AWS DataSync para migrar los datos existentes a Amazon S3 y luego use la configuración de File Gateway de AWS Storage Gateway a fin de retener el acceso a los datos migrados y de aplicar actualizaciones continuas de las aplicaciones basadas en archivos locales.

Puede usar una combinación de DataSync y File Gateway para disminuir la infraestructura en las instalaciones al mismo tiempo que conecta de forma sencilla las aplicaciones locales. AWS DataSync le permite automatizar y acelerar las transferencias de datos en línea a los servicios de AWS Storage. Luego de la fase inicial de transferencia de datos mediante AWS DataSync, File Gateway le ofrece a las aplicaciones en las instalaciones acceso de latencia baja a los datos migrados. Cuando DataSync se usa con recursos compartidos de NFS, se preservan los metadatos POSIX del almacenamiento en las instalaciones de origen y los permisos del almacenamiento de origen se aplican cuando se accede a los datos a través de File Gateway.

¿Cuándo uso AWS DataSync y cuándo uso Amazon S3 Transfer Acceleration?

Si sus aplicaciones ya se han integrado con la API de Amazon S3 y desea un mayor rendimiento para transferir grandes archivos a S3, puede usar S3 Transfer Acceleration. Use AWS DataSync si quiere transferir los datos desde sus sistemas de almacenamiento existentes (por ejemplo, un almacenamiento dependiente de la red), desde los instrumentos que no pueden cambiarse (por ejemplo, secuenciadores de ADN, cámaras de video) o si desea usar varios destinos. DataSync también automatiza y simplifica la transferencia de datos mediante el suministro de funcionalidades adicionales, como los mecanismos integrados de resiliencia de red y repetición de intentos, la verificación de la integridad de los datos y la configuración flexible para adaptarse a sus necesidades específicas, incluida la limitación controlada del ancho de banda, etc.

¿Cuándo uso AWS DataSync y cuándo AWS Transfer Family?

Si actualmente usa SFTP para intercambiar datos con terceros, AWS Transfer Family proporciona una transferencia SFTP, FTPS, FTP y AS2 completamente administrada de forma directa hacia y desde Amazon S3, al tiempo que reduce la carga operativa.

Si desea una transferencia de datos acelerada y automatizada entre servidores NFS, recursos compartidos de archivos SMB, clústeres Hadoop, almacenamiento de objetos autoadministrado o en la nube, Amazon S3, Amazon EFS y Amazon FSx, puede usar AWS DataSync. DataSync es idóneo para los clientes que necesitan llevar a cabo migraciones en línea de conjuntos de datos activos, transferencias oportunas de datos que se generan continuamente o replicación para la continuidad del negocio.

Temas de la página