Projeto Ceiba

Construindo um dos supercomputadores de IA mais rápidos do mundo na nuvem

Construção de um dos supercomputadores de IA mais rápidos do mundo na nuvem

O Projeto Ceiba, uma colaboração inovadora entre a AWS e a NVIDIA, visa expandir os limites da inteligência artificial (IA) construindo um dos supercomputadores de IA mais rápidos do mundo na nuvem. Hospedado exclusivamente na AWS, esse supercomputador de ponta impulsionará os esforços de pesquisa e desenvolvimento da NVIDIA em IA.

Promova uma inovação pioneira

As equipes de pesquisa e desenvolvimento da NVIDIA aproveitarão o imenso potencial do Projeto Ceiba para impulsionar avanços em uma ampla variedade de campos inovadores, incluindo grandes modelos de linguagem (LLMs), gráficos (imagens, vídeos e geração 3D), simulação, biologia digital, robótica, veículos autônomos, previsão climática com o NVIDIA Earth-2 e muito mais. Essa iniciativa inovadora impulsionará o trabalho da NVIDIA para promover a IA generativa, moldando o futuro da inteligência artificial e de suas aplicações em diversos domínios.

Padrão de design

Infraestrutura de IA escalável

O Projeto Ceiba estará disponível por meio da arquitetura NVIDIA DGX Cloud. A DGX Cloud é uma plataforma de IA escalável de ponta a ponta para desenvolvedores, que oferece capacidade escalável criada com base na arquitetura mais recente da NVIDIA e projetada em conjunto em todas as camadas com a AWS. O DGX Cloud estará disponível na AWS ainda este ano, e a AWS será o primeiro provedor de serviços em nuvem a oferecer o DGX Cloud baseado na arquitetura NVIDIA Blackwell com GB200s. O Projeto Ceiba foi desenvolvido com base na infraestrutura de IA da AWS criada com propósito específico, projetado para entregar a imensa escala, segurança aprimorada e performance incomparável necessários para um supercomputador dessa magnitude.

Padrão de design

Exaflops de IA processados, cerca de 375 vezes mais potente do que o supercomputador mais rápido do mundo atual, Frontier

por superchip, o que possibilita a transferência e o processamento de dados ultrarrápidos

GPUs NVIDIA -Blackwell, o primeiro supercomputador de seu tipo

Recursos

Esse projeto conjunto estabeleceu vários marcos que definiram o setor:
A configuração do Projeto Ceiba inclui 20.736 superchips NVIDIA GB200 Grace Blackwell. Esse supercomputador inédito é construído usando o mais recente GB200 NVL72 da NVIDIA, um sistema com refrigeração a líquido em escala de rack com NVLink de quinta geração, que pode ser dimensionado para 20.736 GPUs Blackwell conectadas a 10.368 CPUs NVIDIA Grace. Esse supercomputador é capaz de processar 414 exaflops de IA, cerca de 375 vezes mais poderoso do que o supercomputador Frontier, o mais rápido do mundo. Se a capacidade de supercomputação atual do mundo inteiro fosse combinada, ela não alcançaria 1% do poder de computação representado por 414 exaflops. Para colocar isso em perspectiva, isso é equivalente a ter mais de 6 bilhões dos laptops mais avançados do mundo trabalhando em conjunto. Para colocar isso ainda mais em perspectiva, se cada ser humano na Terra fizesse um cálculo por segundo, levaria mais de 1.660 anos para igualar o que o Projeto Ceiba pode alcançar em apenas um segundo.

O Projeto Ceiba é o primeiro sistema a aproveitar os enormes recursos de aumento de escala horizontal proporcionados pelo sistema de redes do AWS Elastic Fabric Adapter (EFA) de quarta geração, fornecendo 1.600 Gbps por superchip sem precedentes com throughput de rede de baixa latência e alta largura de banda e possibilitando transferência e processamento de dados ultrarrápidos. 

A refrigeração a líquido já existe há anos. Os jogadores terão isso em seus computadores pessoais para jogos. Embora não seja uma tecnologia nova, a AWS escolheu propositalmente a refrigeração a ar em vez da refrigeração a líquido antes do Projeto Ceiba porque fazia sentido em termos de custo-benefício. Para enfrentar os desafios de densidade de energia e oferecer esse poder de computação incomparável no Projeto Ceiba, a AWS foi pioneira no uso da refrigeração a líquido em grande escala em data centers para soluções de computação de alta performance mais eficientes e sustentáveis.

O Projeto Ceiba incorporará recursos de segurança líderes do setor, projetados para proteger até mesmo os dados de IA mais confidenciais. A arquitetura da GPU Blackwell da NVIDIA, que fornece uma comunicação segura entre GPUs integradas ao AWS Nitro System e tecnologias de EFA, possibilitará dados criptografados seguros de ponta a ponta para workloads de IA generativa. Essa solução conjunta fornece decodificação e carregamento de dados de IA confidenciais nas GPUs e, ao mesmo tempo, mantém o isolamento completo dos operadores de infraestrutura. Tudo isso enquanto verifica a autenticidade das aplicações usadas para processar os dados. Usando o Nitro System, os clientes podem validar suas aplicações criptograficamente no AWS Key Management System (KMS) e descriptografar dados somente quando as verificações necessárias forem aprovadas, garantindo a criptografia de ponta a ponta dos seus dados à medida que eles percorrem workloads de IA generativa. Leia este blog e acesse a página sobre IA segura para saber mais.