O que é o aprendizado profundo em IA?
O aprendizado profundo é um método de inteligência artificial (IA) que ensina computadores a processar dados de uma forma inspirada no cérebro humano. Os modelos de aprendizado profundo conseguem reconhecer padrões complexos em imagens, texto, sons e outros dados para produzir insights e previsões precisas. É possível usar métodos de aprendizado profundo para automatizar tarefas que normalmente exigem inteligência humana, como descrever imagens ou transcrever um arquivo de som em texto.
O que é aprendizado generativo profundo?
O aprendizado generativo profundo é o aprendizado profundo que se concentra na criação de novos resultados a partir dos insumos aprendidos. Tradicionalmente, o aprendizado profundo se concentrava na identificação de relações entre dados. Os modelos de aprendizado profundo foram treinados com grandes quantidades de dados para reconhecer padrões no conjunto de dados.
O aprendizado generativo profundo adiciona geração ao reconhecimento de padrões. Esses modelos buscam padrões de dados e, em seguida, criam seus próprios padrões exclusivos. Por exemplo, eles podem analisar o texto em vários livros e depois usar as informações para gerar novas frases e parágrafos não encontrados nos livros originais.
O aprendizado generativo profundo é a base dos modernos modelos de IA generativa e modelos de base. Esses modelos usam tecnologias de aprendizado profundo em grande escala, treinadas em vastos conjuntos de dados, para realizar tarefas complexas, como responder perguntas, criar imagens a partir de texto e escrever conteúdo.
Por que o aprendizado profundo é importante?
A tecnologia de aprendizado profundo impulsiona muitas aplicações de inteligência artificial usadas em produtos cotidianos, como:
- Chatbots e geradores de código
- Assistentes digitais
- Controles remotos de televisão ativados por voz
- Detecção de fraudes
- Reconhecimento facial automático
Também é um componente essencial das tecnologias emergentes, como carros autônomos, realidade virtual e outras. As empresas usam modelos de aprendizado profundo para analisar dados e fazer previsões em várias aplicações.
O que são os casos de uso de aprendizado profundo?
O aprendizado profundo tem vários casos de uso, como no setor automotivo, aeroespacial, de manufatura, eletrônico, de pesquisa médica, entre outros.
- Carros autônomos utilizam modelos de aprendizado profundo para detecção de objetos.
- Os sistemas de defesa usam aprendizado profundo para sinalizar áreas de interesse em imagens de satélite.
- A análise de imagens médicas usa aprendizado profundo para detectar células cancerosas para diagnóstico médico.
- As fábricas usam aplicações de aprendizado profundo para detectar quando pessoas ou objetos estão a uma distância de risco das máquinas.
É possível agrupar esses vários casos de uso de aprendizado profundo em cinco categorias gerais: visão computacional, reconhecimento de fala, processamento de linguagem natural (PLN), mecanismos de recomendação e IA generativa.
Visão por computação
A visão computacional extrai automaticamente informações e insights de imagens e vídeos. Técnicas de aprendizado profundo para compreender imagens da mesma forma que os humanos. A visão computacional tem várias aplicações, como:
- Moderação de conteúdo para remover automaticamente conteúdos inapropriados ou perigosos de arquivos de vídeos e imagens
- Reconhecimento facial para identificar rostos e reconhecer atributos como olhos abertos, óculos e barba
- Rótulo de imagens para classificar logotipos de marcas, roupas, equipamentos de segurança e outros detalhes de imagens
Reconhecimento de voz
Os modelos de aprendizado profundo podem analisar a fala humana mesmo existindo diversos padrões de fala, tom, altura, idioma e sotaque. Assistentes virtuais como Amazon Alexa, text-to-speech e speech-to-text software usam o reconhecimento de fala para realizar as seguintes tarefas:
- Ajudar atendentes de centrais de atendimento e classificar chamadas automaticamente.
- Converter conversas clínicas em documentação em tempo real.
- Criar legendas de vídeos e gravações de reuniões com precisão para permitir um maior alcance do conteúdo.
- Converter scripts em solicitações de assistência inteligente por voz.
Processamento de linguagem natural
Os computadores usam algoritmos de aprendizado profundo para reunir insights e significado de dados de texto e documentos. Essa capacidade de processar texto natural, criado por humanos, tem vários casos de uso, inclusive:
- Agentes virtuais automatizados e chatbots
- Resumo automático de documentos ou artigos jornalísticos
- Análise de business intelligence de documentos longos, como e-mails e formulários
- Indexação de expressões-chave que indicam sentimentos, como comentários positivos e negativos em mídias sociais
Mecanismos de recomendação
As aplicações podem usar métodos de aprendizado profundo para rastrear a atividade do usuário e desenvolver recomendações personalizadas . Elas podem analisar o comportamento dos usuários e ajudá-los a descobrir novos produtos ou serviços. Por exemplo,
- Recomendar vídeos e conteúdos personalizados.
- Recomendar produtos e serviços personalizados.
- Filtrar os resultados da busca para destacar o conteúdo relevante com base na localização e no comportamento do usuário
IA generativa
As aplicações de IA generativa podem criar novos conteúdos e se comunicar com os usuários finais de forma mais sofisticada. Elas podem ajudar na automatização de fluxos de trabalho complexos, na troca de ideias e na busca inteligente de conhecimento. Por exemplo, com ferramentas de IA generativas como Amazon Q Business e Amazon Q Developer, os usuários podem
- Fazer perguntas em linguagem natural e obter respostas resumidas de várias fontes internas de conhecimento.
- Receber sugestões de código, varredura e atualizações automáticas de código.
- Criar novos documentos, e-mails e outros conteúdos de marketing com mais rapidez.
Quais são os componentes de uma rede de aprendizado profundo?
Os componentes de uma rede neural profunda estão listados abaixo.
Camada de entrada
Uma rede neural artificial conta com vários nós que inserem dados nela. Esses nós compõem a camada de entrada do sistema.
Camada oculta
A camada de entrada processa e transmite os dados para camadas mais distantes na rede neural. Essas camadas ocultas processam informações em diferentes níveis, adaptando o comportamento à medida que recebem novas informações. As redes de aprendizado profundo têm centenas de camadas ocultas que podem ser usadas para analisar um problema por vários ângulos diferentes.
Por exemplo, se recebesse a imagem de um animal desconhecido e precisasse classificá-lo, você o compararia aos animais que já conhece. Por exemplo, observaria o formato dos olhos e das orelhas, tamanho, número de pernas e padrão de pelo. Você tentaria identificar padrões, tais como:
- O animal tem cascos, então pode ser uma vaca ou um cervo.
- O animal tem olhos de gato, então pode ser algum tipo de gato selvagem.
As camadas ocultas em redes neurais profundas funcionam da mesma forma. Se um algoritmo de aprendizado profundo está tentando classificar uma imagem de animal, cada uma de suas camadas ocultas processa uma característica diferente do animal e tenta categorizá-la com precisão.
Camada de saída
A camada de saída consiste nos nós que emitem dados. Modelos de aprendizado profundo que geram respostas “sim” ou “não” têm apenas dois nós na camada de saída. Por sua vez, aqueles que produzem uma gama maior de respostas têm mais nós.
Como funciona o aprendizado profundo?
Os modelos de aprendizado profundo são redes neurais projetadas com base no cérebro humano. O cérebro humano contém milhões de neurônios biológicos interconectados que trabalham juntos para aprender e processar informações. De modo semelhante, os neurônios artificiais são módulos de software chamados nós, que utilizam cálculos matemáticos para processar dados. Redes neurais de aprendizado profundo, ou redes neurais artificiais, são compostas por muitas camadas de neurônios artificiais que trabalham juntas para resolver problemas complexos.
Os componentes de uma rede neural profunda estão listados abaixo.
Camada de entrada
Uma rede neural artificial conta com vários nós que inserem dados nela. Esses nós compõem a camada de entrada do sistema.
Camada oculta
A camada de entrada processa e transmite os dados para camadas mais distantes na rede neural. Essas camadas ocultas processam informações em diferentes níveis, adaptando o comportamento à medida que recebem novas informações. As redes de aprendizado profundo têm centenas de camadas ocultas que podem ser usadas para analisar um problema por vários ângulos diferentes.
Por exemplo, se recebesse a imagem de um animal desconhecido e precisasse classificá-lo, você o compararia aos animais que já conhece. Por exemplo, observaria o formato dos olhos e das orelhas, tamanho, número de pernas e padrão de pelo. Você tentaria identificar padrões, tais como:
- O animal tem cascos, então pode ser uma vaca ou um cervo.
- O animal tem olhos de gato, então pode ser algum tipo de gato selvagem.
As camadas ocultas em redes neurais profundas funcionam da mesma forma. Se um algoritmo de aprendizado profundo tentar classificar uma imagem de animal, cada uma de suas camadas ocultas processa uma característica diferente do animal e tenta categorizá-la com precisão.
Camada de saída
A camada de saída consiste nos nós que emitem dados. Modelos de aprendizado profundo que geram respostas “sim” ou “não” têm apenas dois nós na camada de saída. Por sua vez, aqueles que produzem uma gama maior de respostas têm mais nós. A IA generativa tem uma camada de saída sofisticada para gerar novos dados que correspondam aos padrões em seu conjunto de dados de treinamento.
Qual é a diferença entre machine learning, aprendizado profundo e IA generativa?
Os termos machine learning, aprendizado profundo e IA generativa indicam uma progressão na tecnologia de redes neurais.
Machine learning
O aprendizado profundo é um subconjunto do machine learning. Os algoritmos de aprendizado profundo surgiram na tentativa de tornar as técnicas tradicionais de machine learning mais eficientes. Os métodos tradicionais de machine learning exigem um esforço humano considerável para treinar o software. Por exemplo, no reconhecimento de imagens de animais, é necessário:
- Rotular manualmente centenas de milhares de imagens de animais.
- Fazer com que os algoritmos de machine learning processem essas imagens.
- Testar esses algoritmos em um conjunto de imagens desconhecidas.
- Identificar por que alguns resultados são imprecisos.
- Aprimorar o conjunto de dados rotulando novas imagens para melhorar a precisão dos resultados.
Esse processo é chamado de aprendizado supervisionado. No aprendizado supervisionado, a precisão dos resultados só melhora quando há um conjunto de dados amplo e suficientemente variado. Por exemplo, o algoritmo pode identificar gatos pretos com precisão, mas não gatos brancos, pois o conjunto de dados de treinamento continha mais imagens de gatos pretos. Nesse caso, você precisaria de mais dados rotulados de imagens de gatos brancos para treinar novamente os modelos de machine learning.
Benefícios do aprendizado profundo em relação ao machine learning
Uma rede de aprendizado profundo apresenta os benefícios a seguir em relação ao machine learning tradicional.
Processamento eficiente de dados não estruturados
Os métodos de machine learning consideram dados não estruturados, como documentos de texto, difíceis de processar porque o conjunto de dados de treinamento pode ter infinitas variações. Por sua vez, os modelos de aprendizado profundo podem compreender dados não estruturados e fazer observações gerais sem extrair recursos manualmente. Por exemplo, uma rede neural pode reconhecer que essas duas frases de entrada diferentes têm o mesmo significado:
- Você pode me explicar como fazer o pagamento?
- Como eu transfiro o dinheiro?
Relacionamentos ocultos e descoberta de padrões
Uma aplicação de aprendizado profundo pode analisar grandes quantidades de dados mais profundamente e revelar novos insights para os quais talvez não tenha sido treinada. Por exemplo, pense em um modelo de aprendizado profundo treinado para analisar compras de consumidores. O modelo tem dados somente de produtos que você já comprou. Porém, a rede neural artificial pode sugerir novos itens que você não comprou, comparando seus padrões de compra aos de outros clientes semelhantes.
Aprendizado não supervisionado
Os modelos de aprendizado profundo podem aprender e melhorar ao longo do tempo com base no comportamento do usuário. Não necessitam de grandes variações de conjuntos de dados rotulados. Por exemplo, considere uma rede neural que corrija ou sugira automaticamente palavras por meio da análise do comportamento de digitação de um usuário. Digamos que ela tenha sido treinada na língua inglesa e possa corrigir erros ortográficos de palavras em inglês. Porém, se você digita frequentemente palavras em outros idiomas, como danke, a rede neural também aprende e corrige essas palavras automaticamente.
Processamento de dados voláteis
Conjuntos de dados voláteis têm grandes variações. Um exemplo são os valores de reembolso de empréstimos de um banco. Uma rede neural de aprendizado profundo também pode categorizar e classificar esses dados analisando transações financeiras e sinalizando algumas delas para detectar fraudes.
Saiba mais sobre aprendizado profundo versus machine learning
IA generativa
A IA generativa levou as redes neurais de machine learning e aprendizado profundo a um novo patamar. Enquanto o machine learning e o aprendizado profundo se concentram na previsão e no reconhecimento de padrões, a IA generativa produz resultados exclusivos com base nos padrões detectados. A tecnologia de IA generativa é construída na arquitetura de transformador que combina várias redes neurais diferentes para combinar padrões de dados de maneiras exclusivas. As redes de aprendizado profundo primeiro convertem texto, imagens e outros dados em abstrações matemáticas e depois os reconvertem em novos padrões significativos.
O que é aprendizado profundo no contexto do machine learning?
O aprendizado profundo é um subconjunto do machine learning. Os algoritmos de aprendizado profundo surgiram na tentativa de tornar as técnicas tradicionais de machine learning mais eficientes. Os métodos tradicionais de machine learning exigem um esforço humano considerável para treinar o software. Por exemplo, no reconhecimento de imagens de animais, é necessário:
- Rotular manualmente centenas de milhares de imagens de animais.
- Fazer com que os algoritmos de machine learning processem essas imagens.
- Testar esses algoritmos em um conjunto de imagens desconhecidas.
- Identificar por que alguns resultados são imprecisos.
- Aprimorar o conjunto de dados rotulando novas imagens para melhorar a precisão dos resultados.
Esse processo é chamado de aprendizado supervisionado. No aprendizado supervisionado, a precisão dos resultados só melhora quando há um conjunto de dados amplo e bastante variado. Por exemplo, o algoritmo pode identificar gatos pretos com precisão, mas não gatos brancos, pois o conjunto de dados de treinamento continha mais imagens de gatos pretos. Nesse caso, seria necessário rotular mais imagens de gatos brancos e treinar os modelos de machine learning mais uma vez.
Quais são os desafios do aprendizado profundo?
Os desafios na implementação do aprendizado profundo e da IA generativa são apresentados a seguir.
Grandes quantidades de dados de alta qualidade
Algoritmos de aprendizado profundo geram melhores resultados quando são treinados em grandes quantidades de dados de alta qualidade. Exceções ou erros no conjunto de dados de entrada podem afetar consideravelmente o processo de aprendizado profundo. Por exemplo, em nosso exemplo de imagem de animal, o modelo de aprendizado profundo pode classificar um avião como uma tartaruga, se imagens não de animais forem acidentalmente introduzidas no conjunto de dados.
Para evitar essas imprecisões, é necessário limpar e processar grandes quantidades de dados antes de treinar modelos de aprendizado profundo. O pré-processamento de dados de entrada requer grandes quantidades de capacidade de armazenamento de dados.
Grande capacidade de processamento
Os algoritmos de aprendizado profundo fazem uso intenso de computação e necessitam de infraestrutura com capacidade computacional suficiente para funcionar adequadamente. Senão, demoram muito para processar os resultados.
Quais são os benefícios do aprendizado profundo em relação ao machine learning?
Uma rede de aprendizado profundo apresenta os benefícios a seguir em relação ao machine learning tradicional.
Processamento eficiente de dados não estruturados
Os métodos de machine learning consideram dados não estruturados, como documentos de texto, difíceis de processar porque o conjunto de dados de treinamento pode ter infinitas variações. Por sua vez, os modelos de aprendizado profundo podem compreender dados não estruturados e fazer observações gerais sem extrair recursos manualmente. Por exemplo, uma rede neural pode reconhecer que essas duas frases de entrada diferentes têm o mesmo significado:
- Você pode me explicar como fazer o pagamento?
- Como eu transfiro o dinheiro?
Relacionamentos ocultos e descoberta de padrões
Uma aplicação de aprendizado profundo pode analisar grandes quantidades de dados mais profundamente e revelar novos insights para os quais talvez não tenha sido treinada. Por exemplo, pense em um modelo de aprendizado profundo treinado para analisar as compras do consumidor. O modelo tem dados somente de produtos que você já comprou. Porém, a rede neural artificial pode sugerir novos produtos que você não comprou, comparando seus padrões de compra aos de outros clientes semelhantes.
Aprendizado sem supervisão
Os modelos de aprendizado profundo podem aprender e melhorar ao longo do tempo com base no comportamento do usuário. Não necessitam de grandes variações de conjuntos de dados rotulados. Por exemplo, considere uma rede neural que corrija ou sugira automaticamente palavras por meio da análise do comportamento de digitação de um usuário. Digamos que tenha sido treinado na língua inglesa e possa corrigir erros ortográficos de palavras em inglês. Porém, se você digita frequentemente palavras em outros idiomas, como danke, a rede neural aprende automaticamente e corrige essas palavras também.
Processamento de dados voláteis
Conjuntos de dados voláteis têm grandes variações. Um exemplo são os valores de reembolso de empréstimos de um banco. Uma rede neural de aprendizado profundo também pode categorizar e classificar esses dados, por exemplo, analisando transações financeiras e sinalizando algumas delas para detecção de fraudes.
Quais são os benefícios da IA generativa e do aprendizado profundo na nuvem?
Executar IA generativa e aprendizado profundo na infraestrutura de nuvem ajuda você a projetar, desenvolver e treinar aplicações com mais rapidez.
Velocidade
Você pode treinar modelos de IA generativa e aprendizado profundo mais rapidamente usando clusters de GPUs e CPUs para realizar as operações matemáticas complexas que suas redes neurais exigem. Depois, você pode implantar esses modelos para processar grandes quantidades de dados e produzir resultados cada vez mais relevantes.
Escalabilidade
Com a grande variedade de recursos sob demanda disponíveis por meio da nuvem, você pode acessar recursos de hardware praticamente ilimitados para trabalhar com modelos de aprendizado profundo com IA de qualquer porte. Suas redes neurais podem tirar proveito de vários processadores para distribuir workloads de maneira contínua e eficiente entre diferentes tipos e quantidades de processadores.
Ferramentas
Você pode acessar ferramentas de IA e aprendizado profundo, como notebooks, depuradores, criadores de perfil, pipelines, AIOps e muito mais. Você pode trabalhar com modelos de IA generativa existentes na nuvem, como um serviço, sem precisar de infraestrutura para hospedar o modelo. As equipes podem começar com aplicações de IA generativa e aprendizado profundo, mesmo com conhecimento e treinamento limitados.
Como a AWS pode ajudar com seus requisitos de IA generativa e aprendizado profundo?
Os serviços de IA e aprendizado profundo da AWS aproveitam o poder da computação em nuvem para que você possa criar e escalar a próxima onda de inovação em IA. Reinvente as experiências do cliente com os serviços personalizados mais abrangentes, a infraestrutura de IA, a tecnologia de aprendizado profundo e as soluções de IA generativa. Por exemplo,
- O Amazon SageMaker fornece infraestrutura, ferramentas e fluxos de trabalho totalmente gerenciados para machine learning e desenvolvimento de aprendizado profundo.
- O Amazon Bedrock fornece uma única API para acessar e utilizar diversos modelos básicos de alto desempenho das principais empresas de IA.
Você também pode usar a infraestrutura de IA da AWS para acessar computação, armazenamento e rede abrangentes, seguros e econômicos para criar qualquer aplicação de IA. Comece a usar o aprendizado profundo da IA na AWS criando uma conta gratuita na AWS ainda hoje!
Próximas etapas do aprendizado profundo na AWS
Obtenha acesso instantâneo ao nível gratuito da AWS.