Cos'è il deep learning? - Spiegazione dell'IA per il deep learning

Cos'è il deep learning nell'IA?

Il deep learning è un metodo di intelligenza artificiale (IA) che insegna ai computer a elaborare i dati seguendo una modalità ispirata al cervello umano. I modelli di deep learning possono riconoscere immagini, testi, suoni e altri schemi di dati complessi per produrre approfondimenti e previsioni accurati. Puoi utilizzare i metodi di deep learning per automatizzare le attività che in genere richiedono l'intelligenza umana, come la descrizione di immagini o la trascrizione di un file audio in testo.

Guarda la nostra introduzione al deep learning

Cos'è il deep generative learning?

Il deep generative learning è un tipo di deep learning che si concentra sulla creazione di nuovi output a partire da input appresi. Tradizionalmente, il deep learning si concentrava sull'identificazione delle relazioni tra i dati. I modelli di deep learning venivano addestrati con grandi quantità di dati per riconoscere schemi nel set di dati.

Il deep generative learning aggiunge la generazione al riconoscimento degli schemi. Tali modelli cercano schemi nei dati e poi creano i propri schemi unici. Ad esempio, possono analizzare il testo di diversi libri e quindi utilizzare le informazioni per generare nuove frasi e paragrafi non presenti nei libri originali.

Il deep generative learning è alla base dell'IA generativa e dei modelli di fondazione moderni. Questi modelli utilizzano tecnologie di deep learning su larga scala e vengono addestrati su ampi quantitativi di dati per eseguire compiti complessi come rispondere a domande, creare immagini a partire da testo e scrivere contenuti.

Guarda un video introduttivo ai modelli di fondazione

Perché il deep learning è importante?

La tecnologia di deep learning supporta molte applicazioni di intelligenza artificiale utilizzate nei prodotti di uso quotidiano, come i seguenti:

Chatbot e generatori di codice
Assistenti digitali
Telecomandi televisivi ad attivazione vocale
Rilevamento frodi
Riconoscimento facciale automatico

È anche una componente fondamentale delle tecnologie come le auto a guida autonoma, la realtà virtuale e altro ancora. Le aziende utilizzano i modelli di deep learning per analizzare i dati e fare previsioni in varie applicazioni.

Quali sono i casi d'uso del deep learning?

Il deep learning ha diversi casi d'uso nel settore automobilistico, aerospaziale, manifatturiero, elettronico, della ricerca medica e in altri campi.

Le auto a guida autonoma utilizzano modelli di deep learning per il rilevamento degli oggetti.
I sistemi di difesa utilizzano il deep learning per segnalare le aree di interesse nelle immagini satellitari.
L'analisi delle immagini mediche utilizza il deep learning per rilevare le cellule tumorali per la diagnosi medica.
Le fabbriche utilizzano applicazioni di deep learning per rilevare quando persone o oggetti si trovano a una distanza non sicura dalle macchine.

Questi diversi casi d'uso del deep learning possono essere raggruppati in cinque grandi categorie: visione artificiale, riconoscimento vocale, elaborazione del linguaggio naturale (NLP), motori di raccomandazione e IA generativa.

Visione computerizzata

La visione artificiale estrae automaticamente informazioni e approfondimenti da immagini e video. Le tecniche di deep learning possono essere impiegate per comprendere le immagini nello stesso modo in cui fanno gli umani. La visione artificiale ha molteplici applicazioni, tra cui:

Moderazione dei contenuti per rimuovere automaticamente contenuti non sicuri o inappropriati da archivi di immagini e video
Riconoscimento facciale per identificare volti e riconoscere attributi come occhi aperti, occhiali e peli sul viso
Etichettatura di immagini per identificare loghi di brand, abbigliamento, attrezzatura di sicurezza e altri dettagli dell'immagine

Riconoscimento vocale

I modelli di deep learning possono analizzare il discorso umano nonostante i diversi modelli di discorso, intonazione, tono, lingua e accento. Gli assistenti virtuali come Amazon Alexa, sintesi vocale e software di sintesi vocale utilizzano il riconoscimento vocale per eseguire le seguenti attività:

Assistenza agli agenti di call center e classificazione automatica delle chiamate.
Conversione delle conversazioni cliniche in documentazione in tempo reale.
Sottotitolazione precisa di video e registrazioni delle riunioni per una maggiore portata dei contenuti.
Conversione degli script in prompt per un'assistenza vocale intelligente.

Elaborazione del linguaggio naturale

I computer utilizzano algoritmi di deep learning per raccogliere approfondimenti e informazioni da dati di testo e documenti. Questa capacità di elaborare testo naturale creato dall'uomo ha diversi casi d'uso, tra cui:

Agenti virtuali automatizzati e chatbot
Riepilogo automatico di documenti o articoli di notizie
Analisi di business intelligence di documenti lunghi, come e-mail e moduli
Indicizzazione di frasi chiave che indicano sentimenti, come commenti positivi e negativi sui social media

Motori di raccomandazione

Le applicazioni possono utilizzare metodi di deep learning per monitorare l'attività degli utenti e sviluppare suggerimenti personalizzati. Possono analizzare il comportamento degli utenti e aiutarli a scoprire nuovi prodotti o servizi. Ad esempio,

Consigliare video e contenuti personalizzati.
Consigliare prodotti e servizi personalizzati.
Filtrare i risultati della ricerca per evidenziare i contenuti pertinenti in base alla posizione e al comportamento dell'utente

IA generativa

Le applicazioni di IA generativa possono creare nuovi contenuti e comunicare con gli utenti finali in modo più sofisticato. Possono contribuire all'automazione di flussi di lavoro complessi, al brainstorming di idee e alla ricerca intelligente di conoscenze. Ad esempio, con strumenti di IA generativa come Amazon Q Business e Amazon Q Developer, gli utenti possono

Formulare domande in linguaggio naturale e ricevere risposte riassuntive da più fonti di conoscenza interne.
Ottenere suggerimenti per il codice e la scansione automatica del codice con aggiornamenti.
Creare nuovi documenti, e-mail e altri contenuti di marketing più velocemente.

Quali sono i componenti di una rete di deep learning?

I componenti di una rete neurale profonda sono i seguenti.

Livello di Input

Una rete neurale artificiale ha diversi nodi che vi immettono dati. Questi nodi costituiscono il livello di input del sistema.

Livello nascosto

Il layer di input elabora e trasmette i dati ai livelli successivi nella rete neurale. Questi livelli nascosti elaborano le informazioni a diversi livelli, adattando il loro comportamento man mano che ricevono nuove informazioni. Le reti di deep learning hanno centinaia di livelli nascosti che possono utilizzare per analizzare un problema da diverse angolazioni.

Ad esempio, se ti venisse fornita un'immagine di un animale sconosciuto da classificare, la confronteresti con animali che già conosci. Ad esempio, osserveresti la forma degli occhi e delle orecchie, le sue dimensioni, il numero di zampe e la sua pelliccia. Cercheresti di identificare schemi, come i seguenti:

L'animale ha gli zoccoli, quindi potrebbe essere una mucca o un cervo.
L'animale ha gli occhi di gatto, quindi potrebbe essere un tipo di gatto selvatico.

I livelli nascosti nelle reti neurali profonde funzionano allo stesso modo. Se un algoritmo di deep learning sta cercando di classificare l'immagine di un animale, ciascuno dei suoi strati nascosti elabora una caratteristica diversa dell'animale e cerca di classificarlo accuratamente.

Livello di output

Il livello di output è costituito dai nodi che generano i dati. I modelli di deep learning che generano risposte "sì" o "no" hanno solo due nodi nel livello di output. D'altra parte, quelli che producono una gamma più ampia di risposte hanno più nodi.

Come funziona il deep learning?

I modelli di deep learning sono costituiti da reti neurali ispirate alla struttura del cervello umano. Un cervello umano contiene milioni di neuroni biologici interconnessi che lavorano insieme per apprendere ed elaborare le informazioni. Similmente, i neuroni artificiali sono moduli software chiamati nodi, che utilizzano calcoli matematici per elaborare i dati. Le reti neurali di deep learning, o reti neurali artificiali, sono costituite da numerosi strati di neuroni artificiali che interagiscono per risolvere problemi complessi.

I componenti di una rete neurale profonda sono i seguenti.

Livello di Input

Una rete neurale artificiale ha diversi nodi che vi immettono dati. Questi nodi costituiscono il livello di input del sistema.

Livello nascosto

Il layer di input elabora e trasmette i dati ai livelli successivi nella rete neurale. Questi livelli nascosti elaborano le informazioni a diversi livelli, adattando il loro comportamento man mano che ricevono nuove informazioni. Le reti di deep learning hanno centinaia di livelli nascosti che possono utilizzare per analizzare un problema da diverse angolazioni.

Ad esempio, se ti venisse fornita un'immagine di un animale sconosciuto da classificare, la confronteresti con animali che già conosci. Ad esempio, osserveresti la forma degli occhi e delle orecchie, le sue dimensioni, il numero di zampe e la sua pelliccia. Cercheresti di identificare schemi, come i seguenti:

L'animale ha gli zoccoli, quindi potrebbe essere una mucca o un cervo.
L'animale ha gli occhi di gatto, quindi potrebbe essere un gatto selvatico.

I livelli nascosti nelle reti neurali profonde funzionano allo stesso modo. Se un algoritmo di deep learning cerca di classificare l'immagine di un animale, ciascuno dei suoi strati nascosti elabora una caratteristica diversa dell'animale e cerca di classificarlo accuratamente.

Livello di output

Il livello di output è costituito dai nodi che generano i dati. I modelli di deep learning che generano risposte "sì" o "no" hanno solo due nodi nel livello di output. D'altra parte, quelli che producono una gamma più ampia di risposte hanno più nodi. L'IA generativa ha un sofisticato livello di output per generare nuovi dati che corrispondono agli schemi del suo set di dati di addestramento.

Cos'è il deep learning nel contesto del machine learning?

Il deep learning è un sottoinsieme del machine learning. Gli algoritmi di deep learning sono emersi nel tentativo di rendere più efficienti le tecniche di machine learning tradizionali. I metodi tradizionali di machine learning richiedono un notevole sforzo umano per addestrare il software. Ad esempio, nel riconoscimento delle immagini di animali, è necessario eseguire le seguenti operazioni:

Etichettare manualmente centinaia di migliaia di immagini di animali.
Fare in modo che gli algoritmi di machine learning elaborino quelle immagini.
Provare questi algoritmi su una serie di immagini sconosciute.
Capire perché alcuni risultati non sono accurati.
Migliorare il set di dati etichettando nuove immagini per migliorare l'accuratezza dei risultati.

Questo processo è chiamato apprendimento supervisionato. Nell'apprendimento supervisionato, l'accuratezza dei risultati migliora solo quando si dispone di un set di dati ampio e sufficientemente vario. Ad esempio, l'algoritmo potrebbe identificare accuratamente i gatti neri ma non i gatti bianchi perché il set di dati di addestramento conteneva più immagini di gatti neri. In tal caso, dovresti etichettare più immagini di gatti bianchi e addestrare nuovamente i modelli di machine learning.

Qual è la differenza tra machine learning, deep learning e IA generativa?

I termini machine learning, deep learning e IA generativa indicano una progressione nella tecnologia delle reti neurali.

Machine learning

Il deep learning è un sottoinsieme del machine learning. Gli algoritmi di deep learning sono emersi per rendere più efficienti le tecniche di machine learning tradizionali. I metodi tradizionali di machine learning richiedono un notevole sforzo umano per addestrare il software. Ad esempio, nel riconoscimento delle immagini di animali, è necessario eseguire le seguenti operazioni:

Etichettare manualmente centinaia di migliaia di immagini di animali.
Fare in modo che gli algoritmi di machine learning elaborino quelle immagini.
Provare questi algoritmi su una serie di immagini sconosciute.
Capire perché alcuni risultati non sono accurati.
Migliorare il set di dati etichettando nuove immagini per migliorare l'accuratezza dei risultati.

Questo processo è chiamato apprendimento supervisionato. Nell'apprendimento supervisionato, l'accuratezza dei risultati migliora solo quando si dispone di un set di dati ampio e sufficientemente vario. Ad esempio, l'algoritmo potrebbe identificare accuratamente i gatti neri ma non i gatti bianchi perché il set di dati di addestramento conteneva più immagini di gatti neri. In tal caso, avresti bisogno di più dati etichettati di immagini di gatti bianchi per addestrare nuovamente i modelli di machine learning.

Vantaggi del deep learning rispetto al machine learning

Una rete di deep learning offre i seguenti vantaggi rispetto al machine learning tradizionale.

Elaborazione efficiente dei dati non strutturati

I metodi di machine learning trovano i dati non strutturati, come i documenti di testo, difficili da elaborare perché il set di dati di addestramento può avere infinite variazioni. D'altra parte, i modelli di deep learning possono comprendere dati non strutturati e fare osservazioni generali senza l'estrazione manuale delle funzionalità. Ad esempio, una rete neurale può riconoscere che queste due diverse frasi di input hanno lo stesso significato:

Puoi dirmi come effettuare il pagamento?
Come trasferisco il denaro?

Relazioni nascoste e individuazione di modelli

Un'applicazione di deep learning può analizzare grandi quantità di dati in modo più approfondito e rivelare nuove informazioni per le quali potrebbe non essere stata addestrata. Ad esempio, consideriamo un modello di deep learning addestrato per analizzare gli acquisti dei consumatori. Il modello ha dati solo per gli articoli che hai già acquistato. Tuttavia, la rete neurale artificiale può suggerire nuovi articoli che non hai acquistato confrontando i tuoi modelli di acquisto con quelli di altri clienti simili.

Apprendimento senza supervisione

I modelli di deep learning possono apprendere e migliorare nel tempo in base al comportamento degli utenti. Non richiedono grandi variazioni di set di dati etichettati. Ad esempio, si consideri una rete neurale che corregge automaticamente o suggerisce parole analizzando le abitudini di digitazione. Si supponga che il modello sia stato addestrato in inglese e possa eseguire un controllo ortografico su parole inglesi. Tuttavia, se digiti frequentemente parole non inglesi, come “danke”, la rete neurale apprende e corregge automaticamente anche queste parole.

Elaborazione di dati instabili

I set di dati instabili presentano grandi variazioni. Un esempio sono gli importi del rimborso di un prestito in banca. Una rete neurale di deep learning può classificare e ordinare quei dati analizzando le transazioni finanziarie e segnalandone alcune per il rilevamento delle frodi.

Scopri di più sul deep learning e sul machine learning

IA generativa

L'IA generativa ha portato le reti neurali del machine learning e del deep learning a un livello superiore. Mentre il machine learning e il deep learning si concentrano sulla previsione e sul riconoscimento dei modelli, l'IA generativa produce output unici in base ai modelli rilevati. La tecnologia di IA generativa si basa sull' architettura dei trasformatori che combina diverse reti neurali per unire schemi di dati in modi unici. Le reti di deep learning convertono prima testi, immagini e altri dati in astrazioni matematiche, e successivamente le rielaborano per creare nuovi schemi significativi.

Quali sono le difficoltà del deep learning?

Di seguito sono riportate le sfide nell'implementazione del deep learning e dell'IA generativa.

Grandi quantità di dati di alta qualità

Gli algoritmi di deep learning forniscono risultati migliori quando vengono addestrati su grandi quantità di dati di alta qualità. I valori anomali o gli errori nel set di dati di input possono influire in modo significativo sul processo di deep learning. Ad esempio, nel nostro esempio di immagini di animali, il modello di deep learning potrebbe classificare un aereo come una tartaruga se immagini non di animali venissero accidentalmente introdotte nel set di dati.

Per evitare tali imprecisioni, è necessario pulire ed elaborare grandi quantità di dati prima di addestrare modelli di deep learning. La pre-elaborazione dei dati di input richiede grandi quantità di capacità di archiviazione di dati.

Grande potenza di elaborazione

Gli algoritmi di deep learning richiedono una elaborazione intensiva e un'infrastruttura con capacità di calcolo sufficiente per funzionare correttamente altrimenti impiegheranno molto tempo per elaborare i risultati.

Quali sono i vantaggi del deep learning rispetto al machine learning?

Una rete di deep learning offre i seguenti vantaggi rispetto al machine learning tradizionale.

Elaborazione efficiente dei dati non strutturati

I metodi di machine learning trovano i dati non strutturati, come i documenti di testo, difficili da elaborare perché il set di dati di addestramento può avere infinite variazioni. D'altra parte, i modelli di deep learning possono comprendere dati non strutturati e fare osservazioni generali senza l'estrazione manuale delle funzionalità. Ad esempio, una rete neurale può riconoscere che queste due diverse frasi di input hanno lo stesso significato:

Puoi dirmi come effettuare il pagamento?
Come trasferisco il denaro?

Relazioni nascoste e individuazione di modelli

Un'applicazione di deep learning può analizzare grandi quantità di dati in modo più approfondito e rivelare nuove informazioni per le quali potrebbe non essere stata addestrata. Ad esempio, consideriamo un modello di deep learning addestrato per analizzare gli acquisti dei consumatori. Il modello ha dati solo per gli articoli che hai già acquistato. Tuttavia, la rete neurale artificiale può suggerire nuovi articoli che non hai acquistato confrontando i tuoi modelli di acquisto con quelli di altri clienti simili.

Apprendimento senza supervisione

I modelli di deep learning possono apprendere e migliorare nel tempo in base al comportamento degli utenti. Non richiedono grandi variazioni di set di dati etichettati. Ad esempio, si consideri una rete neurale che corregge automaticamente o suggerisce parole analizzando le abitudini di digitazione. Si supponga che il modello sia stato addestrato in lingua inglese e possa eseguire un controllo ortografico su parole inglesi. Tuttavia, se digiti frequentemente parole non inglesi, come danke, la rete neurale apprende e corregge automaticamente anche queste parole.

Elaborazione di dati instabili

I set di dati instabili presentano grandi variazioni. Un esempio sono gli importi del rimborso di un prestito in banca. Una rete neurale di deep learning può classificare e ordinare anche quei dati, ad esempio analizzando le transazioni finanziarie e segnalandone alcune per il rilevamento delle frodi.

Quali sono i vantaggi dell'IA generativa e del deep learning nel cloud?

L'utilizzo dell'IA generativa e del deep learning su infrastrutture cloud aiuta a progettare, sviluppare e addestrare applicazioni più velocemente.

Velocità

Puoi addestrare modelli di deep learning e IA generativa più velocemente utilizzando cluster di GPU e CPU per eseguire le complesse operazioni matematiche richieste dalle reti neurali. Questi modelli possono quindi essere implementati per elaborare grandi quantità di dati e produrre risultati sempre più rilevanti.

Scalabilità

Con l'ampia gamma di risorse on demand disponibili attraverso il cloud, puoi accedere alle risorse hardware praticamente illimitate per affrontare modelli di deep learning IA di qualsiasi dimensione. Le reti neurali possono trarre vantaggio da più processori per distribuire in modo trasparente ed efficiente i carichi di lavoro su diversi tipi e quantità di processori.

Strumenti

Puoi accedere a strumenti di intelligenza artificiale e deep learning come notebook, debugger, profiler, pipeline, AIOps e altro ancora. Puoi lavorare con modelli di intelligenza artificiale generativa esistenti direttamente dal cloud come un servizio, senza la necessità di infrastrutture per ospitare il modello. I team possono iniziare con applicazioni di IA generativa e deep learning anche con competenze e formazione limitate.

In che modo AWS può aiutarti con i tuoi requisiti di IA generativa e deep learning?

I servizi di IA e deep learning di AWS si avvalgono della potenza del cloud computing per permetterti di creare e scalare la prossima ondata di innovazione nel campo dell'intelligenza artificiale. Reinventa le esperienze dei clienti grazie ai servizi su misura, all'infrastruttura IA, alla tecnologia di deep learning e alle soluzioni di IA generativa più complete. Ad esempio,

Amazon SageMaker fornisce un'infrastruttura, strumenti e flussi di lavoro completamente gestiti per lo sviluppo di machine learning e deep learning.
Amazon Bedrock fornisce un'unica API per accedere e utilizzare vari modelli di base ad alte prestazioni delle principali aziende nel campo dell'intelligenza artificiale.

Puoi anche utilizzare l'infrastruttura IA di AWS per accedere a soluzioni di calcolo, archiviazione e networking complete, sicure e con un ottimo rapporto qualità-prezzo per realizzare qualsiasi applicazione di IA. Inizia a usare il deep learning IA su AWS creando un account AWS gratuito oggi stesso.

Servizi di deep learning appositamente progettati su AWS

Cos'è l'apprendimento approfondito?

Cos'è il deep learning nell'IA?

Cos'è il deep generative learning?

Perché il deep learning è importante?

Quali sono i casi d'uso del deep learning?

Visione computerizzata

Riconoscimento vocale

Elaborazione del linguaggio naturale

Motori di raccomandazione

IA generativa

Quali sono i componenti di una rete di deep learning?

Livello di Input

Livello nascosto

Livello di output

Come funziona il deep learning?

Livello di Input

Livello nascosto

Livello di output

Cos'è il deep learning nel contesto del machine learning?

Qual è la differenza tra machine learning, deep learning e IA generativa?

Machine learning

Vantaggi del deep learning rispetto al machine learning

Elaborazione efficiente dei dati non strutturati

Relazioni nascoste e individuazione di modelli

Apprendimento senza supervisione

Elaborazione di dati instabili

IA generativa

Quali sono le difficoltà del deep learning?

Grandi quantità di dati di alta qualità

Grande potenza di elaborazione

Quali sono i vantaggi del deep learning rispetto al machine learning?

Elaborazione efficiente dei dati non strutturati

Relazioni nascoste e individuazione di modelli

Apprendimento senza supervisione

Elaborazione di dati instabili

Quali sono i vantaggi dell'IA generativa e del deep learning nel cloud?

Velocità

Scalabilità

Strumenti

In che modo AWS può aiutarti con i tuoi requisiti di IA generativa e deep learning?

Fasi successive per il deep learning in AWS

Fine del supporto per Internet Explorer