WEBVTT

00:01.850 --> 00:07.340
Salve e bentornati al corso sulla deplorazione di oggi, andremo a concludere con la propagazione posteriore.

00:07.340 --> 00:11.520
Va bene così sapete praticamente tutto ciò che dobbiamo sapere su ciò che

00:11.520 --> 00:17.990
accade nel vostro tutto ciò che sappiamo che esiste un processo chiamato Propagazione diretta dove le informazioni sono inserite nel

00:17.990 --> 00:24.620
livello di input e poi propagate in avanti per ottenere i nostri cappelli bianchi i nostri valori di output e

00:24.620 --> 00:29.240
quindi li confrontiamo con i valori effettivi che abbiamo nel nostro set di allenamento.

00:29.240 --> 00:36.110
E poi calcoliamo gli errori, quindi gli errori vengono propagati attraverso la rete nella direzione

00:36.110 --> 00:41.570
opposta e ciò ci consente di addestrare la rete regolando i pesi.

00:41.660 --> 00:49.670
da una matematica molto interessante e sofisticata che ci consente di aggiustare i pesi.

00:49.670 --> 00:58.890
Quindi l'unica cosa importante da ricordare qui è che la retropropagazione è un algoritmo avanzato guidato

00:59.030 --> 01:02.540
Tutti nello stesso momento tutti i pesi sono regolati simultaneamente.

01:02.540 --> 01:08.990
Quindi, se lo stessimo facendo manualmente o se stessimo inventando un tipo di algoritmo molto diverso

01:08.990 --> 01:14.150
da quello anche se calcolassimo l'errore e poi stessimo cercando di capire quale

01:14.150 --> 01:21.040
effetto ha ciascuno dei pesi sull'errore avremmo in qualche modo regolare ciascuno dei pesi indipendentemente indipendentemente o individualmente.

01:22.000 --> 01:29.170
L'enorme vantaggio della retrocessione e una cosa fondamentale da ricordare è che durante il

01:29.170 --> 01:35.910
processo di back propagation semplicemente per il modo in cui è strutturato l'algoritmo.

01:36.850 --> 01:43.990
tempo in modo da sapere sostanzialmente quale parte dell'errore è responsabile per ciascuno dei tuoi pesi nella rete neurale.

01:43.990 --> 01:47.400
Sei in grado di regolare tutto contemporaneamente allo stesso

01:47.450 --> 01:54.220
Questo è il principio fondamentale fondamentale alla base della propagazione del dorso.

01:54.220 --> 02:02.650
E questo è il motivo per cui è cresciuto così rapidamente negli anni '80 e questo è stato un importante passo avanti.

02:02.770 --> 02:08.890
E se ti piacerebbe saperne di più su questo e su come esattamente la matematica lavori in background,

02:09.190 --> 02:14.800
un buon articolo che abbiamo già menzionato è le reti neurali e l'apprendimento profondo è in realtà

02:14.800 --> 02:16.640
un libro di Michael Nielsen.

02:16.720 --> 02:23.610
Troverai la matematica scritta e ti aiuterà a capire come esattamente questo è possibile.

02:23.650 --> 02:30.550
scopi se da un punto di vista dell'intuizione la parte importante è ricordare che questo è ciò che fa l'arretratezza.

02:31.240 --> 02:33.310
Ma per ora per i nostri

02:33.310 --> 02:36.750
Regola tutti i pesi allo stesso tempo.

02:36.940 --> 02:43.300
E ora avvolgeremo tutto con una procedura passo-passo di ciò che accade nell'addestramento

02:43.300 --> 02:45.370
di una rete neurale.

02:45.370 --> 02:51.000
D'accordo, quindi, il primo passo inizializzammo i pesi a piccoli numeri vicini allo zero ma non zero.

02:51.010 --> 02:56.830
Non ci siamo concentrati sull'inizializzazione dei pesi durante i tutorial di intuizione, ma poi

02:56.830 --> 03:02.610
dobbiamo iniziare da qualche parte e sono inizializzati con valori casuali vicini allo zero.

03:02.620 --> 03:09.730
processo di propagazione per propagazione questi pesi vengono regolati fino a quando l'errore non viene minimizzato.

03:09.730 --> 03:11.690
E da lì attraverso il

03:11.970 --> 03:13.550
Quindi la funzione di costo è ridotta al minimo.

03:13.820 --> 03:19.330
Quindi passo due ingressi la prima osservazione tutti i tuoi set di dati alla prima riga nell'input

03:19.510 --> 03:21.440
Lehre ogni caratteristica è un input.

03:21.440 --> 03:27.610
Quindi, in pratica prendi i pettini e inseriscili nei nodi di input separatamente per la propagazione da sinistra a

03:27.610 --> 03:27.910
destra.

03:27.910 --> 03:32.620
nella nostra visione L'attivazione dei neuroni è limitata dai pesi i pesi

03:32.620 --> 03:39.150
determinano fondamentalmente quanto sia importante l'attivazione di ciascun neurone per poi propagare l'attivazione fino a ottenere un risultato.

03:39.160 --> 03:43.100
I neuroni sono attivati ​​in un modo che essi selezionano

03:43.150 --> 03:43.850
In questo caso.

03:43.990 --> 03:46.640
Quindi fondamentalmente ti proponi da sinistra a destra.

03:46.690 --> 03:50.110
Vai fino in fondo e ottieni il tuo cappello.

03:50.320 --> 03:52.720
Quindi confrontare il risultato con il risultato effettivo.

03:52.750 --> 03:58.140
Misura l'errore generato e poi fai il backwardation da destra a sinistra l'aria è di nuovo

03:58.150 --> 03:58.620
bipolare.

03:58.630 --> 04:02.080
Aggiorna i pesi in base a quanto sono responsabili dell'errore.

04:02.260 --> 04:08.500
Anche in questo caso si è in grado di calcolare che, a causa del modo in cui è

04:08.500 --> 04:13.750
strutturato l'algoritmo di perturbazione del dorso, il tasso di apprendimento decide di quanto si aggiorna

04:13.990 --> 04:17.710
il peso come parametro che è possibile controllare nella rete neurale.

04:17.710 --> 04:23.110
Passaggio 6 Ripetere i passaggi 1 2 5 e aggiornare i pesi dopo ogni osservazione.

04:23.320 --> 04:30.670
Questo è chiamato apprendimento di rinforzo e nel nostro caso era la discesa del gradiente stocastico o ripetere i passaggi da 1

04:30.670 --> 04:31.490
a 5.

04:31.510 --> 04:37.840
tratta di una discesa a gradiente completo o Nissan verde con badge o mini discesa a gradiente e gradino sette

04:37.870 --> 04:43.150
quando l'intero treno è passato attraverso una rete neurale artificiale che fa rifare un'epoca in altre epoche.

04:43.150 --> 04:49.030
Ma in questo modo è solo dopo una serie di osservazioni o di apprendimento in batch che si

04:49.040 --> 04:55.090
Quindi, in pratica, continuate a farlo, facendo ciò e facendo in modo che la vostra

04:55.120 --> 05:02.510
rete neurale si alleni meglio, sempre meglio, e si adegui costantemente riducendo al minimo la funzione di costo.

05:02.740 --> 05:04.330
Quindi eccoci.

05:04.420 --> 05:09.770
Questi sono i passi che devi compiere per costruire le tue reti neurali artificiali e addestrarlo.

05:10.030 --> 05:16.060
E questi sono i passi che farai fino a quando pranzerò nei tutorial pratici.

05:16.120 --> 05:19.520
Ti auguro buona fortuna e non vedo l'ora di vederti la prossima volta.

05:19.540 --> 05:21.280
Fino ad allora goditi l'apprendimento.