WEBVTT

00:00.450 --> 00:05.400
Salve e benvenuti a questo percorso in Torro ora faremo in modo che la funzione forward

00:05.400 --> 00:11.040
che inoltrerà propagherà il segnale attraverso tutto il cervello fin dall'inizio con le immagini di input fino alle

00:11.130 --> 00:16.860
uscite che conterranno i valori chiave per l'attore e il de-value che è il valore assunto dalla funzione

00:17.040 --> 00:17.950
per il critico.

00:18.240 --> 00:23.820
Quindi sarà abbastanza simile a quello che abbiamo fatto per Dume, ma stavolta qualcosa cambierà.

00:23.880 --> 00:25.550
L'emendamento cambierà questo.

00:25.560 --> 00:27.510
Ora abbiamo un'illustrazione nel cervello.

00:27.510 --> 00:32.470
Quindi dobbiamo fare qualcosa di più per propagare il segnale e fare attenzione.

00:32.850 --> 00:38.280
E l'altra cosa è meno importante, ma comunque i cambiamenti rispetto a prima sono

00:38.280 --> 00:44.220
che non useremo una vera funzione di attivazione come sai la funzione di attivazione non lineare,

00:44.220 --> 00:48.880
ma useremo il gabinetto che è in qualche modo più sofisticato funzione.

00:48.980 --> 00:51.390
Vedrai che in passato stiamo parlando di mentalità.

00:51.780 --> 00:55.970
Facciamo così, facciamo questa funzione, iniziamo con una morte.

00:56.040 --> 00:59.190
In realtà è l'ultima funzione di questa classe esecraiata.

00:59.280 --> 01:06.900
Quindi lo chiameremo avanti come Einstein e questa quarta funzione prenderà di sè l'oggetto perché

01:06.900 --> 01:09.930
useremo gli oggetti e gli input.

01:10.170 --> 01:13.520
È così importante capire che cosa saranno questi input.

01:13.590 --> 01:19.170
Queste non saranno solo le immagini di input, questi input conterranno anche i nodi nascosti e i

01:19.170 --> 01:20.980
nodi di cella della stessa.

01:21.090 --> 01:25.120
Ecco perché volevo sottolineare che alcune cose stanno per cambiare ora.

01:25.180 --> 01:30.820
Fondamentalmente stiamo considerando la funzione forward di Internet e dei nodi cellulari della lista.

01:31.200 --> 01:38.900
E parlando di loro ora ciò che faremo è separare questi due input di questo argomento nel mettere la

01:38.900 --> 01:41.540
funzione forward e come possiamo separarli.

01:41.700 --> 01:46.160
Bene, possiamo ricordare un nuovo Voivode che sarà l'input delle immagini.

01:46.230 --> 01:55.620
Quindi sono progettate immagini di input e le separiamo con il rovesciamento di H x e C X, che è un tempio degli

01:55.620 --> 01:59.090
stati nascosti e degli stati delle celle al Colosseo.

01:59.370 --> 02:04.470
Quindi H x altri stati e C X sono gli stati del Sud.

02:04.540 --> 02:09.580
Va bene e questo sarà uguale all'input che è questo argomento qui.

02:09.580 --> 02:14.950
Così ora abbiamo fatto quella separazione e quindi possiamo iniziare a propagare il

02:15.220 --> 02:21.400
segnale in tutto il cervello e per fare questo avremo successivamente strati diversi dal primo

02:21.700 --> 02:28.690
all'ultimo usando le nostre connessioni che sono le convoluzioni della connessione LACMA e la connessione lineare qui

02:29.020 --> 02:30.300
le connessioni complete.

02:30.490 --> 02:31.400
Quindi facciamolo.

02:31.450 --> 02:33.620
Ora sarà lo stesso di prima.

02:33.750 --> 02:40.420
Otterremo il nostro primo livello che chiameremo X e otterremo questo primo strato che dobbiamo propagare il

02:40.510 --> 02:46.240
segnale dagli input a questo primo strato e quindi dobbiamo usare la prima convoluzione perché

02:46.240 --> 02:51.770
è la prima convoluzione che propaga il segnale dalle immagini di input al primo strato.

02:52.030 --> 02:58.450
Quindi quello che faremo ora è copiare questo perché questa è la prima convoluzione che abbiamo avuto qui

02:58.450 --> 03:06.100
e applichiamo questa prima convoluzione alle nostre immagini di input che ora sono gli input giusti e che otteniamo che propaga

03:06.100 --> 03:09.560
il segnale dalle immagini di input a il primo strato.

03:09.820 --> 03:16.390
Ma ora ricorda che dobbiamo usare una funzione di attivazione non lineare per rompere la linearità per essere

03:16.390 --> 03:23.170
in grado di apprendere le relazioni non lineari all'interno delle immagini e per farlo useremo come abbiamo detto la

03:23.500 --> 03:28.050
funzione di attivazione che stiamo per guarda adesso e questo al tocco bloccato.

03:28.180 --> 03:30.110
Ma prima capiamo.

03:30.130 --> 03:36.430
Quindi per ottenerlo è come se prendessimo il modulo funzionale che ha una scorciatoia

03:36.490 --> 03:45.790
e poi quello e poi un ciclo e poi mettiamo tutto questo in parentesi perché vogliamo attivare non linearmente i neuroni.

03:45.880 --> 03:51.160
Questo primo strato qui che abbiamo ottenuto applicando la prima convoluzione sugli input.

03:51.160 --> 03:55.310
Quindi ora andiamo alla torcia PI Doug per capire di cosa si tratta.

03:55.360 --> 03:56.110
Ecco qui.

03:56.200 --> 04:00.320
Quindi puoi accedervi per torcia bloccato o barra obliqua.

04:00.340 --> 04:06.940
E poi che H G e L e poi devi trovare le attivazioni non lineari e poi le funzioni di attivazione

04:06.940 --> 04:08.080
non lineare che troverai.

04:08.170 --> 04:14.040
Beh, questo è il classico quando sappiamo che è solo un massimo di zero e X hai in mente il grafico.

04:14.260 --> 04:17.160
Allora hai sei che è questo.

04:17.160 --> 04:19.350
Quindi un po 'più sofisticato.

04:19.570 --> 04:21.190
E poi andiamo a dare un'occhiata.

04:21.550 --> 04:26.470
E come puoi vedere il blu è una ripetizione più un elemento aggiuntivo.

04:26.620 --> 04:29.280
Quindi è davvero più sofisticato.

04:29.340 --> 04:34.180
E questo è quello che usiamo per attivare nonlentamente i neuroni e i diversi strati.

04:34.180 --> 04:39.420
E dal modo in cui questa nuova funzione di attivazione è chiamata esponenziale nella loro unità.

04:39.490 --> 04:40.250
Quindi eccoci.

04:40.270 --> 04:44.230
Applichiamo l'elu sul primo strato convoluzionale.

04:44.470 --> 04:46.300
E ora le cose saranno facili.

04:46.370 --> 04:52.270
in pratica stiamo solo aggiungendo X ora x è il primo convoluzionale lì.

04:52.270 --> 04:59.440
Passeremo al prossimo per la propagazione del segnale che è dal primo strato convoluzionale al secondo

04:59.470 --> 05:02.190
strato convoluzionale che chiameremo X perché

05:02.290 --> 05:07.990
E propagando il segnale dal primo strato convoluzionale al successivo X diventerà il

05:07.990 --> 05:09.190
prossimo strato convoluzionale.

05:09.520 --> 05:15.130
E quindi per propagare il segnale dal primo strato convoluzionale al secondo non

05:15.220 --> 05:20.490
possiamo semplicemente copiare questo e incollarlo qui e sostituirlo uno a due.

05:20.510 --> 05:27.340
E ora, naturalmente, la seconda convoluzione non viene applicata alle immagini di input, ma a X che è il primo

05:27.340 --> 05:29.530
strato convoluzionale che è proprio qui.

05:29.830 --> 05:30.790
Va bene perfetto.

05:30.790 --> 05:32.800
Ora otteniamo il nostro secondo convoluzionale lì.

05:33.010 --> 05:38.230
E ora propagiamo nuovamente il segnale dal secondo convoluzionale al terzo.

05:38.230 --> 05:46.000
E quindi possiamo copiare direttamente questo e incollarlo qui e sostituirlo due a tre.

05:46.000 --> 05:46.840
Eccoci.

05:46.990 --> 05:47.900
E l'ultimo.

05:47.920 --> 05:53.770
Ora per propagare il segnale dal terzo convoluzionale al quarto e all'ultimo, possiamo

05:53.770 --> 05:58.770
solo copiare di nuovo qui e sostituire tre di seguito quattro.

05:58.840 --> 05:59.790
Eccoci.

06:00.220 --> 06:01.870
Quindi ricapitoliamo.

06:01.870 --> 06:03.310
Iniziamo con i nostri input.

06:03.460 --> 06:07.170
Applichiamo la prima convoluzione per ottenere lì il primo convoluzionale.

06:07.360 --> 06:12.130
Quindi applichiamo la seconda convoluzione al primo strato di convoluzione per ottenere il secondo

06:12.130 --> 06:12.850
strato convoluzionale.

06:12.970 --> 06:17.830
Quindi applichiamo questa terza convoluzione al secondo convoluzionale per ottenere il terzo

06:17.830 --> 06:18.510
strato convoluzionale.

06:18.550 --> 06:24.650
E infine applichiamo la quarta convoluzione al terzo convoluzionale per ottenere lì il quarto

06:24.650 --> 06:25.180
convoluzionale.

06:25.510 --> 06:29.900
Ed è così che il segnale viene propagato attraverso gli occhi degli occhi.

06:30.130 --> 06:35.620
Quindi eccoci ora che abbiamo il segnale di uscita dopo le quattro convoluzioni e ora

06:35.620 --> 06:40.790
sappiamo cosa fare per espandere questo intero segnale di uscita in un vettore dimensionale.

06:40.900 --> 06:42.640
Questo è il passo dell'appiattimento.

06:42.880 --> 06:45.440
Quindi aggiorneremo x di nuovo x.

06:45.490 --> 06:49.010
Ora diventerà questo vettore unidimensionale appiattito.

06:49.230 --> 06:57.070
E per fare questo è lo stesso che dobbiamo prendere X, che è finora il quarto strato convoluzionale X, ma poi usiamo

06:57.520 --> 07:05.660
una funzione di visualizzazione e per prima cosa abbiamo messo meno uno per dire che vogliamo un vettore dimensionale e quindi come secondo

07:05.660 --> 07:11.810
argomento abbiamo bisogno per mettere il numero di elementi nel vettore e questo è ricordato tre due

07:11.880 --> 07:13.560
volte tre volte tre.

07:13.670 --> 07:20.270
E quindi possiamo mettere qui 32 volte tre volte tre.

07:20.270 --> 07:20.720
Eccoci.

07:20.720 --> 07:24.570
Ora abbiamo il nostro vettore appiattito e la fase di appiattimento è completata.

07:24.680 --> 07:25.580
Perfezionare.

07:25.580 --> 07:28.030
Ora prendiamoci cura della parte LCN.

07:28.280 --> 07:33.030
Quindi, come hai capito, l'LSD prende come input il vettore appiattito.

07:33.200 --> 07:37.190
Questo vettore unidimensionale di tre due volte tre volte tre elementi.

07:37.190 --> 07:40.310
Quindi è già pronto e ben preparato per il icn.

07:40.320 --> 07:49.070
Il team è ora pronto per prendere questo vettore Flaten come input e quindi possiamo prendere il nostro LACMA e gli input

07:49.190 --> 07:52.010
come argomento prima che X sia pronto.

07:52.010 --> 07:55.960
FLATOW E vettore che è questa radiografia qui che abbiamo appena ampliato.

07:56.270 --> 08:00.810
Ma anche ed è qui che entra in gioco il problema.

08:00.890 --> 08:04.540
Dobbiamo inserire H x e z x.

08:04.550 --> 08:10.820
E possiamo usare ha-Satan per vedere X qui perché abbiamo fatto le separazioni dagli argomenti di

08:11.060 --> 08:12.980
input originali della funzione forward.

08:12.980 --> 08:20.460
Quindi LACMA X il vettore di output delle piastre dopo le quattro spire e tutto il nascosto nella nota della cella.

08:20.480 --> 08:21.390
Quindi eccoci.

08:21.440 --> 08:27.530
Quindi non dobbiamo dimenticare il sé perché l'LSD è una variabile o funzione, quindi una variabile collegata

08:27.530 --> 08:35.210
all'oggetto stesso e un CM e questo in realtà restituirà alle uscite un totale di due uscite che saranno i nodi

08:35.210 --> 08:37.850
di output e i suoni in uscita.

08:37.880 --> 08:42.250
Quindi è in realtà di attualità e quindi possiamo aggiornare H.

08:42.260 --> 08:48.890
X y e z x i nodi della cella perché è esattamente l'output di questo NCM qui.

08:50.030 --> 08:50.500
Grande.

08:50.510 --> 08:52.750
Quindi abbiamo quasi finito adesso.

08:52.790 --> 08:58.850
Ora che abbiamo le uscite dell'illustrazione abbiamo bisogno di ottenere l'output utile perché in realtà

08:58.850 --> 09:05.570
solo le note nascoste sono utili e quindi avremo di nuovo X e X sarà ora

09:05.570 --> 09:12.490
uguale a quello del primo elemento del campione di output degli Stati Uniti una X è uguale.

09:12.680 --> 09:14.270
E abbiamo quasi finito.

09:14.270 --> 09:18.590
Ricorda che abbiamo due cervelli con un cervello per l'attore in una stanza per il critico.

09:18.860 --> 09:24.380
E quindi dobbiamo emettere segnali per restituire il segnale di uscita dell'attore e il segnale di

09:24.380 --> 09:25.480
uscita del critico.

09:25.580 --> 09:30.730
E quindi ora quello che faremo è restituire questi due segnali di uscita e come possiamo farlo.

09:30.830 --> 09:32.010
Bene, è molto facile.

09:32.030 --> 09:38.690
Abbiamo semplicemente bisogno di prendere le nostre connessioni lineari ma separatamente che è una connessione lineare del critico e

09:38.770 --> 09:40.740
che la piena connessione dell'attore.

09:41.180 --> 09:47.870
X che è un utile output del LACMA e che sarà tutto ciò che sarà il segnale di uscita.

09:47.870 --> 09:50.470
E abbiamo applicato ciascuna di queste connessioni all'uscita

09:50.480 --> 09:50.990
Quindi eccoci.

09:50.990 --> 09:51.840
Facciamolo.

09:51.900 --> 09:59.660
Prima prendiamo il sé o l'oggetto, poi otteniamo la connessione lineare del critico che è critico e

09:59.690 --> 10:08.090
questa colinea che applichiamo a X il segnale in uscita il CM e poi ci riprendiamo e poi

10:08.090 --> 10:15.290
prendiamo la connessione lineare dell'attore che è attore ed è colineare sono le stesse che applichiamo

10:15.290 --> 10:16.200
a x.

10:16.310 --> 10:19.580
Eccoci qua, questa è la cosa principale di cui abbiamo bisogno.

10:19.710 --> 10:26.040
Ma poi restituiremo la parte superiore di Ajax a un nodo e vedremo X per vendere il nodo perché

10:26.040 --> 10:29.490
li utilizzeremo in un secondo momento e l'aspetto retro dell'LCN.

10:29.520 --> 10:30.430
Va bene perfetto.

10:30.480 --> 10:32.960
Quindi ora abbiamo finito con il cervello.

10:32.970 --> 10:38.040
O dovrei dire il cervello perché in realtà abbiamo creato due cervelli per l'attore e un critico.

10:38.250 --> 10:41.990
Quindi congratulazioni per aver fatto l'ottava con il cervello.

10:42.180 --> 10:47.940
Spero che non sia stato travolgente da combinare alla CNN e ad Anniston, ma almeno la buona notizia è

10:47.940 --> 10:51.190
che stiamo lavorando davvero con il modello migliore e più potente.

10:51.300 --> 10:53.010
Quindi eccoci.

10:53.010 --> 10:55.950
In realtà, abbiamo finito con questo primo modello di famiglia.

10:56.010 --> 10:56.810
Y.

10:56.880 --> 11:02.040
E così nei prossimi due toile ci prenderemo cura dell'ottimizzatore perché stiamo andando a fare

11:02.190 --> 11:03.300
un ottimizzatore separato.

11:03.300 --> 11:08.850
Non stiamo andando a tagliare ogni riga di codice perché molti provengono dai documenti di ricerca e questo

11:08.850 --> 11:10.520
è in realtà piuttosto specifico.

11:10.530 --> 11:16.470
del treno per fare quale sarà una funzione enorme e che contiene l'algoritmo che noi vedere.

11:16.470 --> 11:22.410
E se andiamo nei dettagli di quello che sta succedendo con questo ottimizzatore questo potrebbe essere un

11:22.410 --> 11:26.890
po 'troppo travolgente per quello che succederà dopo perché abbiamo ancora la funzione

11:27.030 --> 11:29.240
Quindi credimi, vuoi mantenere un po 'di energia per quello.

11:29.310 --> 11:32.300
E quindi non passeremo troppo tempo su questo.

11:32.490 --> 11:37.830
Ma continuerò ad espandere il codice e capirai l'idea alla base di questa ottimizzazione.

11:38.190 --> 11:44.740
Quindi congratulazioni nuovamente per aver reso questa lezione di classe e ci vediamo nel prossimo ottimizzatore Statoil 290.

11:44.760 --> 11:46.140
Fino ad allora mi godo I.