WEBVTT

00:00.270 --> 00:02.250
Ciao e benvenuto nel negozio.

00:02.430 --> 00:05.810
Sono super eccitato perché stiamo per fare in modo che l'A-3 veda il cervello.

00:05.810 --> 00:07.430
Questo è il cervello della nostra intelligenza artificiale.

00:07.590 --> 00:10.800
E parlando di cervelli vorrei evidenziare qualcosa.

00:10.870 --> 00:15.750
Ricorda che nel primo modulo abbiamo creato un cervello semplice con solo livelli completamente connessi.

00:15.840 --> 00:22.260
Poi nel secondo modulo per Dhoom abbiamo creato un cervello che non solo aveva strati completamente connessi ma

00:22.350 --> 00:29.070
anche occhi, perché abbiamo aggiunto gli strati convoluzionali che davano gli occhi allo sguardo perché poteva osservare le

00:29.070 --> 00:31.550
immagini e capire cosa stava succedendo all'interno.

00:31.830 --> 00:37.590
E ora lo diremo anche ad un livello elevato perché creeremo un cervello che non solo

00:37.590 --> 00:41.310
avrà occhi e connetterà pienamente gli strati ma anche la memoria.

00:41.430 --> 00:46.710
Perché, come ho detto nel tutorial precedente, aggiungeremo un record su quel lavoro all'interno

00:46.710 --> 00:53.490
di questo grande cervello e questo darà una lunga memoria al nostro cervello in modo che possa comprendere

00:53.580 --> 00:57.010
le relazioni temporali le proprietà temporali delle immagini di input.

00:57.120 --> 01:02.400
Così ci siamo andati e un cervello ancora più potente posso dirvi che il Dymo

01:02.640 --> 01:09.930
di Intiman in questo momento è davvero molto potente e possiamo vedere come costruire l'intelligenza artificiale e approfondire e approfondire l'apprendimento

01:10.260 --> 01:14.820
di Forsman significa avvicinarsi sempre di più a come funziona il cervello umano.

01:14.820 --> 01:19.560
Sai che abbiamo iniziato con le relazioni di base del cervello con le connessioni lineari.

01:19.560 --> 01:22.230
Poi abbiamo aggiunto gli occhi e abbiamo aggiunto il ricordo.

01:22.230 --> 01:24.900
Chissà cosa aggiungeremo nei modelli futuri.

01:24.990 --> 01:30.780
Sapete nel 2018 forse aggiungeranno qualcosa che farà sembrare il cervello ancora più simile a un

01:30.780 --> 01:31.330
cervello umano.

01:31.680 --> 01:37.590
Ma già con occhi e memoria laser completamente connessi abbiamo già un cervello veramente buono

01:37.590 --> 01:38.280
e funzionale.

01:38.790 --> 01:39.690
Facciamolo.

01:39.750 --> 01:41.140
Facciamo questo cervello.

01:41.310 --> 01:46.470
Quindi come al solito faremo una lezione per questo perché avrà molte proprietà

01:46.470 --> 01:48.780
con le convoluzioni e la scienza.

01:48.870 --> 01:53.770
Quindi lo faremo funzionare per inizializzare tutto questo creare tutte queste connessioni.

01:54.090 --> 01:59.220
E poi ovviamente avremo la funzione Ford che ovviamente propagherà il segnale all'interno

01:59.220 --> 02:02.580
del cervello in modo da ottenere finalmente l'output.

02:02.580 --> 02:03.200
Tutto ok.

02:03.240 --> 02:04.020
Siete pronti.

02:04.140 --> 02:05.400
Facciamolo.

02:05.400 --> 02:13.470
Quindi la lezione che introduciamo in classe è chiamata credit attore perché ovviamente sto parlando di cervelli qui.

02:13.470 --> 02:13.700
&nbsp;

02:13.710 --> 02:19.440
Ma non dimentichiamo che stiamo facendo con il modello che si basa sul principio critico attivo,

02:19.650 --> 02:24.810
con l'attore e il critico separatamente, così realizzeremo una delle connessioni quasi complete per

02:24.810 --> 02:27.770
l'attore e una connessione significativa per il critico.

02:27.810 --> 02:30.880
Vedrai quanto andremo bene in realtà sarà abbastanza semplice.

02:30.900 --> 02:39.060
e questa classe di attori erediteranno dalla fine e da Maggio in modo da poter utilizzare tutti gli strumenti di Pitre.

02:39.060 --> 02:40.780
Quindi il critico attivo

02:40.860 --> 02:44.130
Quindi facciamo questo per ereditare dalla fine in quel modulo.

02:44.190 --> 02:53.000
Bene, dobbiamo prima prendere la libreria delle torce, poi quella e poi quella e Mudgal.

02:53.090 --> 02:54.100
Tutto ok.

02:54.110 --> 02:55.600
In questo modo ereditiamo da esso.

02:56.990 --> 02:57.240
Tutto ok.

02:57.260 --> 03:01.630
Quindi eccoci alla nostra prima funzione che sarà ovviamente nella sua funzione.

03:01.640 --> 03:10.400
la chiamiamo non input e la fase delle azioni che è fondamentalmente lo spazio che contiene tutte le azioni.

03:10.850 --> 03:17.970
Quindi iniziamo con la sua nella sua doppia sottolineatura quindi questa funzione assumerà come argomento sé

03:18.050 --> 03:25.820
con l'oggetto quindi la forma di input che è la dominazione delle nostre immagini di input e

03:26.000 --> 03:31.340
Sappiamo anche da questo spazio d'azione che possiamo ottenere una serie di azioni che sono un numero di

03:31.700 --> 03:33.870
azioni possibili che in effetti saranno presto disponibili.

03:33.870 --> 03:38.290
Ecco perché abbiamo anche bisogno di questo per gli argomenti.

03:38.290 --> 03:39.390
Questo è tutto ciò di cui abbiamo bisogno.

03:39.650 --> 03:45.450
E poi entriamo nella funzione e creiamo tutte le variabili proprie del nostro cervello.

03:45.830 --> 03:51.740
dalla fine di Maggio, dobbiamo usare la superfunzione in questo modo all'interno della quale inseriamo.

03:52.040 --> 03:59.450
Ma prima di farlo ricordiamo cosa dobbiamo fare per attivare in qualche modo l'eredità che possiamo usare tutti

03:59.450 --> 04:00.180
gli strumenti

04:00.440 --> 04:10.740
Critico dell'attore che è la nostra classe e poi si avvicina con l'oggetto Va bene allora

04:10.740 --> 04:14.840
e ci risiamo con la funzione.

04:14.940 --> 04:15.560
Eccoci.

04:15.600 --> 04:20.100
Questo ci dà tutti gli strumenti di cui tutti abbiamo bisogno dalla torcia per costruire il nostro cervello.

04:20.400 --> 04:21.940
Va bene allora.

04:22.170 --> 04:24.690
Bene, è tempo di fare gli occhi.

04:24.780 --> 04:26.210
Quelle sono le convoluzioni.

04:26.460 --> 04:31.770
Quindi lo faremo molto velocemente perché lo abbiamo già spiegato nei dettagli per la distruzione.

04:31.800 --> 04:34.210
Perché ricordo il giorno in cui ho avuto il ghiaccio.

04:34.260 --> 04:39.240
Quindi è esattamente la stessa cosa che stiamo per trarre conclusioni e useremo un'architettura

04:39.510 --> 04:45.240
molto semplice con 32 rivelatori di dimensioni da tre a tre di passo e uno di riempimento.

04:45.450 --> 04:50.460
Quindi questa è un'architettura piuttosto classica, ma in realtà sarà abbastanza per farvi capire

04:50.690 --> 04:53.010
che capisco cosa sta succedendo nella pausa.

04:53.010 --> 04:54.090
OK.

04:54.480 --> 04:56.750
Va bene, facciamo quelle convoluzioni.

04:56.790 --> 05:03.900
Quindi iniziamo da soli perché le convoluzioni saranno variabili degli oggetti in modo tale che possiamo chiamarlo venire

05:03.900 --> 05:09.210
e ci sarà una convoluzione di quattro e quindi questa può essere una.

05:09.540 --> 05:11.040
E noi andiamo.

05:11.040 --> 05:18.900
Prendiamo il punto N e Maggio e poi portiamo il cono alla classe perché in realtà il convenuto sarà

05:18.930 --> 05:20.670
un oggetto di disgusto.

05:21.540 --> 05:25.870
E poi dentro prima mettiamo la forma di input delle immagini.

05:25.920 --> 05:32.780
Così esattamente quello che abbiamo qui, così possiamo copiare questo e inserirlo come primo input.

05:33.090 --> 05:38.600
Quindi il secondo argomento è il numero di rivelatori di caratteristiche anche il numero di kernel.

05:38.640 --> 05:45.060
Quindi prendiamo 32 come abbiamo appena detto la scelta classica, quindi dobbiamo scegliere la dimensione del

05:45.060 --> 05:50.130
kernel che è il numero di celle che scorrerà sopra l'immagine di input.

05:50.190 --> 05:55.170
E quindi ricorda che possiamo prendere tre o quattro o cinque che sono

05:55.290 --> 05:58.460
in arrivo e ne sceglieremo tre e poi sceglieremo.

05:58.550 --> 06:01.100
Provato a.

06:01.340 --> 06:11.350
E una imbottitura di uno che andiamo per la prima convoluzione che va dall'immagine di input al primo

06:11.350 --> 06:16.210
strato convoluzionale è composta da 32 immagini contorte.

06:16.360 --> 06:18.850
Quindi ora siamo pronti per fare la seconda convoluzione.

06:18.850 --> 06:27.290
Quindi in pratica sarà quasi la stessa quindi copro questa riga e basandomi sul fatto che di seguito è

06:27.310 --> 06:33.490
stato incollato di nuovo e incollato un'ultima volta perché avremo quattro convoluzioni con quasi

06:33.490 --> 06:42.640
nulla da cambiare, quindi possiamo già sostituire Here comes uno perviene uno per tre e ne viene uno dopo il quattro.

06:42.670 --> 06:45.160
Quelle saranno le nostre quattro spire.

06:45.160 --> 06:49.330
E ora ovviamente abbiamo bisogno di cambiare alcune cose qui, ma non molto perché stiamo andando

06:49.370 --> 06:52.280
a tenere traccia di due per ciascuno e uno schema di uno.

06:52.420 --> 06:58.620
Avranno tutti 32 rilevatori di caratteristiche con 32 immagini in uscita contorte.

06:58.780 --> 07:04.040
Ma poi qui ricorda che questo corrisponde alla parte sinistra della convoluzione.

07:04.180 --> 07:09.610
Quindi in realtà corrisponde a quello che era nella parte giusta della conclusione precedente, sai che è come

07:09.610 --> 07:10.370
un domino.

07:10.390 --> 07:11.440
È davvero facile

07:11.560 --> 07:22.390
E quindi qui dobbiamo mettere 32 e qui è dove vedremo molto facilmente 32 e 32.

07:22.390 --> 07:27.790
Va bene quindi per riassumere iniziamo con le nostre immagini di input che non ne contengono.

07:27.810 --> 07:35.350
ottenendo 32 immagini contorte ognuna delle quali individua una caratteristica specifica, quindi da queste 32 immagini contorte applichiamo

07:35.800 --> 07:43.120
la seconda convoluzione per ottenere 32 nuove immagini contorte poi le stesse da queste 32 nuove immagini contorte.

07:43.420 --> 07:46.510
Simon Jones è stata la prima convoluzione

07:46.510 --> 07:52.430
Applichiamo la terza convoluzione per ottenere di nuovo 32 nuove immagini contorte e poi,

07:52.450 --> 07:57.470
dalla terza alle immagini complesse, applichiamo la quarta convoluzione per ottenere funzionalità.

07:57.490 --> 07:57.910
Tutto ok.

07:57.910 --> 08:03.700
E questo sarà sufficiente con questo o avrò una supervisione che prenderà la palla molto bene.

08:03.700 --> 08:07.250
Va bene, è così per la convoluzione. È così per gli occhi.

08:07.420 --> 08:09.490
E ora prendiamoci cura della memoria.

08:09.640 --> 08:15.520
Questa nuova funzionalità di questo cervello che stiamo implementando prima non solo avrà una

08:15.680 --> 08:23.140
supervisione ma avrà anche una memoria di memoria super lunga perché vedremo una memoria a breve termine lunga

08:23.170 --> 08:29.230
che è questo tipo di registrazione o di un neurone rete che dà al

08:29.230 --> 08:36.580
tuo modello una sorta di lunga memoria in modo che possa imparare alcune relazioni temporali lunghe del

08:36.580 --> 08:43.180
passato, dicendo che creeremo nuove variabili dal tempo con sé e questa nuova variabile la chiameremo

08:43.180 --> 08:47.260
semplicemente perché questo corrisponderà alla rete LACMA all'interno del cervello.

08:47.290 --> 08:55.240
Quindi SVM e prima di scrivere il codice per la LCN assicuriamoci di capire cosa farà questa parte del

08:55.240 --> 08:56.270
cervello LACMA.

08:56.530 --> 09:03.980
Quindi, come abbiamo capito, questo LCN viene utilizzato per apprendere le proprietà temporali delle immagini di input input.

09:04.090 --> 09:09.730
Quindi, ad esempio, se la palla colpisce un LACMA codificherà il saldo.

09:09.730 --> 09:11.410
Quindi questa è la prima cosa da capire.

09:11.410 --> 09:15.070
Sarà tipo di codificare cosa sta succedendo nel gioco.

09:15.070 --> 09:20.080
Quindi la prossima cosa importante da capire quando abbiamo implementato l'ISTM è che abbiamo

09:20.170 --> 09:26.680
bisogno di scegliere l'ordine delle dipendenze temporali e qui dato che andremo ad alimentare la nostra rete neurale

09:26.680 --> 09:33.740
con una sequenza di quattro immagini, significa che possiamo già impara alcune dipendenze temporali di ordine poiché si tratta

09:33.740 --> 09:40.310
di alcune dipendenze temporali in cui ciò che accade a 1:20 dipende da cosa succede al tempo T.

09:40.360 --> 09:45.500
T meno 1 T meno 2 e T meno 3 in modo che possiamo sicuramente farlo.

09:45.730 --> 09:51.040
Ma la buona notizia è che useremo l'analisi YEM e quindi saremo in

09:51.160 --> 09:54.560
grado di apprendere alcune relazioni temporali ancora più complesse.

09:54.650 --> 10:00.430
Ad esempio possiamo apprendere alcune semplici proprietà in cui ciò che accade in 1:20 dipenderà da cosa succederà

10:00.430 --> 10:01.370
al tempo T.

10:01.370 --> 10:05.510
T meno 20 minuti per fare meno tre meno a T meno.

10:05.940 --> 10:13.360
E questa è la parte lunga della lunga memoria a breve termine con questo saggio e possiamo imparare

10:13.360 --> 10:15.490
alcune relazioni temporali molto complesse.

10:15.490 --> 10:18.080
Va bene, aggiungiamo il nostro LCN.

10:18.160 --> 10:25.030
Quindi per fare questo useremo il modulo N in e quindi aggiungeremo la classe come T. N. cella che creerà questo come

10:25.600 --> 10:31.960
un oggetto che rappresenterà l'ora legale e parte della nuova rete, perché in questo momento

10:31.960 --> 10:38.570
è anche importante capire che stiamo facendo un CR e quindi conosci il registro convoluzionale

10:38.590 --> 10:45.520
di una nuova rete e la parte arland Parte CNN e quindi ora ciò che è

10:45.610 --> 10:51.350
necessario inserire in questa cella LACMA è prima la dimensione dell'output dopo la convoluzione.

10:51.400 --> 10:56.060
Quindi questo è 32 volte tre volte tre.

10:56.230 --> 11:02.670
Quindi questo 32 volte tre volte è in realtà l'output dopo le quattro convoluzioni qui.

11:02.830 --> 11:07.600
Ma questo diventa l'input dell'RNA, l'LSD e questo funziona.

11:07.870 --> 11:13.710
E ora perché è l'output delle quattro convoluzioni metà delle dimensioni tre due volte tre volte tre.

11:13.870 --> 11:16.030
Beh, non preoccuparti, non è così diretto.

11:16.060 --> 11:22.140
In realtà non è una formula semplice ma esiste una formula per calcolare questo numero di neuroni di output.

11:22.210 --> 11:26.490
Dopo aver appiattito le immagini raggruppate e contorte della deconvoluzione.

11:26.710 --> 11:32.050
Ma se abbiamo raccolto i termini di questa grande formula Bene, otteniamo 32 volte tre volte tre.

11:32.200 --> 11:36.060
Non volevo passare troppo tempo su questo perché abbiamo molto da fare di più.

11:36.190 --> 11:39.470
E inoltre abbiamo già fatto una funzione per calcolare questo numero.

11:39.520 --> 11:43.710
Ricorda che era per destino quando facevamo funzionare questo conteggio dei neuroni.

11:43.870 --> 11:45.750
Quindi puoi riutilizzarlo se vuoi.

11:45.760 --> 11:51.610
Non sei convinto, ma è proprio quello che otteniamo dopo aver raccolto i termini di questa grande formula

11:51.610 --> 11:53.490
come calcolare il numero di uscite.

11:53.530 --> 11:59.380
Quindi questo è per il primo argomento e quindi il secondo argomento sarà il numero di neuroni

11:59.380 --> 12:00.370
di output del.

12:00.610 --> 12:05.220
E andremo per 256 OK.

12:05.220 --> 12:12.180
il critico perché tu sappiamo che realizzeremo in realtà due nuove reti separate una per l'attore e una per

12:12.540 --> 12:19.260
il critico, ma saranno la stessa codifica delle immagini e le relazioni temporali per queste due reti neurali.

12:19.620 --> 12:25.470
E quindi cosa vuol dire ora che significa che ora abbiamo un vettore che codifica ogni

12:25.470 --> 12:31.410
evento del gioco o in altre parole abbiamo uno stato codificato e quindi è ora che

12:31.410 --> 12:33.990
possiamo fare la separazione tra l'attore e

12:33.990 --> 12:37.740
Quindi questa è la parte comune che facciamo per queste due nuove reti.

12:37.740 --> 12:43.650
Questo sarà lo stesso inizio per le due nuove reti, ma ora le cose cambieranno per l'attore

12:43.650 --> 12:49.710
e il torrente, perché ne faremo uno in piena connessione per l'attore e uno diverso rispetto alla

12:49.710 --> 12:52.200
connessione quasi completa per il craic .

12:52.230 --> 12:56.320
Quindi facciamo una pausa e facciamolo nel prossimo.

12:56.400 --> 12:57.860
Fino ad allora goditi l'intelligenza artificiale.