WEBVTT

00:00.450 --> 00:03.170
Ciao e benvenuto in questo tutorial Python.

00:03.240 --> 00:09.180
Quindi ora siamo pronti ad addestrare la rete per ridurre al minimo la distanza quadrata tra le uscite e il

00:09.180 --> 00:13.820
bersaglio grazie a ciò che abbiamo fatto con la traccia di eleggibilità nella sezione precedente.

00:14.010 --> 00:19.560
Beh, fondamentalmente eravamo pronti a iniziare l'intero corso di formazione, sapendo che il nostro input era il nostro

00:19.560 --> 00:24.600
obiettivo, le nostre previsioni, quindi calcolare l'ultimo errore tra le previsioni e il target e quindi fare

00:24.600 --> 00:28.420
la propagazione all'indietro era ottenere una griglia al centro dei pesi dei dati.

00:28.470 --> 00:35.460
Quindi eravamo pronti a fare tutto questo, ma dal momento che vogliamo calcolare la media mobile e 100 passi

00:35.460 --> 00:38.040
sai tenere traccia della media durante l'allenamento.

00:38.160 --> 00:45.060
Beh, proprio prima di fare questo intero corso, faremo subito una lezione per ottenere una

00:45.060 --> 00:47.360
media mobile di 100 passi.

00:47.550 --> 00:49.450
Quindi non preoccuparti lo faremo rapidamente.

00:49.500 --> 00:54.270
Lo classificheremo con tre funzioni, quello che faremo tutto questo e il singolo tutorial, quindi lo

00:54.270 --> 00:54.950
faremo rapidamente.

00:54.960 --> 00:55.890
L'abbiamo già fatto.

00:55.890 --> 01:00.680
E inoltre vogliamo concentrarci sulla formazione in questo momento perché è la cosa più importante.

01:00.840 --> 01:04.500
Facciamo ora questo corso in questo singolo tutorial.

01:04.500 --> 01:10.710
Va bene quindi introdurremo una nuova classe che chiameremo e una per la media mobile, quindi

01:11.220 --> 01:13.290
andiamo con la nostra prima funzione.

01:13.290 --> 01:20.490
Quindi, naturalmente, la funzione innata che non cambia mai e questa e quella funzione

01:20.490 --> 01:22.140
prenderanno due argomenti.

01:22.140 --> 01:30.450
Il primo è l'oggetto e la dimensione futura media mobile che corrisponderà alla dimensione dell'elenco

01:30.540 --> 01:34.620
delle parole di cui calcoleremo la media.

01:34.620 --> 01:36.850
Quindi questo sarà 100.

01:36.870 --> 01:39.800
Va bene quindi abbiamo argomenti per la funzione.

01:39.840 --> 01:42.120
Ora entriamo nella funzione.

01:42.120 --> 01:47.460
Ora sapete cosa fare, dobbiamo inizializzare le variabili specifiche dell'oggetto.

01:47.460 --> 01:48.250
E questi sono.

01:48.330 --> 01:56.820
Beh, prima il primo sarà una lista di parole che sarà la lista contenente le 100 parole

01:56.910 --> 01:59.310
di cui calcoleremo la media.

01:59.310 --> 02:05.450
Quindi qui adesso stiamo semplicemente inizializzando questa lista con questa lista vuota qui.

02:05.850 --> 02:13.020
ogni parola e quindi la seconda variabile del nostro futuro oggetto sarà ovviamente la dimensione e la dimensione

02:13.500 --> 02:19.440
sarà uguale agli argomenti che verranno inseriti durante la creazione dei futuri oggetti mobili.

02:19.440 --> 02:20.250
Quindi elenca

02:20.580 --> 02:22.140
Quindi piacevole.

02:22.400 --> 02:29.850
E già siamo pronti per passare alla funzione successiva che sarà la funzione add e

02:29.850 --> 02:32.210
che aggiungerà i premi cumulativi.

02:32.220 --> 02:35.530
Fai attenzione che non è la semplice ricompensa è la ricompensa cumulativa.

02:35.610 --> 02:40.660
E questo perché sai che stiamo facendo traccia dell'eleggibilità e quindi apprendiamo ogni 10 passi.

02:40.770 --> 02:44.480
E quindi imparare con una ricompensa cumulativa e non una semplice ricompensa.

02:44.700 --> 02:52.830
Quindi questa funzione aggiunge che stiamo per fare aggiungerà la ricompensa cumulativa a quella lista di premi.

02:52.830 --> 02:59.370
Quindi Jeff lo chiameremo naturalmente e questa funzione prenderà due argomenti.

02:59.370 --> 03:05.070
Il primo è self perché useremo questa lista di parole qui perché semplicemente aggiungeremo

03:05.070 --> 03:08.350
la ricompensa cumulativa a questa lista di parole.

03:08.490 --> 03:11.650
Quindi abbiamo bisogno del sé per essere in grado di farlo da solo.

03:11.670 --> 03:18.070
E il secondo sarà i premi che rappresenteranno la ricompensa cumulativa.

03:18.570 --> 03:21.810
Va bene quindi ci sono due argomenti della funzione.

03:21.810 --> 03:25.370
Ora entriamo nella funzione e definiamo cosa deve fare.

03:25.710 --> 03:32.150
Ok, molto semplicemente la prima cosa che deve fare è che ogni volta che otteniamo un accumulo vogliamo un nuovo.

03:32.190 --> 03:38.460
Sapete quando progrediamo sui passi di tenue. Bene, quello che dobbiamo fare è aggiungere queste parole cumulative

03:38.460 --> 03:39.270
alla lista.

03:39.270 --> 03:43.650
Ed è esattamente quello che faremo scrivere una riga di codice che aggiungerà questa

03:43.650 --> 03:49.240
nuova ricompensa cumulativa che stiamo ottenendo dopo aver compiuto dieci passaggi per questa lista di parole qui.

03:49.320 --> 03:56.290
E per fare ciò dobbiamo separare due condizioni perché poiché lavorerà con i batch. Bene, vogliamo essere in alcune

03:56.340 --> 04:02.430
liste, ma in alcuni altri casi le parole possono anche essere come un singolo elemento e la

04:02.430 --> 04:09.840
sintassi per aggiungere un elemento a un elenco che è la lista di parole qui non è la stessa se

04:09.840 --> 04:13.330
si sta aggiungendo una lista o un singolo elemento.

04:13.350 --> 04:17.020
Quindi dobbiamo solo rendere questa una condizione che separerà questi due casi.

04:17.190 --> 04:22.800
E iniziamo con il primo caso che è il caso in cui quello che stiamo aggiungendo a

04:22.800 --> 04:30.240
questo elenco di parole è un elenco e per fare ciò andremo ad aggiungere è l'istanza tra parentesi abbiamo messo due argomenti il

04:30.240 --> 04:32.880
​​primo è siamo noi parole che stiamo aggiungendo.

04:33.180 --> 04:34.510
Quindi non eravamo.

04:34.680 --> 04:37.470
E il secondo è ELENCO.

04:37.620 --> 04:45.050
E quindi se la lista delle parole di un istanza significa se i premi sono in una lista.

04:45.060 --> 04:56.280
perché dato che questo è un elenco, quello che possiamo fare è usare una semplice operazione di aggiunta perché possiamo alcuni tulis per ottenere i premi.

04:57.550 --> 05:05.110
E quindi se i premi sono in una lista, quello che facciamo è molto semplicemente che prendiamo

05:05.110 --> 05:09.220
la nostra lista di ricompensa e aggiungeremo questa lista

05:09.220 --> 05:13.380
Ecco un elenco perché in questo caso verrà chiamato vero significato.

05:13.380 --> 05:21.160
E quindi possiamo semplicemente sommare questa lista alla nostra lista di parole e quindi possiamo semplicemente avere la

05:21.160 --> 05:24.300
tua lista di premi più uguali premi.

05:24.880 --> 05:30.620
E facendo questo stiamo semplicemente estendendo la lista di alcuni in questi due elenchi insieme.

05:31.090 --> 05:31.560
Tutto ok.

05:31.600 --> 05:33.860
E poi seconda condizione.

05:33.860 --> 05:41.470
Quindi possiamo semplicemente aggiungere altro in modo che se i premi non siano una lista e quindi se si tratti di un singolo elemento e quindi

05:42.130 --> 05:44.260
di ciò che accade in quel caso.

05:44.470 --> 05:49.120
Bene, è lo stesso che vogliamo aggiungere due parole alla nostra lista di parole.

05:49.420 --> 05:53.810
Ma non possiamo usare la sintassi perché le parole non saranno più una lista.

05:53.860 --> 05:55.320
Sarà un singolo elemento.

05:55.540 --> 06:00.130
E quindi quello che dobbiamo usare è un'altra sintassi che è la funzione append.

06:00.130 --> 06:04.020
Quando si desidera aggiungere un singolo elemento a un elenco a cui è possibile aggiungere qualcosa.

06:04.030 --> 06:05.890
Devi usare la funzione append.

06:05.890 --> 06:07.860
E quindi questo è esattamente quello che faremo ora.

06:07.890 --> 06:18.550
Prenderemo il nostro elenco di parole dell'oggetto e incollalo qui e poi aggiungiamo il punto e poi

06:18.550 --> 06:20.080
ne andremo primo.

06:20.560 --> 06:24.560
E naturalmente tra parentesi mettiamo gli elementi che vogliamo aggiungere.

06:24.790 --> 06:29.420
E questa è ovviamente una parola ma le parole in quel caso non saranno una lista.

06:29.500 --> 06:34.880
Sarà un singolo elemento come una singola parola cumulativa non in una lista.

06:34.910 --> 06:39.490
Va bene e allora vogliamo farlo, ma ora dobbiamo aggiungere qualcosa di più.

06:39.490 --> 06:45.310
È quello che succede quando questa lista di parole ottiene più di 100 elementi.

06:45.580 --> 06:51.760
Bene, in quel caso, quello che dobbiamo fare è eliminare il primo elemento di questo elenco ogni parola per

06:51.940 --> 06:56.440
assicurarci che questo elenco di parole contenga sempre non più di 100 elementi.

06:56.440 --> 07:01.330
Quindi, esattamente come quello che abbiamo fatto per la macchina di guida del sud

07:01.330 --> 07:11.170
quando facciamo questa finestra di go e per assicurarci di ciò, aggiungeremo una condizione while specificando che ogni volta che la lunghezza della nostra lista di parole è

07:11.530 --> 07:19.060
il numero di elementi nel nostro lista di parole ogni volta che questo numero è più grande di quella dimensione che è

07:19.060 --> 07:23.900
la dimensione che abbiamo detto qui e che più tardi sarà uguale a 100.

07:24.070 --> 07:25.390
Quando creiamo l'oggetto.

07:25.540 --> 07:30.250
Bene, non appena il numero di elementi di questa lista di parole è maggiore di 100.

07:30.370 --> 07:38.760
Bene, quello che vogliamo fare è eliminare i primi elementi della nostra lista di parole che possiamo ottenere prendendo l'indice

07:38.860 --> 07:43.300
0 che è il primo indice della nostra lista di.

07:43.570 --> 07:51.400
Questo è il primo elemento del nostro elenco di parole e vogliamo eliminarlo ogni volta che il nostro elenco di

07:51.400 --> 07:53.590
parole contiene più di 100 elementi.

07:53.590 --> 08:00.100
Quindi con questo con questo condizionale ci assicuriamo che il nostro elenco di parole non contenga mai

08:00.100 --> 08:08.290
più di 100 elementi e quindi Ora quello che possiamo fare è creare una nuova funzione per calcolare la media della

08:08.290 --> 08:12.490
nostra lista di parole che conterrà in esecuzione una cento elementi.

08:12.610 --> 08:17.400
E quindi calcoleremo la media mobile di 100 passi ogni volta.

08:18.090 --> 08:23.040
Quindi facciamo in modo che la funzione sia molto semplice perché c'è la funzione principale in

08:23.220 --> 08:27.550
Python, che è una funzione di non-pilot per calcolare la media di una lista.

08:27.690 --> 08:32.820
E quindi introduciamo qui la nostra ultima funzione che chiameremo media e questa

08:32.820 --> 08:38.430
funzione prenderà un argomento che sarà di per sé perché useremo ancora la nostra

08:38.430 --> 08:44.360
lista di parole che è una variabile di il nostro obiettivo di auto e colorazione.

08:44.660 --> 08:51.450
E ora confrontiamo la media e così direttamente restituiremo la media perché possiamo ottenerla con

08:51.780 --> 08:55.510
la funzione media a cui ovviamente stiamo giocando.

08:55.860 --> 09:01.840
Bene, quello che vogliamo calcolare è la nostra lista di ciò che penso di copiare ancora.

09:01.980 --> 09:03.000
Sì, ci siamo.

09:03.210 --> 09:08.430
Quindi restituiamo semplicemente la media della nostra lista di parole e la media.

09:08.520 --> 09:11.230
Come ho detto è una funzione non thailandese.

09:11.490 --> 09:16.770
Quindi qui e Anglish guardano quell'autoide lista di parole.

09:16.770 --> 09:21.670
E poi andiamo, abbiamo la nostra media su 100 passi perfetti.

09:21.720 --> 09:24.210
Quindi abbiamo reso quella classe molto efficiente.

09:24.210 --> 09:29.060
Ora riceviamo le istruzioni su come ottenere una media mobile di 100 passi.

09:29.280 --> 09:36.750
oggetto medio mobile quando facciamo il pozzo di allenamento, creiamo già questo oggetto medio mobile.

09:36.750 --> 09:38.640
E poiché useremo un

09:38.730 --> 09:46.340
E quindi lo chiameremo A e semplicemente e sarà un oggetto e una classe.

09:46.560 --> 09:55.010
E come abbiamo detto, vogliamo che la dimensione sia 100 perché vogliamo calcolare la media mobile su 100 passi.

09:55.200 --> 09:56.100
Così perfetta.

09:56.100 --> 09:57.080
Eccoci.

09:57.120 --> 10:01.830
Ora siamo pronti a formare la nostra intelligenza artificiale per essere finalmente intelligenti.

10:01.860 --> 10:06.120
È giunto il momento che da questo momento la nostra età diventerà intelligente.

10:06.210 --> 10:07.890
Quindi non vedo l'ora di allenarlo.

10:07.920 --> 10:11.260
Sarà abbastanza facile perché questo è qualcosa che siamo morti.

10:11.400 --> 10:12.660
Ma sarà divertente.

10:12.750 --> 10:18.090
E poi, dopo, sarà il momento di divertirsi ancora di più perché fondamentalmente la

10:18.090 --> 10:23.500
nostra età sarà completamente pronta, costruita e anche intelligente e quindi eseguiremo il codice.

10:23.700 --> 10:30.540
E poi giocherò a Doom e alla fine guarderemo i video della nostra IA AI che gioca a Doom

10:30.540 --> 10:33.420
e vedremo se riuscirà a raggiungere il giubbotto.

10:33.510 --> 10:34.520
Quindi non posso aspettare.

10:34.560 --> 10:35.810
Facciamo quell'allenamento.

10:35.820 --> 10:37.360
E fino ad allora I.