WEBVTT

00:00.360 --> 00:06.360
Ciao e benvenuto al divertente tutorial di questo primo modulo auto-guida che sarà epico.

00:06.360 --> 00:11.850
Stiamo andando a testare il nostro occhio sull'ambiente e lo testeremo su quattro diversi livelli.

00:11.850 --> 00:16.620
Questo è il gioco che il gioco avrà quattro livelli di difficoltà e l'obiettivo

00:16.620 --> 00:18.280
dovrà superare questi quattro livelli.

00:18.420 --> 00:20.640
Quindi saremo questi quattro livelli.

00:20.640 --> 00:27.480
Primo Livello Uno sarà il primo livello per raggiungere l'aeroporto e poi fare alcuni viaggi di andata e ritorno tra

00:27.480 --> 00:29.160
l'aeroporto e il centro città.

00:29.340 --> 00:35.430
questi round trip, supereremo il livello 1, quindi il Livello 2 di livello 2 sarà quello di fare ancora questi round trip.

00:35.450 --> 00:37.490
Quindi, non appena vediamo la macchina fare

00:37.560 --> 00:43.290
Ma sulla strada specifica che disegniamo noi stessi, ma sarà una strada facile perché è il

00:43.290 --> 00:43.840
livello 2.

00:43.980 --> 00:49.030
E naturalmente l'auto dovrà guidare da solo rimanendo su quella strada.

00:49.170 --> 00:53.420
Quindi sarà una strada che va dall'aeroporto al centro e poi dall'altra parte.

00:53.420 --> 00:57.010
E così la macchina dovrà fare questi round trip sedendosi su quella strada.

00:57.210 --> 01:00.980
Se lo fa passeremo il livello 2 e il livello 3.

01:01.030 --> 01:07.410
di disegnare alcuni ostacoli sulla mappa per vedere se la macchina riesce a evitare gli ostacoli e raggiungere comunque il suo obiettivo.

01:07.410 --> 01:08.850
Il livello 3 sarà quello

01:08.910 --> 01:12.730
Quindi nessuna preoccupazione attirerà alcuni ostacoli difficili che l'auto dovrà evitare.

01:12.930 --> 01:20.010
E vedremo se è riuscito a raggiungere l'aeroporto e il centro città e, infine, il livello per il livello più

01:20.010 --> 01:25.380
difficile per l'auto sarà quello di disegnare una strada molto difficile per raggiungere il centro.

01:25.440 --> 01:28.060
Quindi non so che sai che sarà una strada come un po 'di zigzag.

01:28.200 --> 01:31.720
Non sono un geniale architetto, ma cercherò di fare una strada impegnativa.

01:31.950 --> 01:37.830
Quindi speriamo di passare almeno il primo livello che sarebbe bello quindi speriamo di poter passare anche il secondo

01:37.920 --> 01:39.190
e il terzo livello.

01:39.420 --> 01:42.180
E se superassimo il livello 4 sarebbe meraviglioso.

01:42.180 --> 01:44.540
Facciamo così, prendiamo la sfida.

01:44.610 --> 01:49.840
Beh, in realtà l'auto che sta guidando sta per prendere la sfida, ma noi siamo il cervello dietro a questo.

01:49.860 --> 01:52.110
Quindi diciamo come funziona.

01:52.110 --> 01:57.280
Va bene quindi la prima cosa che farò è solo per darti un rapido promemoria sulla mappa.

01:57.330 --> 01:59.060
Quindi questa è la mappa.

01:59.190 --> 02:03.810
E prima guarderemo la mappa che guarderemo alla macchina che si guida da sola

02:04.020 --> 02:09.540
senza l'IA, sarà solo un'auto con quelle azioni casuali che hai visto all'inizio di questo modello.

02:09.600 --> 02:10.970
Quindi, come possiamo guardarlo.

02:11.040 --> 02:15.330
Bene, dobbiamo disattivare l'intelligenza artificiale e l'attività.

02:15.570 --> 02:19.590
Abbiamo semplicemente bisogno di mettere una temperatura uguale a zero.

02:19.620 --> 02:22.380
Ricorda che il parametro qui è la temperatura.

02:22.560 --> 02:24.240
E in questo momento è uguale a sette.

02:24.300 --> 02:25.830
Questa è una bassa temperatura.

02:25.830 --> 02:27.280
Lo aumenteremo in seguito.

02:27.510 --> 02:32.700
non vogliamo attivare l'intelligenza artificiale, abbiamo semplicemente bisogno di impostare la temperatura a zero uguale a zero.

02:32.700 --> 02:36.210
Ma se non vogliamo che l'auto abbia un cervello che è se

02:36.210 --> 02:39.980
E lo stesso qui, naturalmente, è anche la temperatura reale nel freddo.

02:39.990 --> 02:40.460
Eccoci.

02:40.470 --> 02:45.580
E poi non dobbiamo dimenticare di dire perché altrimenti non includeremo il cambiamento.

02:45.800 --> 02:47.120
Immagino che ora non ne abbiamo.

02:47.130 --> 02:49.210
Vedo che l'ho usato per attivarlo.

02:49.260 --> 02:53.180
Diamo un'occhiata alla mappa solo per darci un rapido aggiornamento.

02:53.220 --> 02:55.370
Un rapido promemoria su come appare.

02:55.530 --> 03:01.070
Quindi selezionerò tutto e premere invio.

03:01.090 --> 03:01.630
Tutto ok.

03:01.630 --> 03:03.840
E c'è la nostra mappa e c'è la nostra macchina.

03:03.880 --> 03:09.540
Quindi, come puoi vedere, la macchina sta avendo azioni totalmente casuali che sai andare a sinistra per andare

03:09.540 --> 03:16.480
dritto a destra e quindi non sta raggiungendo l'aeroporto, che è quello che ricordo in alto a sinistra della mappa e non

03:16.870 --> 03:17.500
lo raggiungo.

03:17.550 --> 03:18.410
Beh, lo ha fatto.

03:18.470 --> 03:20.230
Questo è totalmente casuale.

03:20.230 --> 03:26.680
Lo vedi ora è all'aeroporto e non sta raggiungendo l'altro obiettivo che è in centro in fondo

03:26.680 --> 03:28.220
a destra della mappa.

03:28.480 --> 03:34.030
Quindi eravamo proprio come qui ma possiamo vedere chiaramente ora che le azioni sono totalmente casuali.

03:34.030 --> 03:40.270
Non sta andando da nessuna parte e non c'è sicuramente intelligenza artificiale, ma nessuna preoccupazione.

03:40.270 --> 03:42.080
Lo attiveremo adesso.

03:42.370 --> 03:49.480
Chiuderò la mappa e riavvierò il kernel riavviando DeCarlo.

03:49.760 --> 03:52.390
Fai clic su questo pulsante dello strumento qui e poi su Sì.

03:52.820 --> 04:00.730
ora, tempo per lo spettacolo, stiamo finalmente mettendo questo treno che abbiamo fatto in macchina e attiviamo l'intelligenza artificiale.

04:00.730 --> 04:01.350
E

04:01.700 --> 04:04.090
Sono davvero entusiasta di vedere cosa succederà.

04:04.180 --> 04:10.730
Attiveremo l'aria in questo momento e per farlo dobbiamo aumentare la temperatura in modo da

04:10.730 --> 04:17.300
cambiare la temperatura che è sostituita a zero da bene iniziamo con sette come avevamo prima.

04:17.450 --> 04:19.660
Quindi specifichiamo sette qui.

04:19.670 --> 04:21.510
Va bene non dimentichiamoci di dire.

04:21.590 --> 04:26.870
E ora torniamo alla nostra mappa e ora possiamo eseguirlo nuovamente perché abbiamo riavviato

04:26.870 --> 04:27.790
il kernel.

04:27.890 --> 04:29.470
Quindi diciamolo.

04:29.990 --> 04:31.790
E qui andiamo, abbiamo la macchina.

04:31.790 --> 04:33.600
E cosa sta facendo

04:33.890 --> 04:41.180
Beh, sta cercando di trovare il modo in cui sta esplorando la sua comprensione di cosa deve fare e sta

04:41.180 --> 04:47.900
per raggiungere l'aeroporto e lì andiamo per primi raggiunti meravigliosi e ora il prossimo obiettivo è raggiungere il centro

04:48.140 --> 04:50.540
e lì solo raggiungere il centro città.

04:50.810 --> 04:56.750
E ora sta cercando di trovare l'aeroporto che ritorna all'aeroporto e lì c'è di nuovo Wonderfalls

04:56.750 --> 04:57.450
che funziona.

04:57.470 --> 05:03.200
Non è stato necessario molto tempo per esplorare imparare dagli errori che conosci, l'errore qui è quello

05:03.200 --> 05:04.380
di andare oltre.

05:04.520 --> 05:08.770
Ecco dove puniamo la macchina dandole una ricompensa leggermente negativa.

05:08.780 --> 05:10.270
Sai il suo meno 0. 2.

05:10.550 --> 05:16.760
Quindi impara da quell'errore e imparando da quell'errore è riuscito a ottenere i

05:17.000 --> 05:18.980
frutti positivi avvicinandosi all'obiettivo.

05:19.310 --> 05:21.940
E ora finalmente ha capito cosa deve fare.

05:21.980 --> 05:28.530
Raggiunge sicuramente l'aeroporto e poi raggiunge il centro e poi effettua questi viaggi di andata e ritorno.

05:28.550 --> 05:29.970
È perfetto.

05:29.990 --> 05:36.090
Abbiamo un'auto a guida autonoma, ma non posso fare a meno di notare che sembra un insetto.

05:36.170 --> 05:38.510
La macchina non sembra davvero sicura di sé.

05:38.510 --> 05:40.610
No, non ha un movimento molto sicuro.

05:40.610 --> 05:44.570
È come la tua sinistra e la destra che non si muove come un movimento di una macchina.

05:44.660 --> 05:46.090
Sembra più un insetto.

05:46.490 --> 05:47.820
Quindi lo sistemeremo.

05:47.930 --> 05:54.560
è il parametro nella funzione soft del Mac che possiamo aumentare in modo che l'azione venga restituita con più certezza.

05:54.560 --> 05:59.690
E come potresti aver indovinato, il modo per aggiustarlo è aumentare la temperatura perché ricorda

05:59.690 --> 06:00.730
che la temperatura

06:00.830 --> 06:05.630
Quindi è logico che se aumentiamo bene la temperatura potremmo finire per ottenere un'auto più sicura

06:05.630 --> 06:09.750
di sé, perché l'intelligenza artificiale sarà più sicura di quale azione dovrebbe giocare.

06:10.220 --> 06:15.350
E questo è perché l'azione sarà giocata con una probabilità più alta.

06:15.350 --> 06:20.780
L'unico problema con questo aumento della temperatura è che ricorda che l'intelligenza artificiale è

06:20.780 --> 06:26.380
meno esplorativa delle altre azioni perché aumentando la temperatura delle altre azioni avremo probabilità basse.

06:26.380 --> 06:31.760
questo momento non sembra essere un problema perché l'auto sembra non avere problemi a raggiungere i suoi obiettivi.

06:31.760 --> 06:32.310
Ma in

06:32.420 --> 06:38.840
L'aeroporto in centro quindi possiamo aumentare totalmente la temperatura se vogliamo questa cosa che finora sembra un

06:38.840 --> 06:41.140
insetto che assomiglia ad una macchina.

06:41.390 --> 06:42.620
Quindi facciamolo.

06:42.620 --> 06:45.530
Sto per chiudere questo ora.

06:45.530 --> 06:46.370
Eccoci.

06:46.370 --> 06:48.310
Riavvia nuovamente il kernel.

06:49.430 --> 06:50.590
E premere Sì.

06:50.830 --> 06:52.810
E ora aumenteremo la temperatura.

06:53.200 --> 06:54.090
Quindi facciamolo.

06:54.100 --> 07:02.170
Torno al mio file, quindi sostituisce sette per 100. Andiamo.

07:02.340 --> 07:03.410
Quindi salviamo.

07:03.720 --> 07:07.890
E ora abbiamo una macchina che si guida da sola, sicura di sé.

07:07.890 --> 07:11.990
Quindi potremmo ottenere risultati migliori e potremmo ottenere qualcosa che assomigli più ad una macchina.

07:12.270 --> 07:15.780
Prendiamo una mappa e poi torniamo a quella.

07:16.610 --> 07:18.900
Va bene, cos'è successo?

07:18.920 --> 07:19.730
OK.

07:19.830 --> 07:21.340
Ha fatto una specie di burnout.

07:21.350 --> 07:22.190
Non so perché.

07:22.310 --> 07:25.980
Ma comunque ora abbiamo qualcosa che sembra più un'auto.

07:26.060 --> 07:28.240
Puoi vedere che sta andando più dritto.

07:28.240 --> 07:31.190
Non sta facendo questi rapidi movimenti di sinistra e destra.

07:31.190 --> 07:36.410
Questo perché ora la macchina è più sicura di quale direzione prendere e ogni volta che si

07:36.410 --> 07:40.720
sa che vuole prendere la direzione migliore per l'aeroporto e poi per il centro.

07:41.000 --> 07:44.490
Quindi chiaramente ora possiamo dire che abbiamo superato il primo livello.

07:44.510 --> 07:47.840
La macchina sta facendo questi viaggi di andata e ritorno tra l'aeroporto e il centro.

07:47.990 --> 07:52.610
Quindi salveremo quello che sto per mostrarti come salvare il cervello.

07:52.610 --> 07:59.520
Dobbiamo solo cliccare su questo pulsante di salvataggio e se guardiamo a cosa succede qui.

07:59.520 --> 08:04.640
Bene, abbiamo la curva di ciò che eravamo all'inizio, possiamo osservare alcuni errori che ha fatto.

08:04.740 --> 08:06.990
Quindi è qui che la ricompensa è negativa.

08:07.170 --> 08:14.280
Ma poi ha imparato dai suoi errori e la ricompensa è aumentata a poco a poco fino a raggiungere una ricompensa

08:14.280 --> 08:19.100
positiva costante uguale ad aprirne una, ma questa è la ricompensa massima che abbiamo impostato.

08:19.200 --> 08:21.640
E questo perché è finito per esplorare.

08:21.870 --> 08:23.490
Questa è la fase di scadenza.

08:23.670 --> 08:26.200
E poi sapeva solo cosa doveva fare.

08:26.230 --> 08:32.230
Ecco dove stava facendo questi round Rountree tra l'aeroporto e il centro senza alcun errore.

08:32.640 --> 08:33.450
Quindi eccoci.

08:33.450 --> 08:34.470
Abbiamo superato il primo livello.

08:34.470 --> 08:35.850
Complimenti.

08:35.850 --> 08:38.170
Ora facciamo le cose più difficili.

08:38.190 --> 08:40.120
Prendiamo le cose al livello successivo.

08:40.140 --> 08:45.810
Proviamo a superare il livello a cui ti ricordo di fare questi round trip su una strada specifica.

08:45.830 --> 08:47.060
Disegneremo noi stessi.

08:47.120 --> 08:49.170
Quindi controlliamolo nella prossima fatica.

08:49.200 --> 08:50.780
E fino ad allora I.
