WEBVTT

00:00.390 --> 00:05.320
Ciao e benvenuti a parte per allenare l'occhio con kuning convoluzionale profondo.

00:05.490 --> 00:06.240
Giusto.

00:06.240 --> 00:11.550
Ora che abbiamo costruito l'IA AI con l'architettura della rete neurale il corpo nel modo in cui le azioni sono

00:11.550 --> 00:12.830
giocate e tutto il resto.

00:12.840 --> 00:17.040
È ora di allenarmi a dire con un Cuellar convoluzionale profondo.

00:17.220 --> 00:21.100
Quindi da ora in poi ti applicheremo la riproduzione dell'esperienza.

00:21.210 --> 00:23.770
Lavorare con i valori che lavorano con le parole.

00:24.000 --> 00:27.820
E ci sarà anche un bonus che migliorerà molto.

00:27.840 --> 00:33.870
Il processo di addestramento, chiamato traccia dell'eleggibilità della traccia di ammissibilità, è una tecnica potente

00:34.110 --> 00:41.880
che consiste nell'accumulare la parola su più passaggi ei valori del cubo vengono appresi su questo accumulo di parole

00:41.880 --> 00:46.860
rispetto a prima dove i valori del cubo venivano appresi dopo ogni transizione.

00:46.860 --> 00:52.800
Quindi, dopo aver ricevuto ogni parola questa volta, impareremo i valori dopo aver ottenuto diversi premi invece

00:53.040 --> 00:54.480
di una sola parola.

00:54.660 --> 01:00.530
Quindi, invece di avere una transizione dopo l'altra e sai ogni volta aggiornare il valore Q.

01:00.660 --> 01:07.620
i valori di q saranno aggiornati ogni passaggio perché l'ammissibilità traccia i radicali e i passi dell'eleggibilità traccia e fine è

01:07.710 --> 01:13.500
questo numero dopo il quale i valori di q stanno per essere aggiornati e nel nostro modello.

01:13.500 --> 01:13.820
Bene,

01:13.820 --> 01:15.600
Qui avremo tutte le chiamate allora.

01:15.630 --> 01:21.570
Ciò significa che saranno 10 passi di tracciabilità e quindi aggiorneremo e impareremo i valori q

01:21.840 --> 01:22.880
ogni 10 passaggi.

01:22.890 --> 01:26.820
Dopo aver accumulato le parole su questi 10 passaggi, questo è un bonus.

01:26.820 --> 01:32.400
Ciò renderà il nostro modello ancora più potente e vedrai che alla fine otterremo

01:32.400 --> 01:33.180
risultati eccezionali.

01:33.180 --> 01:36.020
Sono rimasto davvero sorpreso quando ho visto il risultato finale.

01:36.030 --> 01:40.430
Lavoravo su Merle's che impiegava molto tempo per essere eseguito.

01:40.430 --> 01:45.780
Sai che l'intelligenza artificiale ha richiesto molto tempo per allenarsi, ma lo vedrai con questo più la rete neurale

01:45.780 --> 01:46.640
che abbiamo creato.

01:46.860 --> 01:49.390
Questo è il nostro cervello e il nostro corpo qui con cose.

01:49.390 --> 01:55.740
Quindi otterremo un mob molto potente e quindi un'IA molto potente perché vedrete che curerà veramente

01:55.740 --> 01:56.600
le bugie.

01:56.610 --> 01:59.090
Capisci di cosa sto parlando.

01:59.370 --> 02:05.440
in questa parte 2, stiamo iniziando con l'ottenere l'ambiente Dume e in realtà preparato le linee di codice per te.

02:05.440 --> 02:06.740
Quindi, come puoi vedere

02:06.780 --> 02:12.790
Stiamo semplicemente utilizzando il file esterno di pre-elaborazione delle immagini da una cartella di directory di lavoro.

02:12.930 --> 02:19.520
Quindi, in pratica, l'ordine è piuttosto quello di prendere prima questa linea di codice che non lo rende in tribunale.

02:19.590 --> 02:24.450
0 0 è il nome dell'ambiente nel quale stiamo giocando.

02:24.450 --> 02:30.930
Quindi, per prima cosa importiamo l'ambiente con questa gemma che rende questo è ciò che puoi trovare nella pagina aperta

02:30.930 --> 02:31.970
e nelle esercitazioni.

02:32.190 --> 02:40.230
formato quadrato con le dominazioni 80 per 80 e quello che ricordo è perché nel nostro nuovo che funziona bene impostiamo le

02:40.290 --> 02:45.870
nostre immagini di input per avere i motori del tempo uno per 80 per 80.

02:45.870 --> 02:54.060
Ma poi usiamo questa classe di immagine di preprocesso che è una classe da Pre-processing delle immagini per pre-processare le immagini che entreranno

02:54.360 --> 02:58.530
nella nuova che funziona e le preprocessiamo in modo che abbiano un

02:58.560 --> 03:03.490
Ricorda che uno è il numero di canali e quindi uno significa che stiamo lavorando con immagini in bianco e nero.

03:03.660 --> 03:06.350
Ecco la scala di grigi qui.

03:06.900 --> 03:14.070
E 80 per 80 significa che il dominio delle nostre immagini di input sarà 80 per 80 e questo è

03:14.070 --> 03:20.190
ciò che impostiamo nella rete neurale, ma ovviamente dobbiamo specificarlo quando inseriamo le immagini che è esattamente

03:20.190 --> 03:23.150
ciò che facciamo qui con questo pre-elaborazione classe immagine

03:23.670 --> 03:29.610
a Doom Quindi vedremo come ucciderà i mostri cercando di raggiungere il meglio e tutto sarà super emozionante.

03:29.610 --> 03:34.920
E poi dopo che importiamo l'ambiente con il giusto formato delle immagini di input mentre importiamo

03:34.920 --> 03:40.350
l'intero gioco con i video con questa linea di codice e ricordiamo che la cosa interessante di

03:40.350 --> 03:43.410
questo è che alla fine vedremo i video giocare

03:43.440 --> 03:48.170
E ricorda che questi video andranno in questa cartella di video.

03:48.630 --> 03:49.100
Tutto ok.

03:49.230 --> 03:54.990
E l'ultima riga qui, ma voglio mostrartelo perché è importante che ora è più legato all'IA

03:55.200 --> 03:56.710
AI che stiamo costruendo.

03:56.910 --> 04:02.680
Ricorda che la nostra rete neurale prende come input le azioni del numero.

04:02.880 --> 04:07.950
Questo perché sai che vogliamo creare un'IA AI che possiamo testare facilmente in diversi ambienti

04:07.950 --> 04:09.660
e in diversi ambienti Dume.

04:09.660 --> 04:15.100
E poiché i diversi ambienti hanno un numero diverso di azioni, abbiamo specificato

04:15.120 --> 04:19.070
questo numero di azioni come l'input della CNN del cervello.

04:19.380 --> 04:26.250
E quindi ora quello che stiamo per fare è ottenere questa variabile di azioni del numero usando l'ambiente Dumah

04:26.250 --> 04:29.340
che abbiamo appena importante e creato in questa variabile.

04:29.340 --> 04:34.860
E più tardi questo numero in realtà è molto bene che stiamo per creare sarà l'input del cervello.

04:34.890 --> 04:36.000
Quindi facciamolo.

04:36.000 --> 04:42.690
Sto introducendo questo numero reale di azioni con numero variabile azioni uguali.

04:42.720 --> 04:47.870
Ora prenderemo il nostro ambiente doom che è la variabile che abbiamo creato.

04:48.150 --> 04:49.330
Così faccio il mio

04:49.500 --> 04:56.250
Poi aggiungiamo qui quello e poi bene qui andiamo prendiamo il primo spazio azione qui che è l'insieme

04:56.250 --> 04:57.200
delle tue azioni.

04:57.230 --> 05:01.960
Vi incoraggio a dare un'occhiata all'apertura di Horrible per vedere come funziona.

05:02.010 --> 05:05.530
Sai come funziona aprire gli ambienti della palestra.

05:05.670 --> 05:07.940
Ma in fondo questo è l'insieme di azioni.

05:08.040 --> 05:14.070
E da questo insieme di azioni possiamo accedere al numero di azioni nell'ambiente e fare questi

05:14.120 --> 05:15.770
dati qui e poi.

05:16.080 --> 05:25.050
E questo è il numero di azioni e quindi doom e quello spazio azione restituirà 7 6:48 perché ci

05:25.050 --> 05:26.550
sono sette azioni.

05:26.760 --> 05:32.640
So che possiamo vedere sei azioni nei due ambienti nella pagina di apertura, ma penso che possiamo

05:32.640 --> 05:33.400
anche correre.

05:33.490 --> 05:39.000
E così sai che possiamo andare avanti spostare a sinistra spostare a destra girare a sinistra girare a destra e scattare.

05:39.000 --> 05:45.090
rende tutte e sette le azioni giuste e questo è tutto per ottenere l'ambiente che dobbiamo fare il nostro ambiente.

05:45.330 --> 05:47.010
E inoltre possiamo eseguire ciò che

05:47.040 --> 05:52.640
Abbiamo un numero di azioni in modo da avere finora tutto ciò di cui abbiamo bisogno per il nostro cervello.

05:52.800 --> 05:58.320
Creeremo quindi un oggetto o un oggetto del cervello che chiameremo lettere minuscole della CNN.

05:58.500 --> 06:04.500
E dal momento che qualsiasi funzione prende un numero di azioni come argomento, metteremo il numero

06:04.900 --> 06:11.160
di azioni nella scena in un oggetto che creeremo e, naturalmente, creeremo il corpo e infine l'intelligenza

06:11.160 --> 06:11.690
artificiale.

06:11.850 --> 06:18.090
Ed è per questo che la prossima sezione lo chiamerò costruire un AI AI perché ora possiamo costruire quanti

06:18.090 --> 06:19.170
più occhi vogliamo.

06:19.170 --> 06:22.070
Questa è la cosa fantastica della programmazione orientata agli oggetti.

06:22.110 --> 06:24.290
Possiamo costruire qualsiasi IA come vogliamo.

06:24.320 --> 06:29.820
E quindi costruiremo la nostra intelligenza artificiale con il cervello sofisticato e questo è esattamente ciò

06:29.970 --> 06:31.690
che faremo nel prossimo tutorial.

06:31.860 --> 06:33.430
Fino ad allora goditi l'intelligenza artificiale.