WEBVTT

00:00.420 --> 00:04.730
Bună ziua și bine ați venit în ultimul pas al acestei părți o clădire.

00:04.860 --> 00:10.500
Acum, singurul lucru pe care trebuie sa-l facem este sa facem ca aceasta functie Ford care va

00:10.500 --> 00:16.650
propaga semnalul de la inceput atunci cand creierul obtine imaginea la sfarsit atunci cand plasez actiunea asa ca

00:16.650 --> 00:22.260
vom face asta o întreagă funcție și asta va fi ultimul nostru pas înainte de a

00:22.260 --> 00:26.710
merge la o parte la instruirea AI cu un culang profund convoluțional.

00:26.890 --> 00:28.080
Deci, să facem asta.

00:28.080 --> 00:34.470
Vom lua apelul funcției care este de fapt similar cu funcția init care este o funcție existentă,

00:34.470 --> 00:38.760
dar de această dată o folosim pentru a apela alte funcții.

00:38.790 --> 00:43.170
Cele pe care le-am făcut înainte, pentru că știți că vom folosi funcția de transmitere din

00:43.290 --> 00:45.490
creier și funcția de port din corp.

00:45.630 --> 00:50.270
Și, prin urmare, folosim acum această funcție pentru a apela aceste funcții.

00:50.550 --> 00:53.160
Deci, apelul va lua două argumente.

00:53.160 --> 00:54.330
Primul este sine.

00:54.330 --> 01:00.220
Bineînțeles obiectul și al doilea argument care, în opinia dvs., va fi ceea ce va fi.

01:00.360 --> 01:02.910
Ei bine, facem această propagare de data asta.

01:02.910 --> 01:08.460
Deci, ceea ce dorim să luăm ca intrare este, desigur, imaginile de intrare, deoarece, desigur, acesta este punctul

01:08.460 --> 01:10.860
de plecare atunci când AI joacă jocul.

01:10.860 --> 01:16.080
Este prima vizualizare a imaginilor jocului, apoi propagă semnalele din creier și apoi

01:16.080 --> 01:17.180
joacă acțiunea.

01:17.190 --> 01:20.130
Prin urmare, al doilea argument va fi o contribuție.

01:20.610 --> 01:24.740
Și acum suntem gata să facem această propagare.

01:24.810 --> 01:26.220
Deci, să facem asta din nou.

01:26.220 --> 01:31.900
Deci, primul pas în cazul în care este primul pas este primirea imaginilor de intrare din joc.

01:32.190 --> 01:38.010
Și din moment ce aceste imagini vor intra în rețeaua neuronală. Ei bine, vă puteți imagina că trebuie

01:38.010 --> 01:42.840
să le formăm într-o structură specială, iar structura este, desigur, o structură de torte.

01:42.840 --> 01:48.420
Deci, primul lucru care se va întâmpla este că vom transforma aceste imagini într-o gamă de

01:48.420 --> 01:55.320
arbitri, apoi vom transforma-o într-un tensor de torță și apoi vom pune tensorul tortei într-o variabilă a torței care va

01:55.500 --> 01:58.260
conține atât tensorul cât și un gradient.

01:58.350 --> 02:03.780
Asta pentru graficele noastre dinamice de a calcula foarte eficient gradientele mai târziu mai repede Kattie mare

02:03.780 --> 02:04.460
în sensul.

02:04.620 --> 02:06.200
Deci asta este primul nostru pas.

02:06.270 --> 02:12.130
Și atunci când obținem formatul corect al imaginilor noastre, ei vor putea intra în

02:12.360 --> 02:16.320
rețeaua neuronală și apoi vom face toată propagarea semnalelor.

02:16.380 --> 02:20.340
Deci, să facem asta mai întâi ca să transformăm imaginea în formatul corect.

02:20.430 --> 02:23.050
Deci imaginile noastre sunt atât de mari pentru inputuri.

02:23.220 --> 02:26.780
Acum vom crea o nouă variabilă pe care o sun de intrare.

02:26.820 --> 02:30.470
Deci, aceasta este intrarea reală a rețelei neuronale și această intrare.

02:30.510 --> 02:31.760
Unde va fi.

02:31.920 --> 02:34.490
Ei bine, mai întâi trebuie să ne luăm contribuțiile.

02:34.530 --> 02:36.650
Acestea sunt imaginile noastre originale.

02:36.870 --> 02:42.190
Apoi, după cum am spus, vrem să convertim aceste imagini în matrice Nampa.

02:42.330 --> 02:49.260
Deci, pentru a face acest lucru, putem pur și simplu să luăm pe nimeni prin care să avem o comandă rapidă și apoi o matrice de funcții.

02:49.500 --> 02:52.850
Așa că am pus în paranteze ale matricei de funcții.

02:52.890 --> 02:53.340
Vom merge acolo.

02:53.340 --> 02:55.940
Acum este convertit în ceva și prin matrice.

02:56.190 --> 03:02.790
Dar atunci când celulele matriceelor ​​numpad vor conține pixeli, este mai sigur să specificați

03:02.790 --> 03:04.230
tipul de float.

03:04.310 --> 03:11.040
Este mai bine să ne asigurăm că avem niște flotoare chiar acum pentru a ne asigura că putem folosi acel flotor.

03:11.090 --> 03:12.690
Imi pare rau sa aud.

03:12.720 --> 03:15.390
Bine, deci avem încă un arbitru.

03:15.540 --> 03:17.330
Dar cu tableta.

03:17.720 --> 03:24.150
În regulă și asta este și un alt motiv pentru care tensorii sunt, prin definiție, tablouri de un singur tip.

03:24.270 --> 03:28.060
Și deci alegem un singur tip de flotor 32.

03:28.060 --> 03:28.350
In regula.

03:28.350 --> 03:34.440
Acum, când avem non-bio raise, următorul pas este să transformăm acest lucru într-un senzor de broască țestoasă și

03:34.440 --> 03:37.990
pentru a face acest lucru putem folosi de exemplu torța.

03:38.070 --> 03:45.380
Și apoi din funcția de subliniere non-pilot care va transforma acest lucru într-un senzor de torță.

03:45.420 --> 03:46.200
Vom merge acolo.

03:46.210 --> 03:52.320
Și ultimul pas este să punem acești senzori de torță într-o variabilă a torței care conține atât tensorul, cât

03:52.320 --> 03:53.230
și acordul.

03:53.400 --> 04:02.010
Si stiti cum sa faceti acest lucru, desigur, luam clasa variabila, deoarece tot ceea ce este in interiorul acestei

04:02.010 --> 04:05.530
variabile este de fapt intrarea clasei variabile.

04:05.760 --> 04:11.400
Dar am vrut să vă arăt acest lucru pentru că știți că începem cu imaginile noastre de intrare,

04:11.400 --> 04:15.890
apoi le transformăm în matrice numerotate, apoi să torționăm tensorii și apoi mâine.

04:16.170 --> 04:17.220
Și acum suntem buni.

04:17.220 --> 04:23.370
Acestea sunt permise să intre în rețeaua neuronală care este mai întâi ochii ochiului și apoi straturile

04:23.370 --> 04:25.770
conectate complet să conducă la predicții.

04:26.220 --> 04:30.340
Deci vorbind despre ochii ochilor, exact ce vom face acum.

04:30.480 --> 04:37.280
Vom propaga aceste imagini permise acum în ochii ochilor care se află prin cele trei

04:37.290 --> 04:38.720
straturi convoluționale.

04:38.850 --> 04:41.620
Și pentru a face asta, veți vedea acum cât de simplu este.

04:41.640 --> 04:46.290
Asta pentru că deja avem creierul în corpul nostru din funcția init.

04:46.320 --> 04:56.190
Trebuie pur și simplu să ne luăm creierul creierul și să aplicăm acest creier imaginilor de intrare și care vor propaga lucrurile

04:56.190 --> 04:59.830
la funcția alimentară de aici din creier.

05:00.430 --> 05:06.190
Aceasta va propaga semnalele din creier și din moment ce funcția forward a creierului returnează semnalele

05:06.520 --> 05:13.600
de ieșire pe care neuronii din stratul de ieșire conțin valorile Q Ei bine, această intrare a creierului aici va

05:13.610 --> 05:19.030
returna acest semnal de ieșire și, prin urmare, vom pune aici dacă se transformă

05:19.090 --> 05:26.120
într-o variabilă și o vom numi pur și simplu ca o ieșire, această ieșire este semnalul de ieșire al

05:26.120 --> 05:26.690
creierului.

05:26.930 --> 05:31.970
Și acum, acum că avem semnalul de ieșire al creierului Ei bine, trebuie să propagăm acest semnal de ieșire

05:31.970 --> 05:37.990
către organism și pentru a face acest lucru vom folosi a doua funcție de transmitere din corp și pentru a face acest lucru.

05:38.030 --> 05:46.370
Pur și simplu trebuie să ne luăm corpul și să îl aplicăm, desigur, producției deoarece funcția Ford a

05:46.370 --> 05:50.600
corpului ia ca semnal de ieșire din creier.

05:50.660 --> 05:55.880
Deci, exact ceea ce este de ieșire este acum și returnează acțiunile.

05:56.000 --> 05:58.080
Și, prin urmare, din moment ce returnează acțiunile.

05:58.380 --> 06:03.530
Ei bine, aici vom adăuga acțiuni care să ducă la sine o ieșire foarte mare.

06:03.920 --> 06:09.380
Așa că acum puteți vedea că foarte simplu am propagat semnalele din interiorul creierului și apoi

06:09.380 --> 06:15.410
de la creier la cel dintâi prin utilizarea funcției de formă din creier care ne duce și pune

06:15.410 --> 06:19.830
imaginile de intrare și apoi le propagăm în creier păstrați valorile cheie.

06:20.240 --> 06:25.400
Și apoi vom propaga acest semnal de ieșire în corpul în cazul în care funcția de transmitere a corpului nostru pentru a

06:25.520 --> 06:26.900
obține acțiunea de a juca.

06:26.900 --> 06:32.300
Și acum, singurul lucru rămas pe care trebuie să-l facem și acesta este ultimul rând al

06:32.300 --> 06:34.510
codului acestei părți care o construiește.

06:34.760 --> 06:39.370
Trebuie să revenim la acțiune pentru a juca și aceasta este o acțiune.

06:39.530 --> 06:45.020
Cu toate acestea, acum acțiunile trebuie să aibă un format torch și trebuie să le convertim înapoi în

06:45.260 --> 06:51.660
ele prin dreapta și pentru a face asta vom lua structura de date a acestor acțiuni și apoi vom adăuga aici

06:51.890 --> 06:53.840
funcția non-pilot și apoi vom merge.

06:53.840 --> 06:56.780
Acum avem acțiunile pe care le-am transformat în formatul potrivit.

06:56.780 --> 06:58.040
Deci, felicitări.

06:58.040 --> 07:00.660
Acum am terminat cu această primă parte 1.

07:00.770 --> 07:03.410
Construim AI în trei etape.

07:03.410 --> 07:06.860
Mai întâi am făcut creierul în al doilea rând pe care l-am făcut corpul.

07:06.860 --> 07:13.430
Și în al treilea rând, asamblează creierul în corp și am propagat întregul semnal din ochi în momentul

07:13.430 --> 07:15.130
în care jucăm acțiunea.

07:15.560 --> 07:17.100
Deci, este un prim pas făcut.

07:17.120 --> 07:22.200
Acesta a fost un pas uriaș, dar acum, după cum ați înțeles, am construit un AI AI, dar este încă proastă.

07:22.220 --> 07:24.110
Trebuie să-l antrenăm pentru a fi inteligent.

07:24.170 --> 07:29.030
Așa că trebuie să-l antrenăm pentru a face ceea ce vrem să facem și pentru a face asta vom

07:29.030 --> 07:34.100
folosi cuvântul trebuie să facem medii pe care le cunoașteți pentru că învață din lume, fiind întărite atunci când primește o

07:34.100 --> 07:34.690
bună răsplată.

07:34.760 --> 07:40.610
Și fiind pedepsit sau slăbit atunci când primește un cuvânt rău, unde învățarea cue va intra

07:40.610 --> 07:41.670
în joc.

07:41.690 --> 07:47.510
Și așa este exact ceea ce vom face în această parte pentru a ne antrena în ochi cu învățare profundă Q convoluțională.

07:47.510 --> 07:50.270
Nu pot să aștept să încep și până atunci.