WEBVTT

00:00.450 --> 00:03.170
Bună ziua și bun venit la acest tutorial Python.

00:03.240 --> 00:09.180
Deci, acum, că suntem pregătiți să instruim rețeaua pentru a minimiza distanța între rezultate și țintă, mulțumită

00:09.180 --> 00:13.820
a ceea ce am făcut cu traiectoria de eligibilitate din secțiunea anterioară.

00:14.010 --> 00:19.560
Ei bine, am fost gata să începem întregul antrenament prin faptul că știi că ne-am introdus tinta

00:19.560 --> 00:24.600
ținându-ne predicțiile, apoi calculând ultima eroare între predicții și țintă și apoi făcând propagarea înapoi

00:24.600 --> 00:28.420
a fost să obțineți o grilă în centrul greutății datelor.

00:28.470 --> 00:35.460
Așadar, am fost gata să facem toate aceste lucruri, din moment ce vrem să calculam media mobilă și 100 de pași pe care îi

00:35.460 --> 00:38.040
știi să țină evidența mediei în timpul antrenamentului.

00:38.160 --> 00:45.060
Ei bine, chiar înainte de a face acest antrenament de ansamblu vom face o clasă chiar acum că vom obține această

00:45.060 --> 00:47.360
medie în mișcare de 100 de pași.

00:47.550 --> 00:49.450
Deci, nu vă faceți griji că o vom face repede.

00:49.500 --> 00:54.270
Vom face clasa cu trei funcții ce vom face toate acestea și tutorialul unic, așa că o vom

00:54.270 --> 00:54.950
face rapid.

00:54.960 --> 00:55.890
Am făcut-o deja.

00:55.890 --> 01:00.680
Și, în plus, vrem să ne concentrăm atenția asupra pregătirii chiar acum, pentru că asta e cel mai important.

01:00.840 --> 01:04.500
Deci, să facem această clasă chiar acum în acest tutorial unic.

01:04.500 --> 01:10.710
Așa că vom introduce o nouă clasă pe care o vom apela și una pentru medii în mișcare și apoi

01:11.220 --> 01:13.290
vom merge cu prima noastră funcție.

01:13.290 --> 01:20.490
Așa că, desigur, funcția înnăscută care nu se schimbă niciodată în ea și această și această funcție vor

01:20.490 --> 01:22.140
lua două argumente.

01:22.140 --> 01:30.450
Prima este sine pentru obiectul și mărimea viitoare a mediei mobile, care va corespunde mărimii

01:30.540 --> 01:34.620
listei cuvintele pe care vom calcula media.

01:34.620 --> 01:36.850
Deci, asta va fi 100.

01:36.870 --> 01:39.800
În regulă, avem argumente pentru această funcție.

01:39.840 --> 01:42.120
Acum hai să intrăm în funcție.

01:42.120 --> 01:47.460
Acum știi ce trebuie să facem pentru a inițializa variabilele specifice obiectului.

01:47.460 --> 01:48.250
Și acestea sunt.

01:48.330 --> 01:56.820
Ei bine, prima prima va fi o listă de cuvinte care va fi lista cu cele 100 de cuvinte pe

01:56.910 --> 01:59.310
care le vom calcula media.

01:59.310 --> 02:05.450
Deci, chiar acum, pur și simplu inițializăm această listă cu această listă goală aici.

02:05.850 --> 02:13.020
Așa că lista fiecare cuvânt și apoi cea de-a doua variabilă a obiectului nostru viitor va fi, desigur, dimensiunea și mărimea

02:13.500 --> 02:19.440
va fi egală cu argumentele care vor fi introduse atunci când se creează obiectele medii în

02:19.440 --> 02:20.250
mișcare viitoare.

02:20.580 --> 02:22.140
Deci, vizitator.

02:22.400 --> 02:29.850
Și deja suntem gata să trecem la următoarea funcție care va fi funcția de adăugare și

02:29.850 --> 02:32.210
care va adăuga recompensele cumulate.

02:32.220 --> 02:35.530
Fii atent că nu este recompensa simplă este răsplata cumulativă.

02:35.610 --> 02:40.660
Și asta pentru că știi că facem urmări de eligibilitate și, prin urmare, învățăm la fiecare 10 pași.

02:40.770 --> 02:44.480
Și, prin urmare, învățarea cu recompensă cumulativă și nu o răsplată simplă.

02:44.700 --> 02:52.830
Deci, această funcție adaugă pe care o vom face va adăuga recompensa cumulativă la acea listă de recompense.

02:52.830 --> 02:59.370
Deci, Jeff îl vom spune desigur și această funcție va lua două argumente.

02:59.370 --> 03:05.070
Prima este sine, pentru că vom folosi această listă de cuvinte aici pentru că pur și simplu

03:05.070 --> 03:08.350
vom adăuga recompensa cumulativă la această listă de cuvinte.

03:08.490 --> 03:11.650
Așadar, avem nevoie de sine pentru a putea ajunge la sine.

03:11.670 --> 03:18.070
Și al doilea va fi recompensa care va reprezenta recompensa cumulativă.

03:18.570 --> 03:21.810
În regulă, există două argumente ale funcției.

03:21.810 --> 03:25.370
Acum hai să intrăm în funcție și să definim ce trebuie să facă.

03:25.710 --> 03:32.150
Ok, deci foarte simplu primul lucru trebuie sa faci este de fiecare data cand ajungem acumulator ne dorim unul nou.

03:32.190 --> 03:38.460
Știți când progresăm pe trepte de pași Ei bine, ce trebuie să facem este să adăugăm acest cuvânt cumulativ

03:38.460 --> 03:39.270
în listă.

03:39.270 --> 03:43.650
Și exact așa vom face noi vom scrie o linie de cod care va adăuga

03:43.650 --> 03:49.240
această nouă recompensă cumulată pe care o obținem după ce am progresat pe zece pași în această listă de cuvinte aici.

03:49.320 --> 03:56.290
Și pentru a face acest lucru trebuie să separăm două condiții deoarece, deoarece el va lucra cu loturi

03:56.340 --> 04:02.430
Ei bine, vrem să fim în anumite liste, dar în alte cazuri putem să fim cuvinte

04:02.430 --> 04:09.840
ca un singur element, iar sintaxa să adăugăm un element unui lista care conține lista cuvintelor nu este aceeași

04:09.840 --> 04:13.330
dacă adăugați o listă sau un singur element.

04:13.350 --> 04:17.020
Așa că trebuie să facem o condiție care să despartă aceste două cazuri.

04:17.190 --> 04:22.800
Și să începem cu primul caz care este cazul când ceea ce adăugăm la această listă de

04:22.800 --> 04:30.240
cuvinte este o listă și pentru a face acest lucru vom adăuga este instanță în paranteză am pus două argumente primul este

04:30.240 --> 04:32.880
este noi cuvintele pe care le adăugăm.

04:33.180 --> 04:34.510
Deci nu am fost.

04:34.680 --> 04:37.470
Și al doilea este LIST.

04:37.620 --> 04:45.050
Și astfel, dacă lista de cuvinte de exemplu înseamnă că recompensele se află într-o listă.

04:45.060 --> 04:56.280
Și dacă recompensele se află într-o listă, ceea ce facem este foarte simplu de sine că luăm lista noastră de recompense și vom adăuga această listă

04:57.550 --> 05:05.110
deoarece deoarece aceasta este o listă ce putem face este să folosim o operație de adăugare simplă

05:05.110 --> 05:09.220
pentru că putem unii tulis pentru a obține recompense.

05:09.220 --> 05:13.380
Iată o listă, deoarece în acest caz va fi numită adevărată semnificație.

05:13.380 --> 05:21.160
Și astfel putem să însumăm această listă în lista noastră de cuvinte și, prin urmare, putem pur și simplu să

05:21.160 --> 05:24.300
aveți lista dvs. de recompense plus recompense egale.

05:24.880 --> 05:30.620
Și făcând acest lucru, noi doar extindem lista de către unii din aceste două liste împreună.

05:31.090 --> 05:31.560
In regula.

05:31.600 --> 05:33.860
Și apoi a doua condiție.

05:33.860 --> 05:41.470
Deci, putem pur și simplu să adăugăm altceva, astfel încât dacă recompensele nu sunt o listă și, prin urmare, dacă este un singur element și altceva

05:42.130 --> 05:44.260
ce se întâmplă în acest caz.

05:44.470 --> 05:49.120
Ei bine, este același lucru pe care vrem să adăugăm două cuvinte în lista noastră de cuvinte.

05:49.420 --> 05:53.810
Dar nu putem folosi sintaxa, deoarece cuvintele nu vor mai fi o listă.

05:53.860 --> 05:55.320
Acesta va fi un singur element.

05:55.540 --> 06:00.130
Și deci ceea ce trebuie să folosim este o altă sintaxă care este funcția de adăugare.

06:00.130 --> 06:04.020
Când doriți să adăugați un singur element la o listă, puteți adăuga ceva.

06:04.030 --> 06:05.890
Trebuie să utilizați funcția de adăugare.

06:05.890 --> 06:07.860
Și așa este exact ceea ce vom face acum.

06:07.890 --> 06:18.550
Vom lua lista cu cuvintele obiectului și vom lipi că apoi vom adăuga punct și apoi vom

06:18.550 --> 06:20.080
merge primul.

06:20.560 --> 06:24.560
Și bineînțeles în paranteză punem elementele pe care vrem să le adăugăm.

06:24.790 --> 06:29.420
Și acesta este, desigur, cuvântul b, dar cuvintele în acest caz nu vor fi o listă.

06:29.500 --> 06:34.880
Acesta va fi un singur element ca un singur cuvânt cumulativ care nu este inclus într-o listă.

06:34.910 --> 06:39.490
În regulă și apoi vrem să facem acest lucru, dar acum trebuie să adăugăm ceva mai mult.

06:39.490 --> 06:45.310
Ce se întâmplă atunci când această listă de cuvinte primește mai mult de 100 de elemente.

06:45.580 --> 06:51.760
Ei bine, în acest caz, ceea ce trebuie să facem este să ștergem primul element din această listă în fiecare cuvânt

06:51.940 --> 06:56.440
pentru a ne asigura că această listă de cuvinte conține întotdeauna maximum 100 de elemente.

06:56.440 --> 07:01.330
Exact ca și ceea ce am făcut pentru mașina de conducere de la sud atunci

07:01.330 --> 07:11.170
când făceam fereastra asta și pentru a ne asigura acest lucru, vom adăuga o condiție în timp ce specifică faptul că ori de câte ori lungimea listei de cuvinte care

07:11.530 --> 07:19.060
este numărul de elemente din listă de cuvinte ori de câte ori acest număr este mai mare decât sine, dimensiunea care este dimensiunea

07:19.060 --> 07:23.900
pe care am spus-o aici și care ulterior va fi egală cu 100.

07:24.070 --> 07:25.390
Atunci când creăm obiectul.

07:25.540 --> 07:30.250
Ei bine, de îndată ce numărul de elemente din această listă de cuvinte este mai mare de 100.

07:30.370 --> 07:38.760
Ei bine, ceea ce vrem să facem este să ștergem primele elemente ale listei noastre de cuvinte pe care le putem obține prin

07:38.860 --> 07:43.300
luarea indexului 0 care este primul indice al listei noastre de.

07:43.570 --> 07:51.400
Acesta este primul element al listei de cuvinte și dorim să îl ștergem ori de câte ori lista noastră de cuvinte conține

07:51.400 --> 07:53.590
mai mult de 100 de elemente.

07:53.590 --> 08:00.100
Așa că, cu acest lucru cu condiționarea aici, ne asigurăm că lista noastră de cuvinte nu conține

08:00.100 --> 08:08.290
niciodată mai mult de 100 de elemente și prin urmare, acum putem face o nouă funcție de a calcula media listei

08:08.290 --> 08:12.490
de cuvinte care va conține pe rularea sute de elemente.

08:12.610 --> 08:17.400
Și, prin urmare, vom calcula media mobilă de câte 100 de pași de fiecare dată.

08:18.090 --> 08:23.040
Deci, hai să facem această funcție care va fi foarte ușoară, deoarece există funcția principală în Python,

08:23.220 --> 08:27.550
care este o funcție de la non-pilot pentru a calcula media unei liste.

08:27.690 --> 08:32.820
Așa că să prezentăm ultima noastră funcție aici pe care o vom numi medie

08:32.820 --> 08:38.430
și această funcție va lua un argument care va fi de sine pentru că vom folosi,

08:38.430 --> 08:44.360
desigur, încă lista noastră de cuvinte care este o variabilă a obiectul nostru de auto-vopsire și de colorare.

08:44.660 --> 08:51.450
Și acum, să comparăm media și astfel vom reveni direct la media, pentru că putem obține

08:51.780 --> 08:55.510
cu funcția medie la care, desigur, ne jucăm.

08:55.860 --> 09:01.840
Ei bine, ceea ce vrem să calculam înseamnă asta este lista noastră despre ceea ce cred că încă mai scriu.

09:01.980 --> 09:03.000
Da, acolo mergem.

09:03.210 --> 09:08.430
Așa că ne întoarcem pur și simplu mijlocul listei noastre de cuvinte și mijloc.

09:08.520 --> 09:11.230
Așa cum am spus este o funcție de non-Thai.

09:11.490 --> 09:16.770
Deci aici și Anglish uită-te la acea listă a cuvintelor.

09:16.770 --> 09:21.670
Și apoi mergem, avem media pe 100 de pași perfectă.

09:21.720 --> 09:24.210
Așa că am făcut această clasă foarte eficient.

09:24.210 --> 09:29.060
Acum primim instrucțiunile despre obținerea unei medii mobile de 100 de pași.

09:29.280 --> 09:36.750
Și din moment ce vom folosi un obiect mediu în mișcare când facem bine pregătirea, să creăm deja acest

09:36.750 --> 09:38.640
obiect mediu în mișcare.

09:38.730 --> 09:46.340
Și așa o vom numi A și pur și simplu și va fi un obiect și o clasă.

09:46.560 --> 09:55.010
Și cum am spus că vrem ca mărimea să fie 100, pentru că vrem să calculez media medie pe un 100 de pași.

09:55.200 --> 09:56.100
Atât de perfect.

09:56.100 --> 09:57.080
Vom merge acolo.

09:57.120 --> 10:01.830
Acum suntem pregătiți să ne instruim AI pentru a fi în sfârșit inteligenți.

10:01.860 --> 10:06.120
Este timpul ca din acest moment vârsta noastră să devină inteligentă.

10:06.210 --> 10:07.890
Așa că nu pot să aștept să-l antrenez.

10:07.920 --> 10:11.260
Va fi destul de ușor pentru că asta e ceva ce suntem morți.

10:11.400 --> 10:12.660
Dar asta va fi distractiv.

10:12.750 --> 10:18.090
Și, după aceea, va fi timpul să avem și mai multă distracție, pentru că în

10:18.090 --> 10:23.500
esență vârsta noastră vom fi pe deplin pregătiți și inteligenți și, prin urmare, vom executa codul.

10:23.700 --> 10:30.540
Și apoi voi juca Doom și în cele din urmă ne vom uita la filmele AI AI care joacă Doom și

10:30.540 --> 10:33.420
vom vedea dacă reușește să ajungă la vestă.

10:33.510 --> 10:34.520
Așa că nu pot să aștept.

10:34.560 --> 10:35.810
Să facem antrenamentul ăsta.

10:35.820 --> 10:37.360
Și până atunci.
