WEBVTT

00:00.390 --> 00:02.550
Bună ziua și bun venit la acest tutorial.

00:02.550 --> 00:02.870
In regula.

00:02.880 --> 00:08.370
Deci, în tutorialele anterioare am făcut creierul sau dacă doriți ca creierul pentru A-3 să vadă acum, trebuie să

00:08.370 --> 00:09.560
pregătim acest creier.

00:09.660 --> 00:15.240
Dar, pentru a-și instrui creierul, avem nevoie de un optimizator care folosește acest instrument și de o țigară

00:15.240 --> 00:20.820
în centru pentru a lua greutatea în funcție de cât de mult contribuie la eroarea dintre previziuni

00:20.940 --> 00:21.900
și ținte.

00:22.200 --> 00:29.790
Și ceea ce am făcut până acum în primul și al doilea modul am folosit optimizatorul de atomi prin torche în

00:29.910 --> 00:30.660
antrenament.

00:30.840 --> 00:38.260
Dar, așa cum v-am spus, avem de-a face cu o problemă foarte dificilă, care este izbucnită, iar algoritmul A-380

00:38.260 --> 00:41.560
nu este suficient pentru a rezolva această problemă.

00:41.580 --> 00:48.480
Avem nevoie de niște optimizatori personalizați și de multe trucuri diferite pentru a rezolva această problemă fără a

00:48.480 --> 00:49.340
aștepta vârstele.

00:49.530 --> 00:56.790
Deci, acesta este scopul de a face acest lucru și de aceea avem un optimizator personalizat separat bazat pe

00:56.790 --> 00:57.990
optimizatorul de atomi.

00:58.200 --> 01:02.680
Și asta este cuprins în această clasă de inamic comun și de ce atomul împărțit.

01:02.880 --> 01:08.190
Este pentru că este de fapt atomizatorul de atomi, dar acest lucru va funcționa pe statele comune.

01:08.190 --> 01:12.840
Așa că vom explica cum funcționează și că este vorba despre toile. Deci vom trece prin

01:12.840 --> 01:18.170
diferitele funcții aici, fără a le ucide, pentru că știi că vrem să păstrăm ceva energie pentru următoarea și, în

01:18.180 --> 01:23.190
plus, este trenul pe care l-am care va dura mai mult de o sută de linii de cod.

01:23.190 --> 01:24.550
Așa că fii gata pentru asta.

01:24.600 --> 01:30.440
Și, prin urmare, vom încerca să explicăm ce se întâmplă aici într-un Statoil Statoil.

01:30.480 --> 01:31.970
Și să începem chiar acum.

01:32.810 --> 01:38.480
În regulă, mai întâi introducem acest atom de partajare a clasei, care va conține trei funcții, funcția

01:38.480 --> 01:40.900
init, memoria partajată și funcția pas.

01:41.180 --> 01:48.410
Deci, ceea ce facem mai întâi este că moștenim din optin acel atom care este, desigur, optimizatorul de atomi

01:48.410 --> 01:52.100
și că ajungem din modulul Upton din biblioteca tortei.

01:52.280 --> 01:57.980
Deci, aici suntem o heritanță clară pentru a obține instrumentele legate de optimizatorul atomic și apoi începem

01:57.980 --> 01:59.320
cu funcția init.

01:59.330 --> 02:00.990
Deci, ce se întâmplă aici.

02:01.150 --> 02:08.050
Mai întâi folosim superfuncția pentru a moșteni de la toate instrumentele și toți parametrii de bază ai atomului clasa

02:08.050 --> 02:11.310
Atom și acești parametri de bază sunt aici.

02:11.380 --> 02:16.090
Harams învață rapița Epsilon și dezintegrarea în greutate.

02:16.240 --> 02:17.920
Și apoi începem o urmărire.

02:17.980 --> 02:21.840
Acest prim Foluke pentru grupul însuși pe care îl organizează grupul Paramo.

02:21.850 --> 02:28.310
Deci, pentru noi, ceea ce reprezintă grupuri parumice create în jurul grupurilor conține toate atributele optimizatorului.

02:28.510 --> 02:34.030
Și printre aceste atribute avem parametrii pe care trebuie să îi optimizăm pe acești

02:34.030 --> 02:40.790
parametri pe care vrem să atomizăm alte căi ale rețelei care sunt conținute în grupurile de auto-parumă, probabil.

02:40.930 --> 02:44.860
Așa că mergem grupul aparține grupurilor de auto-ajutorare.

02:44.980 --> 02:50.920
Și aici avem cel de-al doilea Faltu care va obține acești parametri pe care vrem să le optimizăm

02:50.920 --> 02:54.910
și care sunt exact conținuți în grupurile de parumă de auto-îndoială, probabil.

02:54.910 --> 03:01.870
Deci, practic, trecem prin grupurile de auto-ajutor care conține toți parametrii, iar pentru fiecare grup de parametri și

03:01.930 --> 03:07.480
de auto-vorbit din grupuri vom trece prin parametrii pe care vrem să le optimizăm.

03:07.540 --> 03:14.300
Prin urmare, pentru grupul Paramo aici înseamnă pentru fiecare Tancer de greutăți pe care vrem să o optimizăm.

03:14.410 --> 03:20.200
Deci, pentru fiecare senzor de greutăți pe care vrem să o optimizăm și apoi ce se întâmplă în interiorul acestui grup cu

03:20.200 --> 03:21.550
aceste patru linii de cod.

03:21.820 --> 03:29.650
Practic, ceea ce se întâmplă este că actualizarea făcută de optimizator se bazează pe o medie mobilă exponențială

03:29.890 --> 03:31.170
a gradientului.

03:31.250 --> 03:32.880
Asta e linia de cod aici.

03:33.010 --> 03:38.270
Aceasta este media mobilă exponențială a gradientului momentului care este unul de ordin.

03:38.500 --> 03:44.860
Dar obiectele realizate de atom nu se bazează doar pe faptul că se bazează, de asemenea, pe o medie

03:45.190 --> 03:47.140
mobilă exponențială a pătratului gradientului.

03:47.260 --> 03:51.770
Aceasta este o medie mobilă exponențială a gradientului impulsului la două.

03:52.030 --> 03:55.320
Deci, aici este media mobilă exponențială a tuturor unuia.

03:55.480 --> 04:00.560
Și aici este media mobilă exponențială de două pentru fiecare dintre ele pe care EMJ le-a degradat.

04:00.790 --> 04:01.890
Așa că ce se întâmplă aici.

04:02.080 --> 04:07.930
Și acum, dacă doriți să obțineți mai mult în profunzime despre modul în care funcționează media mobilă

04:07.930 --> 04:14.560
exponențială, vă încurajez foarte mult să aruncați o privire asupra acestei metode de cercetare Adam pentru optimizarea stochastică, deoarece

04:14.860 --> 04:20.610
practic optimizatorul de atomi pe care îl implementăm chiar acum se bazează pe algoritmul unu aici.

04:20.890 --> 04:27.700
Deci, dacă doriți să aveți mai multe detalii despre modul în care algoritmul funcționează bine, această lucrare va fi cu siguranță utilă.

04:27.700 --> 04:32.720
Apoi aveți câteva explicații suplimentare asupra algoritmului cu atomii și regulile.

04:32.860 --> 04:37.840
Și știi că asta e numai dacă vrei să ataci asta înainte de a ataca funcția mare de tren

04:37.840 --> 04:39.120
care va face ulterior.

04:39.400 --> 04:41.990
OK, hai să ne întoarcem la bizon.

04:42.220 --> 04:46.140
Și acum să trecem la cea de-a doua funcție de memorie partajată.

04:46.190 --> 04:47.890
Deci, acum voi spune doar câteva cuvinte.

04:48.010 --> 04:54.580
Ideea acestei funcții de memorie partajată este un fel de tensor pe care kuda îl cunoașteți ca fiind un accelerator bazat

04:54.580 --> 04:55.830
pe o vedere.

04:55.870 --> 05:03.160
Și, în principiu, ceea ce se întâmplă aici este că avem acești tensori ai statelor care împărtășesc memoria aici

05:03.160 --> 05:10.210
aici și aici, care se comportă un pic ca un tenso care ar putea accelera calculul accelerat.

05:10.420 --> 05:17.140
Dar diferența este că aici senzorii care împărtășesc memoria trimit calculul la o parte din GP-ul

05:17.140 --> 05:22.150
pe care tu sau tu îl ai accesibil tuturor amenințărilor paralizate.

05:22.160 --> 05:23.580
Deci, asta e practic ceea ce se face aici.

05:23.590 --> 05:30.220
E un pic cam ca 10 la acel kuda dar este trimis doar unei părți a GP pentru

05:30.220 --> 05:32.090
a fi accesibil amenințărilor paralelizate.

05:32.090 --> 05:32.460
In regula.

05:32.470 --> 05:35.100
Și apoi avem ultimul pas de funcție.

05:35.110 --> 05:41.830
Deci știți această funcție este ca metoda pas a optimizatorului de atom pe care o folosim în acest curs.

05:41.830 --> 05:47.170
Și așa se bazează din nou pe algoritmul din aceeași lucrare pe care am văzut-o înainte.

05:47.170 --> 05:48.610
Deci, acest algoritm.

05:48.850 --> 05:52.250
Așadar, doriți să înțelegeți în detaliu următoarele linii de cod.

05:52.420 --> 05:57.240
Din nou, eu Ingrid esti tu sa te uiti la acest algoritm unul prin aceasta lucrare.

05:57.580 --> 06:04.330
Și, în afară de ceea ce se face aici, nu este absolut obligatoriu, deoarece aceasta este de fapt o paste copie a

06:04.330 --> 06:07.180
metodei pas care acționează asupra acelei clase de atomi.

06:07.180 --> 06:14.050
Deci, practic ceea ce se face aici, am fi putut face acest lucru folosind moștenirea noastră, pentru

06:14.050 --> 06:20.620
că aici moștenim din Acton că Adam și așa vom folosi moștenirea noastră. Ei bine,

06:20.620 --> 06:29.260
ce putem face în loc să facem toate acestea este doar de gând să scriu aici. superfuncționalitatea pe care o aplicăm clasei

06:29.710 --> 06:38.020
noastre comune Adam, atunci obiectul nostru de sine și aici adăugăm doar pasul cu pasul parantezei este metoda actului din acea

06:38.320 --> 06:40.550
clasă și exact același lucru.

06:40.750 --> 06:45.820
De aceea spuneam doar că aici este doar o copie a pasului metodei pasului actului din

06:45.850 --> 06:46.860
clasa Atom.

06:46.930 --> 06:53.440
Deci, cred că dacă înlocuiți toate aceste lucruri prin această super funcție aplicată pentru a împărtăși lui Adam și metodei de pas,

06:53.830 --> 06:55.960
am putea obține exact același lucru.

06:57.220 --> 06:59.900
Bine, deci a fost interesant să te uiți rapid la asta.

06:59.920 --> 07:02.750
Practic, puteți vedea acest lucru ca optimizator Adam.

07:02.850 --> 07:04.530
E ca și cum am arunca o privire mai profundă la ea.

07:04.640 --> 07:10.000
Dar, din nou, dacă doriți să faceți mai multe detalii despre toate astea și dacă doriți să înțelegeți ce se

07:10.000 --> 07:14.120
întâmplă în spatele scenei, vă încurajez să aruncați o privire la această lucrare de cercetare.

07:14.170 --> 07:16.120
Voi pune link-ul în comentariile de aici.

07:16.120 --> 07:19.940
Știi că îți amintești că vei avea tot codul conectat în detalii minunate.

07:19.990 --> 07:22.120
Deci e foarte bine dacă poți să te uiți la ea.

07:22.580 --> 07:30.310
Și acum sper că aveți o mare energie pentru că vom trece la fișierul de tren care va conține această treaptă imensă

07:30.310 --> 07:35.860
de tren și care va pregăti practic creierul nostru pe care acum îl putem face pentru

07:35.860 --> 07:37.510
că avem optimizatorul nostru.

07:37.690 --> 07:39.230
Deci, acum aveți o pauză bună.

07:39.250 --> 07:41.840
Aveți un somn bun și ori de câte ori vă simțiți într-o formă excelentă.

07:41.980 --> 07:44.440
Să trecem la pasul următor.

07:44.440 --> 07:45.910
Până atunci, bucurați-vă de AI.
