WEBVTT

00:00.490 --> 00:02.550
Bună ziua și bun venit la acest tutorial.

00:02.560 --> 00:07.550
Bine, așa că vom începe cu primul om al moralului nostru și cel mai important păscut care

00:07.630 --> 00:08.410
este încurcat.

00:08.440 --> 00:09.020
De ce.

00:09.180 --> 00:14.590
Și acest lucru este în acest dosar pe care îl vom pune în aplicare creierul homo știți creierul

00:14.650 --> 00:20.290
în inima Simmo 8: 3 care este în acest fișier care va face rețeaua neuronale care va conține, desigur,

00:20.290 --> 00:25.030
unele convolutional va ști când funcționează pentru că bineînțeles că facem încă o învățătură de întărire

00:25.030 --> 00:25.570
profundă.

00:25.690 --> 00:31.690
Deci, sunt capabili să aibă ochi și în interiorul acestei rețele neuronale va integra tot ceea ce este

00:31.870 --> 00:34.600
legat de Craigmile activ și există un bonus.

00:34.630 --> 00:39.550
După cum v-am spus că implementăm una dintre cele mai puternice morale A-3 și ceea ce face ca

00:39.550 --> 00:45.910
acest lucru să fie puternic este că va conține o înregistrare într-o nouă rețea și mai precis în memoria LCN pe termen lung,

00:45.910 --> 00:48.660
astfel încât să putem învăța proprietățile temporale ale continuă.

00:48.670 --> 00:54.710
Din nou, aceasta este de fapt proprietățile temporale ale intrărilor, astfel încât predicțiile să fie și mai bune.

00:55.270 --> 00:56.050
Așa că mergem.

00:56.050 --> 01:01.330
Punem în aplicare un model foarte puternic care combină practic toate rețelele neuronale pe care le-am văzut

01:01.420 --> 01:02.590
în cursul aprofundării.

01:02.680 --> 01:08.070
Aceasta este o rețea neurală artificială, o rețea neuronală convoluțională și o rețea nouă.

01:08.260 --> 01:13.240
Și în centrul tuturor acestor rețele există, desigur, modelul A-380 care va face AI AI

01:13.240 --> 01:14.040
foarte puternic.

01:14.410 --> 01:18.300
Deci haideți să facem acest lucru să atacăm acest model și să îl implementăm.

01:18.430 --> 01:21.760
Deci, vom începe prin a face două funcții.

01:21.850 --> 01:26.410
Există doar câteva funcții care vor avea grijă de modul în care putem iniția greutățile, deoarece

01:26.410 --> 01:30.460
știți că vom avea noi rețele și, prin urmare, vom avea greutăți și dorim

01:30.460 --> 01:36.740
doar să facem aceste două funcții pentru noi, astfel încât avem deja un instrument care se integrează foarte ușor în interiorul casei,

01:36.750 --> 01:38.090
astfel încât rețeaua neuronală.

01:38.290 --> 01:41.600
Deci aceste două funcții vor fi coloane normalizate.

01:41.600 --> 01:48.730
Inițializatorul care este, în esență, o funcție care nu numai că poate inițializa unele greutăți, ci stabilește o variație

01:48.730 --> 01:50.370
specifică a greutăților tensor.

01:50.380 --> 01:52.770
Deci exact asta vom implementa acum.

01:53.020 --> 01:57.700
Apoi vom implementa a doua funcție care va fi greutățile în această funcție

01:57.700 --> 02:01.840
și care va inițializa greutățile în timp suficient pentru a învăța.

02:01.840 --> 02:02.330
In regula.

02:02.350 --> 02:08.070
Apoi, odată ce terminăm cu aceste două funcții, vom începe implementarea rețelei neuronale.

02:08.330 --> 02:14.770
Deci haideți să facem să facem rapid aceste două funcții, așa că încep

02:14.770 --> 02:24.420
cu un def aici, atunci voi da numele acestei funcții care este normalizată și aceste coloane de bază subliniază inițializatorul.

02:24.720 --> 02:25.550
Vom merge acolo.

02:25.650 --> 02:28.780
Și această funcție va avea doar două intrări.

02:29.010 --> 02:35.790
Mai intai vor fi greutatile pe care dorim sa le initializam si deviatia standard deoarece, dupa cum am spus,

02:35.790 --> 02:40.200
vrem sa stabilim o varianta specifica pentru tensorul nostru de greutati.

02:40.230 --> 02:45.300
Și dacă vreți să înțelegeți de ce trebuie să facem acest lucru, este pentru că știi când facem

02:45.620 --> 02:50.490
rețeaua neuronală care va fi actorul și criticul în funcție de ziua de mâine și vom face

02:50.490 --> 02:53.670
două straturi separate separate pentru actor și unul pentru critic.

02:53.880 --> 02:59.970
Iar aceste două straturi complet conectate vor avea greutăți și vom stabili o abatere standard pentru fiecare dintre

02:59.970 --> 03:01.810
aceste două grupe de greutăți.

03:01.860 --> 03:05.650
Și ceea ce vom face este că vom stabili o mică abatere standard pentru actor.

03:05.700 --> 03:12.570
Va fi în jur de 0. 01 și o abatere standard mare pentru criticul care va fi în jurul valorii de 1 cred.

03:12.750 --> 03:18.690
De aceea facem această funcție astfel încât să putem stabili cu ușurință abaterea standard pentru greutățile pe care le

03:18.690 --> 03:21.900
vom inițializa mai târziu pentru actor și pentru craieni.

03:21.930 --> 03:23.560
De asta facem asta.

03:23.560 --> 03:28.860
Deci, acum vom seta o valoare implicită, dar aceasta se va schimba după aceea când vom inițializa

03:28.860 --> 03:29.500
greutățile.

03:29.520 --> 03:32.100
Deci, să folosim acest lucru pentru 1. 0.

03:32.240 --> 03:32.920
In regula.

03:33.000 --> 03:37.340
Și acum suntem gata să definim ce este în interiorul acestei funcții.

03:37.410 --> 03:41.960
Deci, ceea ce va pregăti mai întâi este ieșirea pe care o vom apela.

03:42.000 --> 03:46.310
Deci, acest lucru pentru toți este ceea ce va fi returnat de această funcție.

03:46.380 --> 03:50.210
Și la început ceea ce vom face este.

03:50.330 --> 03:56.750
Așa cum ați înțeles această ieșire va fi un tensor de greutăți care va avea o abatere standard specifică.

03:56.850 --> 04:01.970
Dar, înainte de a avea grijă să setăm abaterea standard, vrem doar să o inițializăm și

04:02.010 --> 04:06.550
apoi vom stabili deviația standard aici, care este argumentul care este intrarea acestei funcții.

04:06.870 --> 04:10.670
Deci, pentru a iniția greutățile tensorului, s-ar putea să știți cum să faceți acest lucru.

04:10.680 --> 04:12.150
Am făcut-o deja.

04:12.180 --> 04:20.250
Vom folosi biblioteca noastră torche și din această bibliotecă torche vom prelua runda și funcția care

04:21.180 --> 04:27.540
vor inițializa răspunsul încălzit cu greutăți aleatorii care urmează unei distribuiri normale.

04:27.540 --> 04:29.630
De aceea se numeste rant.

04:29.820 --> 04:31.100
Și ca pentru normal.

04:31.230 --> 04:36.380
Și acum, ceea ce avem nevoie pur și simplu pentru a introduce este numărul de elemente care distența va conține.

04:36.510 --> 04:41.510
Și acest număr de elemente este, desigur, numărul de greutăți, deoarece inițial am inițializat un tensor

04:41.500 --> 04:43.140
pentru aceste greutăți aici.

04:43.350 --> 04:53.410
Și pentru a obține acest număr de elemente putem pur și simplu să luăm greutățile noastre și să adăugăm puncte pentru a obține mărime cu paranteze.

04:53.410 --> 05:00.280
Și acest lucru va da numărul de elemente și greutăți astfel încât să creeze tensorul tortei a aceluiași

05:00.280 --> 05:05.320
număr de elemente ale greutăților noastre și va fi inițializat cu greutăți aleatorii după

05:05.320 --> 05:06.860
o distribuție normală.

05:06.860 --> 05:07.330
In regula.

05:07.360 --> 05:13.390
Și acum este timpul să setăm deviația standard pe care dorim să o avem, care este deviația standard aici.

05:13.510 --> 05:16.960
Așa că o să facem acum este o normalizare simplă.

05:16.960 --> 05:21.400
Avem un sentiment de greutăți torturate și acum vrem să o normalizăm.

05:21.600 --> 05:25.810
Și astfel, pentru ao normaliza, va scrie pur și simplu calculul explicit.

05:25.840 --> 05:34.960
Așadar, ceea ce trebuie pur și simplu să facem aici este să luăm rezultatul, apoi să îl actualizăm prin înmulțirea lui cu deviația

05:34.960 --> 05:41.140
standard pe care dorim să o împărțim cu suma pe care tocmai am menționat-o.

05:41.140 --> 05:44.960
Și pentru a obține suma pe care o vom folosi funcția rădăcină pătrată prin lanternă.

05:45.010 --> 05:48.700
Și atunci, atunci când luați aici torche că s q r t.

05:48.820 --> 05:50.710
Aceasta este funcția rădăcină pătrată.

05:50.830 --> 05:55.980
Și în interiorul nostru vom introduce pătratul câtorva greutăți ale unui vector.

05:56.160 --> 05:58.000
Și astfel ne luăm rezultatele.

05:58.210 --> 06:06.040
Apoi vom folosi funcția de alimentare la care intrăm pentru că vrem să luăm pătratul sumei

06:06.040 --> 06:08.950
și apoi să luăm soarele.

06:09.000 --> 06:15.300
Și în interior vom preciza indicele conului care conține greutatea.

06:15.310 --> 06:23.990
Vreți la unii și apoi pentru a obține aceste greutăți separat pentru că doriți să le însumați bine,

06:24.490 --> 06:29.440
de obicei, extindem școala în funcție de ieșirea noastră.

06:29.470 --> 06:29.820
In regula.

06:29.820 --> 06:37.280
Deci, aceasta va obține greutățile care până acum au fost inițializate ca un fel de greutăți Torchin care primește toate

06:37.340 --> 06:38.320
aceste greutăți.

06:38.330 --> 06:43.850
Luăm suma pătratului și apoi luăm rădăcina pătrată pentru a aplica normalizarea.

06:44.030 --> 06:50.230
Și faptul că avem această abatere standard la numărul de numerar vom asigura că îl putem scrie

06:50.230 --> 06:50.900
aici.

06:51.960 --> 06:58.890
Variantele de ieșire vor fi egale cu pătratul deviației standard.

06:58.890 --> 07:05.940
Această formulă va asigura că acest tensor de greutăți inițializat va avea o variație care va fi

07:06.030 --> 07:10.860
egală cu pătratul deviației standard pe care o punem ca argument.

07:11.190 --> 07:17.940
Și așa putem stabili o abatere standard specifică pentru viitor și de fapt criticul care va face în curând

07:17.940 --> 07:24.150
și vom alege o mică abatere standard pentru actor și una mai mare pentru critic și vom

07:24.340 --> 07:27.780
face acest lucru foarte ușor de la această funcție.

07:27.780 --> 07:28.150
In regula.

07:28.170 --> 07:31.120
Și acum avem doar un singur lucru de făcut.

07:31.200 --> 07:38.940
Este bine să reveniți la ieșirea care este acum normalizată cu această abatere standard specifică.

07:38.940 --> 07:40.340
În regulă, atât de perfectă.

07:40.350 --> 07:42.680
Aceasta este prima funcție pe care a trebuit să o facem.

07:42.870 --> 07:46.220
Acesta este primul instrument pe care îl vom folosi foarte mult în seara asta.

07:46.250 --> 07:47.290
H-3 creier mare.

07:47.370 --> 07:49.250
Avem încă o funcție pe care o putem face acum.

07:49.350 --> 07:51.130
Va fi funcția de greutate.

07:51.360 --> 07:57.160
Și aceasta este doar o funcție care va reaminti inițializarea greutăților pentru a face învățarea optimă.

07:57.570 --> 08:01.110
Deci, să facem acest lucru în tutorialul următor și până atunci.
