WEBVTT

00:00.480 --> 00:06.650
Bună ziua și bun venit la acest tutorial acum vom face această a doua funcție de a inițializa greutăți.

00:06.840 --> 00:11.190
Și aceasta va fi folosită pentru a obține o învățare optimă.

00:11.340 --> 00:13.160
De fapt, aceste greutăți.

00:13.230 --> 00:21.960
Deci, a doua funcție pe care o vom numi "greutăți" subliniază în ea și va lua ca argument

00:22.200 --> 00:26.020
obiectul și care va reprezenta rețeaua neuronală.

00:26.220 --> 00:27.080
Deci asta e tot.

00:27.090 --> 00:32.300
Și apoi colon și acum să intrăm în funcție pentru a defini ceea ce vrem să facem.

00:32.580 --> 00:38.610
De fapt, ceea ce am vrut să facem este să inițializăm greutățile noii rețele în așa fel încât să

00:38.610 --> 00:39.920
obținem o învățare optimă.

00:40.080 --> 00:43.590
Deci, acest lucru nu va părea deosebit de intuitiv.

00:43.590 --> 00:46.740
Aceasta se bazează pe lucrări de cercetare și experimente.

00:46.740 --> 00:52.440
Vom iniția greutățile într-un mod specific pe care nu l-am mai văzut până acum, dar credeți-mă

00:52.440 --> 00:54.740
că va optimiza procesul de învățare.

00:54.930 --> 01:00.760
Așa că am implementat fără să intrăm în detaliu de ce inițializăm greutățile în acest fel.

01:00.960 --> 01:06.390
Și așa vom începe folosind un truc care va fi folosit mai târziu pentru a face

01:06.660 --> 01:13.260
distincția între convoluție și conexiunea deplină deoarece știți că amintiți-vă că AI va avea ochi și de aceea va

01:13.260 --> 01:15.290
avea niște straturi de convoluție.

01:15.330 --> 01:20.550
Și, bineînțeles, vor avea și unele straturi conectate complet și vom avea o inițializare diferită

01:20.550 --> 01:23.550
a greutăților pentru aceste două tipuri de conexiuni.

01:23.820 --> 01:28.620
Deci, vom folosi acest truc pentru a separa aceste două tipuri de conexiuni

01:28.890 --> 01:34.160
și apoi vom folosi anumite condiții pentru a obține diferitele inițializări pentru fiecare dintre aceste conexiuni.

01:34.170 --> 01:40.410
Deci, acest truc este de a crea o nouă variabilă pe care vom numi numele de familie și care

01:40.410 --> 01:44.630
va fi apelată la un obiect astfel încât să reprezinte rețeaua neurală.

01:44.670 --> 01:47.140
Dar este un obiect pe care îl vom vedea mai târziu.

01:47.430 --> 01:54.290
Și vom obține atributul special de la acest obiect care va fi Kolesnik cu

01:54.390 --> 02:01.570
dublu subliniere clasa întâi dublu subliniază punct dublu subliniază numele din nou și aproape acolo.

02:01.610 --> 02:03.100
Un alt subliniere dublă.

02:03.360 --> 02:10.500
Deci, este un truc destul de urât pentru a căuta tipul de conexiune al noului nostru obiect de rețea, dar care ne va

02:10.500 --> 02:12.100
oferi exact ceea ce doriți.

02:12.210 --> 02:15.300
Veți vedea că va avea sens atunci când vom începe dacă condițiile.

02:15.540 --> 02:19.710
Și pe cale de a vorbi despre condiții, le putem opri chiar acum.

02:19.710 --> 02:26.170
Ceea ce vom face acum este să începem prima condiție care ne va aduce primul caz.

02:26.280 --> 02:34.770
Aceasta este dacă conexiunea este o convoluție și astfel să scriem această condiție corectă dacă numele de clasă este

02:35.010 --> 02:35.510
bine.

02:35.510 --> 02:45.180
Aici folosim o metodă găsită și găsită în interiorul metodei când este pusă în ghilimele pentru convoluție.

02:45.300 --> 02:54.330
Și dacă numele de clasă nu găsește poate este că vom face altceva decât minus unul care este de fapt dacă

02:54.540 --> 02:57.900
avem o convoluție deoarece Manasquan înseamnă nu.

02:58.200 --> 03:03.360
Ei bine, în acest caz vom face o inițiere specială a greutăților.

03:03.420 --> 03:07.830
Deci, această condiție înseamnă aici dacă avem o legătură de convoluție.

03:07.830 --> 03:13.910
În acest caz, ceea ce facem este să inițiem această inițiere specifică a modului în care vrem să facem.

03:14.040 --> 03:17.930
Și de aceea vor veni toate lucrurile intuitive.

03:18.060 --> 03:21.990
Vom începe prin crearea unei variabile pe care o vom numi.

03:22.180 --> 03:29.260
Și această formă de curte atât de greutate subliniază forma va fi o listă care va conține în esență forma

03:29.530 --> 03:31.310
greutăților în noua noastră rețea.

03:31.580 --> 03:35.800
Și pentru a folosi funcția listă pentru a crea o listă.

03:35.930 --> 03:42.880
Și în interiorul nostru vom pune în rețeaua neurală greutatea care va constitui ponderea rețelei

03:42.880 --> 03:43.500
neuronale.

03:43.570 --> 03:50.890
Dar în conexiunea de convoluție și pentru a obține forma acestor greutăți, folosim un alt

03:50.890 --> 03:59.670
atribut care este acela că datele și dimensiunea dimensiunilor ne vor forma forma acestor greutăți în conexiunea de convoluție.

03:59.680 --> 04:06.580
Deci acum forma de greutate conține într-o listă forma greutăților și conexiunilor de convoluție ale

04:06.880 --> 04:08.300
rețelei noastre și.

04:08.460 --> 04:14.510
În regulă, deci avem forma de greutate, apoi să inițializăm greutățile acestei conexiuni de convoluție.

04:14.560 --> 04:16.650
Vom avea nevoie de două valori.

04:16.650 --> 04:22.920
Primul este produsul primei dimensiuni prin a doua numire prin această dimensiune a treia.

04:22.930 --> 04:27.960
Deci, asta vom obține acum și apoi vom avea nevoie să obținem timpii zerosului timpuri străvechi

04:27.960 --> 04:33.570
a doua oară și, uneori, a treia dimensiune și apoi vom folosi aceste două valori în competiția cu

04:33.660 --> 04:35.660
modul în care inițializăm greutăți.

04:35.670 --> 04:37.920
Deci haideți să obțineți acest lucru prin acest prim produs.

04:37.920 --> 04:46.050
Am numit-o distracție în și care va fi egal cu produsul și vom folosi funcția prod, care este o

04:46.050 --> 04:55.270
funcție de non-Thai, care are o comandă rapidă și P So MP că PRUD și în interior prod ne introduce ceea ce vrem

04:55.260 --> 04:56.680
să facă produs.

04:57.180 --> 05:02.590
Și așa cum am spus că este diamantul și unul doi și trei din greutatea noastră.

05:02.880 --> 05:10.430
Și pentru a obține acest lucru putem lua o formă de undă și să obținem indicii acestor motoare cu trei linii.

05:10.500 --> 05:15.800
Așa că am stabilit-o pe Simonton una de până la 10 inch și trei incluse.

05:16.020 --> 05:18.770
Deci, o temnita fiind exclusa.

05:19.050 --> 05:24.230
Și așa putem obține pentru partea superioară aici nu este inclusă.

05:24.440 --> 05:35.410
Deci, asta este ceea ce vrem apoi, Același lucru pentru distracție, așa cum am spus Fan-ul va fi produsul daunei în dimensiunea de zero

05:35.410 --> 05:39.650
timp de două ori pe care am menționat trei.

05:39.730 --> 05:45.490
Și aici putem fi indexate de la două incluse la patru excluse.

05:45.730 --> 05:52.110
Așa că vom obține ca produs al timpului și două și trei și apoi îl

05:52.180 --> 05:58.900
vom putea multiplica prin design și zero la care putem accesa cu zero zero de indice zero.

05:59.230 --> 06:16.990
Așa că, pentru a rezuma acest lucru este de două ori o dată la trei și chiar mai jos avem de două ori ori în trei din

06:16.990 --> 06:20.320
lista noastră de greutăți.

06:20.320 --> 06:25.390
În regulă, acum vom folosi aceste două valori pentru a veni în ventilație și

06:25.870 --> 06:33.280
vom trece la inițiere, deoarece vom calcula o nouă valoare pe care o vom numi W bound și aceasta este egală

06:33.280 --> 06:39.530
cu rădăcina pătrată care putem obține cu o funcție și P din și cu asta ca qr t.

06:39.520 --> 06:40.830
În al doilea rând ca înainte.

06:40.840 --> 06:46.710
Deci, rădăcina pătrată de 6 împărțită prin faning out.

06:46.820 --> 06:57.340
Deci, fanii, să arătăm că avem acest W jos aici reprezintă într-un fel dimensiunea zecilor de

06:57.340 --> 06:58.140
greutăți.

06:58.240 --> 06:59.740
Și de ce am primit asta?

06:59.740 --> 07:06.130
Este pentru că atunci ceea ce trebuia să facem acum este că vrem să generăm greutăți aleatorii

07:06.130 --> 07:10.070
care sunt invers proporționale cu mărimea tensorului de greutăți.

07:10.180 --> 07:18.580
Într-adevăr, ceea ce vom face acum este să luăm noua noastră rețea și apoi să obținem ponderea ei.

07:18.580 --> 07:25.260
Prin urmare, luând în continuare greutatea atributului, accesați datele sale care sunt tensorul propriu-zis.

07:26.100 --> 07:33.330
Și apoi de la acest tensor de greutăți vom genera cântăriri aleatorii care sunt

07:33.330 --> 07:37.110
invers proporționale cu mărimea greutății tensorului.

07:37.180 --> 07:45.520
Și astfel în această funcție uniformă acum trebuie să punem o limită inferioară care va fi minus W legată, iar

07:45.520 --> 07:49.090
limita superioară care va fi plus W înapoi.

07:49.750 --> 07:52.460
OK, asta e pentru greutăți.

07:52.510 --> 07:57.460
Și acum trebuie să inițializăm prejudecățile și vestea bună pentru părtinire.

07:57.460 --> 07:59.130
Va fi mult mai simplu.

07:59.200 --> 08:07.650
Vom iniția toate acestea cu zerouri, astfel încât să obținem aceste achiziții pe care le luăm din modelul nostru desigur că este

08:08.070 --> 08:09.470
noua noastră rețea.

08:09.930 --> 08:15.790
Și apoi atributul pentru părtinire este părtinire atunci același cu accesul la date.

08:16.200 --> 08:23.430
Și apoi vom folosi o metodă care este metoda de subliniere Phil care, după cum probabil ați presupus, este folosită pentru a

08:23.580 --> 08:29.970
umple tensorul de părtinire cu zerouri bine cu regulile pe care trebuie să le precizăm că vrem să o

08:29.970 --> 08:31.600
umplem cu zerouri aici.

08:31.700 --> 08:34.230
Și de aceea pun aici Zero.

08:34.560 --> 08:40.210
În concluzie, pentru a rezuma, vom genera greutăți aleatorii invers proporționale cu mărimea

08:40.210 --> 08:43.860
greutății tensorului și am inițializat dispozitivul cu zerouri.

08:43.860 --> 08:49.850
În regulă, așa a fost pentru acțiunea Initialize la conexiunile de convoluție.

08:49.880 --> 08:52.880
Acum trebuie să facem același lucru pentru conexiunea completă.

08:53.300 --> 09:01.470
Așa că vom adăuga o nouă condiție și dacă vom folosi același șir, vom folosi numele primei clase care este

09:01.470 --> 09:05.160
această variabilă care conține diferitele denumiri ale conexiunilor.

09:05.160 --> 09:14.440
Deci, dacă numele clasei aceleași vom folosi metoda de căutare la care, atunci când a pus în citate de această dată o conexiune completă,

09:14.580 --> 09:19.050
care este o conexiune clasică liniară într-o rețea clasică neuronale artificiale.

09:19.390 --> 09:27.160
Și astfel numele pentru acest lucru este liniar și spunând că vom folosi acest truc pentru a spune că vrem să

09:27.160 --> 09:35.810
fie diferit de minus unu astfel încât acesta este acest scop de lucru de clasă lenjerie de fin sunt diferite decât minus unul înseamnă

09:35.810 --> 09:41.360
în cazul în care conexiunea este în acolo este dacă avem o legătură clasică.

09:41.360 --> 09:44.620
În cazul ăsta, cum vom inițializa greutățile.

09:44.840 --> 09:47.260
Ei bine, va fi la fel.

09:47.270 --> 09:54.020
Vom introduce voiajul de balet, care nu va șterge primul, pentru că vom fi fie în acest

09:54.050 --> 10:01.430
caz, fie în cazul respectiv, așa că nu va fi același lucru, astfel încât să putem inversa în totalitate faptul

10:01.430 --> 10:08.600
că atunci vom introduce un ventilator în variabilă care de data aceasta nu va fi egal cu produsul acestor

10:08.600 --> 10:09.440
trei dimensiuni.

10:09.650 --> 10:17.090
Dar, de data aceasta, va fi egal cu designul pur și simplu să menționați unul.

10:17.380 --> 10:23.870
Și asta pentru că pentru întreaga conexiune există mai puține conexiuni decât într-o conexiune de convoluție.

10:23.880 --> 10:29.970
Acum, este vorba de o prelegere de intuiție în cele din urmă și în secțiunea CNN, este mai puțin

10:29.970 --> 10:32.640
menționată o legătură completă decât o convoluție.

10:32.640 --> 10:39.840
Deci, pur și simplu, luăm acest timp într-un an, apoi spunem că vom avea o variabilă fan-out

10:39.840 --> 10:48.780
care va fi apoi utilizată pentru a calcula W. limitele și această dominare a fanilor va fi greutatea formei indexului

10:49.160 --> 10:49.890
0.

10:49.890 --> 10:51.470
Aceasta este diamantele zero.

10:51.480 --> 10:55.290
Bine, atunci la GWB și va fi același lucru.

10:55.470 --> 11:01.780
Ea va fi rădăcina pătrată de 6 împărțită de sumă ofensatoare și să afle.

11:01.830 --> 11:04.660
Așa că mergem.

11:04.880 --> 11:11.870
Și apoi vestea bună este că este exact la fel ca în trecut, când folosim funcția uniformă pentru

11:11.870 --> 11:20.990
greutăți și funcția de umplere pentru părtinire pentru a obține același tip de inițializare de data aceasta cu un ventilator diferit în și

11:20.990 --> 11:24.440
fan și, prin urmare, diferite w care .

11:24.560 --> 11:27.520
Deci același principiu este aceeași idee.

11:27.530 --> 11:32.660
Singurul lucru care se schimbă aici este faptul că avem mai puține domenii pentru conexiunea deplină

11:32.780 --> 11:39.160
și, prin urmare, o analiză mai simplă a acestei legături a greutăților de aici pentru a genera aceste greutăți aleatorii.

11:39.200 --> 11:45.210
Dar vestea bună este că acum nu e doar aceste greutăți și funcționează foarte mult.

11:45.380 --> 11:47.150
Dar acum avem două instrumente.

11:47.330 --> 11:50.180
Și astfel suntem gata să începem să construim creierul.

11:50.300 --> 11:51.280
Așa că nu pot să aștept.

11:51.290 --> 11:53.500
Aceasta va fi, desigur, cea mai interesantă parte.

11:53.510 --> 11:57.630
A fost doar să ne încălzim și să ne pregătim pentru lucrul cel mare.

11:57.650 --> 11:59.990
Deci, vom avea grijă de asta în următorul tutorial.

12:00.080 --> 12:02.590
Ei bine, de fapt, va fi nevoie de mai multe tutoriale, desigur.

12:02.690 --> 12:04.350
Vom începe prin a face ochii.

12:04.520 --> 12:10.040
Și apoi rețineți că vom adăuga o ilustrație pentru a afla proprietățile temporale ale intrării și apoi vom avea

12:10.040 --> 12:12.170
grijă de actor și de critic.

12:12.170 --> 12:17.000
Și acolo vom folosi acest lucru pentru a funcționa normalizat vine inițializatorul și greutățile în el.

12:17.120 --> 12:18.590
Așa că nu pot să aștept să fac asta.

12:18.590 --> 12:20.630
Vom face ceva foarte puternic acum.

12:20.630 --> 12:22.510
Așa că pregătește-te pentru asta.

12:22.790 --> 12:24.250
Până atunci, bucurați-vă de AI.
