WEBVTT

00:00.450 --> 00:05.400
Bună ziua și bun venit în această cale în Torro acum vom face funcția de

00:05.400 --> 00:11.040
transmitere care va transmite transmiterea semnalului prin tot creierul de la început cu imaginile de intrare până

00:11.130 --> 00:16.860
la ieșirile care vor conține valorile cheie pentru actor și valoarea de-valoare care este valoarea luată de funcție

00:17.040 --> 00:17.950
pentru critic.

00:18.240 --> 00:23.820
Deci, va fi destul de similar cu ceea ce am făcut pentru Dume, dar de data aceasta ceva se va schimba.

00:23.880 --> 00:25.550
Modificarea va schimba acest lucru.

00:25.560 --> 00:27.510
Acum avem o ilustrație în creier.

00:27.510 --> 00:32.470
Deci, noi toți trebuie să facem ceva mai mult pentru a propaga semnalul și atentă cu asta.

00:32.850 --> 00:38.280
Și celălalt lucru mai puțin important, dar care se schimbă în comparație cu înainte,

00:38.280 --> 00:44.220
este acela că nu vom folosi o funcție de activare reală, deoarece cunoașteți funcția de activare

00:44.220 --> 00:48.880
neliniare, dar vom folosi un joc care este într-adevăr mai sofisticat funcţie.

00:48.980 --> 00:51.390
Veți vedea că în trecut vorbim de mentăre.

00:51.780 --> 00:55.970
Deci, hai să facem această funcție, începem cu o moarte.

00:56.040 --> 00:59.190
Este de fapt ultima funcție a acestei clase exacte.

00:59.280 --> 01:06.900
Așa că o vom numi înainte ca Einstein și această a patra funcție va lua obiectul propriu

01:06.900 --> 01:09.930
deoarece vom folosi obiectele și intrările.

01:10.170 --> 01:13.520
Este important să înțelegeți ce vor fi aceste intrări.

01:13.590 --> 01:19.170
Aceasta nu va fi doar imaginile de intrare aceste intrări vor conține și nodurile ascunse și

01:19.170 --> 01:20.980
nodurile celulare ale acestora.

01:21.090 --> 01:25.120
De aceea am vrut să subliniez că unele lucruri se vor schimba acum.

01:25.180 --> 01:30.820
Practic, avem în vedere funcția de transmitere a internetului și a nodurilor celulare din listă.

01:31.200 --> 01:38.900
Și vorbind despre ei acum ce vom face este să separăm aceste două intrări ale acestui argument în punerea funcției forward

01:38.900 --> 01:41.540
și cum putem să le separăm.

01:41.700 --> 01:46.160
Ei bine, ne putem aminti un nou voievod care va fi imaginile de intrare.

01:46.230 --> 01:55.620
Așa că imaginile de intrare proiectate și le separăm cu vârfurile H x și C X, care este un templu al stărilor

01:55.620 --> 01:59.090
ascunse și a statelor celulare de la Coliseum.

01:59.370 --> 02:04.470
Deci, alte x state și Cx sunt state sudice.

02:04.540 --> 02:09.580
În regulă și care va fi egal cu intrarea care este acest argument aici.

02:09.580 --> 02:14.950
Deci, acum am făcut această separare și, prin urmare, putem începe să propagăm

02:15.220 --> 02:21.400
semnalul în întregul creier și să facem că vom obține succesive diferite straturi de

02:21.700 --> 02:28.690
la primul la ultimul, folosind conexiunile noastre care sunt convoluții conexiunea LACMA și conexiunea liniară aici,

02:29.020 --> 02:30.300
conexiunile complete.

02:30.490 --> 02:31.400
Deci, să facem asta.

02:31.450 --> 02:33.620
Acum va fi același lucru ca înainte.

02:33.750 --> 02:40.420
Vom obține primul nostru strat pe care îl vom numi X și vom obține primul strat de care avem nevoie pentru

02:40.510 --> 02:46.240
a propaga semnalul de la intrările în acest prim strat și de aceea trebuie să folosim prima

02:46.240 --> 02:51.770
convoluție deoarece este prima convoluție care propagă semnalul de la imaginile de intrare la primul strat.

02:52.030 --> 02:58.450
Deci, ceea ce vom face acum este să copiați acest lucru pentru că aceasta este prima convoluție pe care

02:58.450 --> 03:06.100
am avut-o aici și aplicăm această primă convoluție imaginilor noastre de intrare care sunt acum intrările potrivite și pe care le obținem care

03:06.100 --> 03:09.560
propagă semnalul de la imaginile de intrare primul strat.

03:09.820 --> 03:16.390
Dar acum rețineți că trebuie să folosim o funcție de activare neliniară pentru a sparge liniaritatea pentru a putea afla relațiile

03:16.390 --> 03:23.170
neliniare din interiorul imaginilor și pentru a face acest lucru vom folosi așa cum am spus funcția de activare pe care suntem

03:23.500 --> 03:28.050
pe cale să a se vedea chiar acum și că prin atingere blocat.

03:28.180 --> 03:30.110
Dar înainte de asta, hai să înțelegem.

03:30.130 --> 03:36.430
Deci, pentru a obține este ca într-adevăr vom lua modulul funcțional care are o

03:36.490 --> 03:45.790
scurtătură și apoi că și apoi o buclă și apoi am pus toate acestea în paranteze pentru că vrem să activați neliniar neuronii.

03:45.880 --> 03:51.160
Acest prim strat pe care l-am obținut prin aplicarea primei convoluții pe intrări.

03:51.160 --> 03:55.310
Acum, hai să mergem la pistolul PI Doug să înțelegem ce este.

03:55.360 --> 03:56.110
Aici este.

03:56.200 --> 04:00.320
Așa că puteți să-l accesați la torță blocat sau slash lovi cu pumn.

04:00.340 --> 04:06.940
Și apoi HG și L și apoi trebuie să găsiți activări neliniare și apoi funcțiile de activare neliniare pe care

04:06.940 --> 04:08.080
le veți găsi.

04:08.170 --> 04:14.040
Ei bine, asta e clasicul atunci când știm că e doar o valoare maximă de zero și X aveți graficul în minte.

04:14.260 --> 04:17.160
Apoi, aveți șase care este acesta.

04:17.160 --> 04:19.350
Deci, un pic mai sofisticat.

04:19.570 --> 04:21.190
Și apoi mergem să aruncăm o privire.

04:21.550 --> 04:26.470
Și după cum puteți vedea albastrul este un redo plus un element suplimentar.

04:26.620 --> 04:29.280
Deci este ca și mai sofisticat.

04:29.340 --> 04:34.180
Și așa este cel pe care îl folosim pentru a activa neliniar neuronii și straturile diferite.

04:34.180 --> 04:39.420
Și de modul în care această nouă funcție de activare este numită exponențială în unitatea lor.

04:39.490 --> 04:40.250
Așa că mergem.

04:40.270 --> 04:44.230
Aplicăm eluția pe primul strat convoluțional.

04:44.470 --> 04:46.300
Și acum lucrurile vor fi ușoare.

04:46.370 --> 04:52.270
Vom trece la următoarea pentru propagarea semnalului care este de la primul strat convoluțional

04:52.270 --> 04:59.440
la cel de-al doilea strat convoluțional pe care o vom numi X, deoarece practic doar adăugăm X,

04:59.470 --> 05:02.190
acum x este primul convoluție acolo.

05:02.290 --> 05:07.990
Și prin propagarea semnalului de la primul strat convoluțional la următorul, X va deveni următorul

05:07.990 --> 05:09.190
strat convoluțional.

05:09.520 --> 05:15.130
Și astfel, pentru a propaga semnalul de la primul strat convoluțional la cel de-al doilea, nu putem pur și

05:15.220 --> 05:20.490
simplu să îl copiem și să îl lipim aici și să îl înlocuim pe unul câte unul.

05:20.510 --> 05:27.340
Și acum, desigur, cea de-a doua convoluție nu se aplică imaginilor de intrare, ci X, care este primul strat

05:27.340 --> 05:29.530
convoluțional care este chiar aici.

05:29.830 --> 05:30.790
În regulă.

05:30.790 --> 05:32.800
Acum avem al doilea convoluție acolo.

05:33.010 --> 05:38.230
Și acum să propagăm din nou semnalul de la cea de-a doua convoluție la cea de-a treia.

05:38.230 --> 05:46.000
Și, prin urmare, putem copia direct acest lucru și lipiți-l aici și înlocuiți doi câte trei.

05:46.000 --> 05:46.840
Vom merge acolo.

05:46.990 --> 05:47.900
Și ultimul.

05:47.920 --> 05:53.770
Acum, pentru a propaga semnalul de la cea de-a treia convoluție la cea de-a patra

05:53.770 --> 05:58.770
și ultima putem copia din nou aici și înlocuim trei cu patru.

05:58.840 --> 05:59.790
Vom merge acolo.

06:00.220 --> 06:01.870
Deci, să recapitulăm.

06:01.870 --> 06:03.310
Începem cu contribuțiile noastre.

06:03.460 --> 06:07.170
Aplicăm prima convoluție pentru a obține prima convoluție acolo.

06:07.360 --> 06:12.130
Apoi aplicăm cea de-a doua convoluție la primul strat de convoluție pentru a obține cel de-al doilea

06:12.130 --> 06:12.850
strat convoluțional.

06:12.970 --> 06:17.830
Apoi aplicăm această a treia convoluție la a doua convoluție acolo pentru a obține cel de-al treilea

06:17.830 --> 06:18.510
strat convoluțional.

06:18.550 --> 06:24.650
Și în cele din urmă vom aplica a patra convoluție la a treia convoluție acolo pentru a obține a patra convoluție

06:24.650 --> 06:25.180
acolo.

06:25.510 --> 06:29.900
Și așa se transmite semnalul în ochii ochiului.

06:30.130 --> 06:35.620
Așa că am plecat acum avem semnalul de ieșire după cele patru convoluții și acum

06:35.620 --> 06:40.790
știm ce să facem trebuie să extindem întregul semnal de ieșire într-un vector dimensional.

06:40.900 --> 06:42.640
E pasul de aplatizare.

06:42.880 --> 06:45.440
Deci vom actualiza x din nou x.

06:45.490 --> 06:49.010
Acum va deveni acest vector unic dimensionat.

06:49.230 --> 06:57.070
Și pentru a face acest lucru este același lucru, trebuie să luăm X care este până în prezent al patrulea strat convoluțional X, dar apoi

06:57.520 --> 07:05.660
folosim o funcție de vedere și mai întâi punem minus unul pentru a spune că vrem un vector dimensional și apoi ca al doilea argument avem

07:05.660 --> 07:11.810
nevoie pentru a pune numărul de elemente în vector și care este amintesc de trei ori de două ori

07:11.880 --> 07:13.560
de trei ori trei.

07:13.670 --> 07:20.270
Și, prin urmare, putem pune aici de 32 ori de trei ori trei.

07:20.270 --> 07:20.720
Vom merge acolo.

07:20.720 --> 07:24.570
Acum avem vectorul nostru aplatizat, iar pasul de aplatizare se face.

07:24.680 --> 07:25.580
Perfect.

07:25.580 --> 07:28.030
Acum să ne ocupăm de partea LCN.

07:28.280 --> 07:33.030
Așa cum ați înțeles LSD ia ca intrare vectorul aplatizat.

07:33.200 --> 07:37.190
Acest vector unic dimensional de trei ori de două ori, de trei ori trei elemente.

07:37.190 --> 07:40.310
Deci este deja pregătit și bine pregătit pentru icn.

07:40.320 --> 07:49.070
Echipa este acum gata să ia acest vector Flaten ca intrări și, prin urmare, ne putem lua LACMA și intrările

07:49.190 --> 07:52.010
ca argument prima X sunt gata.

07:52.010 --> 07:55.960
FLATOW Și vectorul care este această rază x aici, pe care tocmai l-am extins.

07:56.270 --> 08:00.810
Dar, de asemenea, și în cazul în care problemele intră în joc.

08:00.890 --> 08:04.540
Trebuie să punem H x și z x.

08:04.550 --> 08:10.820
Și putem folosi ha-Satan să vedem X aici pentru că am făcut acele separări de argumentele originale

08:11.060 --> 08:12.980
de intrare ale funcției forward.

08:12.980 --> 08:20.460
Deci, LACMA X vectorul de ieșire platens după cele patru convoluții și toate ascunse în nota de celule.

08:20.480 --> 08:21.390
Așa că mergem.

08:21.440 --> 08:27.530
Apoi, nu trebuie să uităm de sine, deoarece LSD este o variabilă sau o funcție, deci o variabilă

08:27.530 --> 08:35.210
atașată la obiect în sine și un CM și acest lucru va reveni la ieșiri în total două ieșiri care vor fi

08:35.210 --> 08:37.850
nodurile de ieșire și sunetele de ieșire.

08:37.880 --> 08:42.250
Deci, este de fapt actual și, prin urmare, putem actualiza H.

08:42.260 --> 08:48.890
X y și z x nodurile de celule, deoarece aici este exact rezultatul acestui NCM.

08:50.030 --> 08:50.500
Grozav.

08:50.510 --> 08:52.750
Deci, aproape am terminat acum.

08:52.790 --> 08:58.850
Acum, că avem rezultatele de ilustrare avem nevoie pentru a obține de ieșire utilă, deoarece

08:58.850 --> 09:05.570
de fapt, doar notele ascunse sunt utile și, prin urmare, vom ajunge până atunci X și din nou

09:05.570 --> 09:12.490
X va fi egal cu atax primul element al eșantionului de ieșire din SUA un X este egal.

09:12.680 --> 09:14.270
Și aproape că am terminat.

09:14.270 --> 09:18.590
Amintiți-vă că avem două creiere un creier pentru actor într-o cameră pentru critic.

09:18.860 --> 09:24.380
Și, prin urmare, trebuie să emităm semnale pentru a returna semnalul de ieșire al actorului și semnalul de

09:24.380 --> 09:25.480
ieșire al criticului.

09:25.580 --> 09:30.730
Și, prin urmare, acum ceea ce vom face este să returnați aceste două semnale de ieșire și cum putem face acest lucru.

09:30.830 --> 09:32.010
Ei bine, este foarte ușor.

09:32.030 --> 09:38.690
Trebuie pur și simplu să luăm conexiunile noastre liniare, dar separat, care este o conexiune liniară a criticului și

09:38.770 --> 09:40.740
că întreaga legătură a actorului.

09:41.180 --> 09:47.870
Și am aplicat fiecare dintre aceste conexiuni la ieșirea X, care este o ieșire utilă a LACMA și care va fi

09:47.870 --> 09:50.470
tot ceea ce va fi semnalul de ieșire.

09:50.480 --> 09:50.990
Așa că mergem.

09:50.990 --> 09:51.840
S-o facem.

09:51.900 --> 09:59.660
Mai intai primim sine sau obiect, atunci primim conexiunea linica a criticului care este critic si acest colinear pe

09:59.690 --> 10:08.090
care il aplicam la X semnalul de iesire CM si apoi acelasi ne luam pe sine din nou atunci si apoi

10:08.090 --> 10:15.290
luam legatura liniare a actorului care este actor și este colinear sunt aceleași pe care le aplicăm

10:15.290 --> 10:16.200
la x.

10:16.310 --> 10:19.580
Acolo mergem, acesta este principalul lucru de care avem nevoie.

10:19.710 --> 10:26.040
Dar apoi vom reveni pe partea de sus a lui Ajax la un nod și vom vedea X pentru a vinde

10:26.040 --> 10:29.490
nodul, deoarece vom folosi mai târziu și aspectul retro al LCN.

10:29.520 --> 10:30.430
În regulă.

10:30.480 --> 10:32.960
Așa că acum am terminat cu creierul.

10:32.970 --> 10:38.040
Sau ar trebui să spun creierele pentru că am făcut de fapt două creiere pentru actor și critic.

10:38.250 --> 10:41.990
Deci, felicitări pentru a face al optulea cu creierul.

10:42.180 --> 10:47.940
Sper că nu a fost prea copleșitoare să se combine la CNN și în Anniston, dar cel puțin vestea bună este că

10:47.940 --> 10:51.190
lucrăm cu adevărat la modelul cel mai bun și cel mai puternic.

10:51.300 --> 10:53.010
Așa că mergem.

10:53.010 --> 10:55.950
De fapt am terminat cu acest prim model de familie.

10:56.010 --> 10:56.810
Y.

10:56.880 --> 11:02.040
Și în următoarele două călugări vom avea grijă de optimizator, pentru că vom face

11:02.190 --> 11:03.300
un optimizator separat.

11:03.300 --> 11:08.850
Nu vom tăia fiecare linie de cod deoarece multe dintre ele provin din lucrările de cercetare și acest lucru este

11:08.850 --> 11:10.520
de fapt destul de specific.

11:10.530 --> 11:16.470
Și dacă intrăm în detaliile profunde ale ceea ce se întâmplă cu acest optimizator, acest lucru ar putea fi

11:16.470 --> 11:22.410
un pic prea copleșitor pentru ceea ce se va întâmpla în continuare pentru că avem încă funcția de tren

11:22.410 --> 11:26.890
care va fi o funcție uriașă și care conține algoritmul pe care noi vedea.

11:27.030 --> 11:29.240
Deci, crede-mă că vrei să păstrezi ceva energie pentru asta.

11:29.310 --> 11:32.300
Și, prin urmare, nu vom petrece prea mult timp în acest sens.

11:32.490 --> 11:37.830
Dar totuși voi extinde codul și veți înțelege întreaga idee din spatele acestei optimizări.

11:38.190 --> 11:44.740
Vă felicităm din nou pentru că ați făcut această clasă de activitate și vă voi vedea în următorul optimizator Statoil 290.

11:44.760 --> 11:46.140
Până atunci, bucurați-vă de I.
