WEBVTT

00:00.450 --> 00:05.400
Cześć i witajcie na tej ścieżce do Torro, teraz zamierzamy wykonać funkcję do

00:05.400 --> 00:11.040
przodu, która będzie przekazywać sygnał przez cały mózg od samego początku, z obrazami wejściowymi do wyjść,

00:11.130 --> 00:16.860
które będą zawierać kluczowe wartości dla aktora i wartość de, która jest wartością przyjętą przez funkcję

00:17.040 --> 00:17.950
dla krytyka.

00:18.240 --> 00:23.820
Będzie to bardzo podobne do tego, co zrobiliśmy dla Dume, ale tym razem coś się zmieni.

00:23.880 --> 00:25.550
Zmieniające to zmieni to.

00:25.560 --> 00:27.510
Teraz mamy ilustrację w mózgu.

00:27.510 --> 00:32.470
Dlatego wszyscy musimy zrobić coś więcej, aby propagować sygnał i zachować ostrożność.

00:32.850 --> 00:38.280
Drugą rzeczą mniej ważną, ale wciąż zmieniającą się w porównaniu do poprzedniej,

00:38.280 --> 00:44.220
jest to, że nie będziemy używać prawdziwej funkcji aktywacji, ponieważ znamy nieliniową funkcję

00:44.220 --> 00:48.880
aktywacji, ale zamierzamy użyć toalety, która jest bardziej wyrafinowana funkcjonować.

00:48.980 --> 00:51.390
Zobaczysz, że w przeszłości mówimy o mentacji.

00:51.780 --> 00:55.970
Zróbmy więc tę funkcję zacznijmy od śmierci.

00:56.040 --> 00:59.190
Jest to właściwie ostatnia funkcja tej wyklętanej klasy.

00:59.280 --> 01:06.900
Więc nazwiemy to jak Einstein, a ta czwarta funkcja zabierze sobie obiekt, ponieważ

01:06.900 --> 01:09.930
użyjemy obiektów i danych wejściowych.

01:10.170 --> 01:13.520
Tak ważne jest zrozumienie, jakie będą te dane wejściowe.

01:13.590 --> 01:19.170
Będą to nie tylko obrazy wejściowe, które te dane wejściowe będą zawierać również ukryte węzły i

01:19.170 --> 01:20.980
węzły komórkowe tego samego.

01:21.090 --> 01:25.120
Dlatego chciałem podkreślić, że niektóre rzeczy się teraz zmienią.

01:25.180 --> 01:30.820
Zasadniczo rozważamy funkcję przekazania Internetu i węzłów komórki na liście.

01:31.200 --> 01:38.900
A mówiąc o nich, teraz, co zamierzamy zrobić, to oddzielić te dwa elementy tego argumentu od przedstawienia funkcji

01:38.900 --> 01:41.540
naprzód i jak je rozdzielić.

01:41.700 --> 01:46.160
Cóż, możemy sobie przypomnieć nowego Wojewodę, który będzie obrazem wejściowym.

01:46.230 --> 01:55.620
W ten sposób powstały obrazy wejściowe i rozdzielamy je z przewróconymi H x i C X, które są świątynią

01:55.620 --> 01:59.090
ukrytych stanów i stanów komórek w Koloseum.

01:59.370 --> 02:04.470
Zatem H x inne stany i C X to stany południowe.

02:04.540 --> 02:09.580
W porządku i to będzie równa wartości wejściowej, która jest tutaj tym argumentem.

02:09.580 --> 02:14.950
Teraz dokonaliśmy tej separacji i dlatego możemy zacząć rozprzestrzeniać sygnał

02:15.220 --> 02:21.400
w całym mózgu i aby to osiągnąć otrzymamy kolejno różne warstwy od pierwszego

02:21.700 --> 02:28.690
do ostatniego, korzystając z naszych połączeń, czyli zwojów połączenia LACMA i połączenie liniowe tutaj

02:29.020 --> 02:30.300
pełne połączenia.

02:30.490 --> 02:31.400
Zróbmy to.

02:31.450 --> 02:33.620
Teraz będzie tak samo jak wcześniej.

02:33.750 --> 02:40.420
Dostaniemy pierwszą warstwę, którą nazwiemy X i otrzymamy pierwszą warstwę, której potrzebujemy do propagowania sygnału z

02:40.510 --> 02:46.240
sygnałów wejściowych do tej pierwszej warstwy i dlatego musimy użyć pierwszego splotu, ponieważ jest

02:46.240 --> 02:51.770
to pierwsza splotka. który propaguje sygnał z obrazów wejściowych do pierwszej warstwy.

02:52.030 --> 02:58.450
Więc to, co teraz zrobimy, to skopiujemy to, ponieważ jest to pierwsza splot, jaki mieliśmy

02:58.450 --> 03:06.100
tutaj, i stosujemy tę pierwszą splot do naszych obrazów wejściowych, które są teraz odpowiednimi wejściami i które otrzymujemy, które

03:06.100 --> 03:09.560
propagują sygnał z obrazów wejściowych do pierwsza warstwa.

03:09.820 --> 03:16.390
Ale teraz pamiętajmy, że musimy użyć nieliniowej funkcji aktywacji, aby przełamać liniowość, aby móc nauczyć

03:16.390 --> 03:23.170
się nieliniowych relacji w obrazach, i do tego będziemy używać, gdy powiedzieliśmy o funkcji aktywacji, którą

03:23.500 --> 03:28.050
zamierzamy osiągnąć. zobacz teraz i to przez dotyk utknął.

03:28.180 --> 03:30.110
Ale zanim to osiągniemy.

03:30.130 --> 03:36.430
Tak więc, aby to uzyskać, naprawdę musimy wziąć moduł funkcjonalny, który ma

03:36.490 --> 03:45.790
skrót, a następnie to, a następnie pętlę, a następnie umieścić to wszystko w nawiasach, ponieważ chcemy nieliniowo aktywować neurony.

03:45.880 --> 03:51.160
Ta pierwsza warstwa tutaj, którą uzyskaliśmy przez zastosowanie pierwszego splotu na wejściach.

03:51.160 --> 03:55.310
A teraz przejdźmy do pochodni PI Douga, aby zrozumieć, co to jest.

03:55.360 --> 03:56.110
Oto jest.

03:56.200 --> 04:00.320
Możesz więc uzyskać do niej dostęp do pochodni lub slash slash.

04:00.340 --> 04:06.940
A potem to H G i L, a następnie musisz znaleźć nieliniowe aktywacje, a następnie nieliniowe funkcje aktywacji,

04:06.940 --> 04:08.080
które znajdziesz.

04:08.170 --> 04:14.040
Cóż, to jest klasyczne, gdy wiemy, że to tylko zero, a X ma na myśli wykres.

04:14.260 --> 04:17.160
Potem masz sześć, które jest tym.

04:17.160 --> 04:19.350
Więc trochę bardziej wyrafinowany.

04:19.570 --> 04:21.190
A potem idziemy spojrzeć.

04:21.550 --> 04:26.470
A jak widać niebieski jest powtórzeniem plus dodatkowy element.

04:26.620 --> 04:29.280
Tak naprawdę jest to bardziej wyrafinowane.

04:29.340 --> 04:34.180
I to jest ta, której używamy do nieliniowego aktywowania neuronów i różnych warstw.

04:34.180 --> 04:39.420
A tak przy okazji, ta nowa funkcja aktywacji nazywa się wykładniczą w ich jednostce.

04:39.490 --> 04:40.250
Więc idziemy.

04:40.270 --> 04:44.230
Nakładamy elu na pierwszą warstwę splotową.

04:44.470 --> 04:46.300
A teraz wszystko będzie łatwe.

04:46.370 --> 04:52.270
Przejdziemy do następnej na propagację sygnału, który pochodzi z pierwszej warstwy

04:52.270 --> 04:59.440
splotu do drugiej warstwy splotowej, którą nazwiemy X, ponieważ w zasadzie właśnie dodajemy X teraz

04:59.470 --> 05:02.190
x jest pierwszym splotem tam.

05:02.290 --> 05:07.990
A przez propagowanie sygnału z pierwszej warstwy splotu do następnej X stanie się następną

05:07.990 --> 05:09.190
warstwą splotową.

05:09.520 --> 05:15.130
I tak, aby propagować sygnał z pierwszej warstwy splotu do drugiej, nie możemy po

05:15.220 --> 05:20.490
prostu skopiować tego i wkleić go tutaj i zastąpić jeden po drugim.

05:20.510 --> 05:27.340
I teraz oczywiście druga splot nie jest stosowany do obrazów wejściowych, ale do X, która jest pierwszą warstwą

05:27.340 --> 05:29.530
splotową, która jest właśnie tutaj.

05:29.830 --> 05:30.790
Wszystko w porządku.

05:30.790 --> 05:32.800
Teraz otrzymujemy nasz drugi splot.

05:33.010 --> 05:38.230
A teraz rozprowadźmy sygnał ponownie z drugiego splotu na trzeci.

05:38.230 --> 05:46.000
I dlatego możemy bezpośrednio skopiować i wkleić tutaj i zastąpić dwa na trzy.

05:46.000 --> 05:46.840
No to jedziemy.

05:46.990 --> 05:47.900
I ostatnia.

05:47.920 --> 05:53.770
Teraz, aby rozpropagować sygnał z trzeciego splotu tam na czwarty i ostatni,

05:53.770 --> 05:58.770
możemy po prostu powtórzyć to tutaj i zastąpić trzy następnymi.

05:58.840 --> 05:59.790
No to jedziemy.

06:00.220 --> 06:01.870
Więc podsumujmy.

06:01.870 --> 06:03.310
Zaczynamy od naszych danych wejściowych.

06:03.460 --> 06:07.170
Zastosujemy pierwszy splot, aby uzyskać tam pierwszy splot.

06:07.360 --> 06:12.130
Następnie nakładamy drugi splot na pierwszą warstwę splotu, aby uzyskać drugą warstwę

06:12.130 --> 06:12.850
splotową.

06:12.970 --> 06:17.830
Następnie zastosujemy ten trzeci splot do drugiego splotu, aby uzyskać trzecią warstwę

06:17.830 --> 06:18.510
splotową.

06:18.550 --> 06:24.650
I na koniec zastosujemy czwarty splot do trzeciego splotu, aby tam otrzymać czwartą

06:24.650 --> 06:25.180
splot.

06:25.510 --> 06:29.900
I w ten sposób sygnał jest propagowany w oku.

06:30.130 --> 06:35.620
Tak więc mamy już sygnał wyjściowy po czterech zwojach, a teraz wiemy,

06:35.620 --> 06:40.790
co robić, aby rozszerzyć ten cały sygnał wyjściowy w jednowymiarowym wektorze.

06:40.900 --> 06:42.640
To jest etap spłaszczania.

06:42.880 --> 06:45.440
Tak więc zaktualizujemy x ponownie x.

06:45.490 --> 06:49.010
Teraz stanie się tym spłaszczonym jednowymiarowym wektorem.

06:49.230 --> 06:57.070
I aby to zrobić, musimy wziąć X, która jest do tej pory czwartą splotową warstwą X, ale potem używamy

06:57.520 --> 07:05.660
funkcji widoku i najpierw wprowadzamy minus jeden, aby powiedzieć, że chcemy jednego wymiaru wektora, a następnie jako drugiego argumentu,

07:05.660 --> 07:11.810
którego potrzebujemy. aby umieścić liczbę elementów w wektorze i to jest pamiętać trzy razy

07:11.880 --> 07:13.560
trzy razy trzy.

07:13.670 --> 07:20.270
I dlatego możemy umieścić tutaj 32 razy trzy razy trzy.

07:20.270 --> 07:20.720
No to jedziemy.

07:20.720 --> 07:24.570
Teraz mamy nasz spłaszczony wektor i kończy się proces spłaszczania.

07:24.680 --> 07:25.580
Idealny.

07:25.580 --> 07:28.030
Teraz zajmijmy się częścią LCN.

07:28.280 --> 07:33.030
Więc jak zrozumiałeś, LSD przyjmuje jako wejście spłaszczony wektor.

07:33.200 --> 07:37.190
Ten jednowymiarowy wektor trzech razy trzy razy trzy elementy.

07:37.190 --> 07:40.310
Więc jest już gotowy i dobrze przygotowany do icn.

07:40.320 --> 07:49.070
Zespół jest teraz gotowy do przyjęcia tego płaskiego wektora jako danych wejściowych, a zatem możemy wziąć naszą LACMA i dane wejściowe jako

07:49.190 --> 07:52.010
argument, że pierwsze X są gotowe.

07:52.010 --> 07:55.960
FLATOW I wektor, który jest tym x-ray, który właśnie rozszerzyliśmy.

07:56.270 --> 08:00.810
Ale także i tutaj pojawia się problem.

08:00.890 --> 08:04.540
Musimy umieścić H x i z x.

08:04.550 --> 08:10.820
I możemy użyć ha-Szatana, zobaczmy tutaj X, ponieważ dokonaliśmy tych separacji od pierwotnych argumentów

08:11.060 --> 08:12.980
wejściowych funkcji forward.

08:12.980 --> 08:20.460
Tak więc LACMA X to wektor wyjściowy płyty po czterech zwojach i wszystkich ukrytych w notatce komórki.

08:20.480 --> 08:21.390
Więc idziemy.

08:21.440 --> 08:27.530
Wtedy nie wolno nam zapomnieć o jaźni, ponieważ LSD jest zmienną lub funkcją, więc zmienna

08:27.530 --> 08:35.210
jest związana z samym obiektem i CM, a to faktycznie powróci do wyjść w sumie z dwóch wyjść, które

08:35.210 --> 08:37.850
będą wyjściowymi węzłami i wyjściowymi dźwiękami.

08:37.880 --> 08:42.250
Tak więc jest to aktualne i dlatego możemy zaktualizować H.

08:42.260 --> 08:48.890
X y i zx węzły komórki, ponieważ tutaj jest dokładnie dane wyjściowe tego NCM.

08:50.030 --> 08:50.500
Świetny.

08:50.510 --> 08:52.750
Tak więc prawie skończyliśmy.

08:52.790 --> 08:58.850
Teraz, gdy mamy wyjścia z ilustracji, potrzebujemy uzyskać użyteczne dane wyjściowe, ponieważ

08:58.850 --> 09:05.570
w rzeczywistości tylko ukryte notatki są użyteczne, a zatem otrzymamy je do tego czasu X

09:05.570 --> 09:12.490
ponownie, a X będzie teraz równe ataxowi pierwszego elementu próbki wyjściowej USA i X równa się.

09:12.680 --> 09:14.270
I prawie skończyliśmy.

09:14.270 --> 09:18.590
Pamiętaj, że mamy dwa mózgi jeden mózg dla aktora w jednym pokoju dla krytyka.

09:18.860 --> 09:24.380
I dlatego musimy wyprowadzać sygnały, aby zwrócić sygnał wyjściowy aktora i sygnał

09:24.380 --> 09:25.480
wyjściowy krytyka.

09:25.580 --> 09:30.730
I dlatego teraz mamy zamiar zwrócić te dwa sygnały wyjściowe i jak możemy to zrobić.

09:30.830 --> 09:32.010
To bardzo proste.

09:32.030 --> 09:38.690
Musimy po prostu wziąć nasze połączenia liniowe, ale oddzielnie, to jest liniowe połączenie krytyka

09:38.770 --> 09:40.740
i pełne połączenie aktora.

09:41.180 --> 09:47.870
I zastosowaliśmy każde z tych połączeń do wyjścia X, które jest użytecznym wyjściem LACMA i będzie

09:47.870 --> 09:50.470
to wszystko, co będzie sygnałem wyjściowym.

09:50.480 --> 09:50.990
Więc idziemy.

09:50.990 --> 09:51.840
Zróbmy to.

09:51.900 --> 09:59.660
Najpierw bierzemy siebie lub obiekt, a następnie uzyskujemy liniowe połączenie krytyka, który jest krytykiem, i to współliniarstwo,

09:59.690 --> 10:08.090
które stosujemy do X sygnału wyjściowego CM, a następnie to samo, co wtedy przyjmujemy siebie, a następnie bierzemy

10:08.090 --> 10:15.290
liniowe połączenie aktora który jest aktorem, a jego współrzędne są tym samym, które stosujemy do

10:15.290 --> 10:16.200
x.

10:16.310 --> 10:19.580
Idziemy tam, to jest główna rzecz, której potrzebujemy.

10:19.710 --> 10:26.040
Ale wtedy również zwrócimy szczyt Ajax do węzła i zobaczymy X, aby sprzedać węzeł, ponieważ

10:26.040 --> 10:29.490
będziemy go później używać i wygląd retro LCN.

10:29.520 --> 10:30.430
Wszystko w porządku.

10:30.480 --> 10:32.960
Więc teraz skończyliśmy z mózgiem.

10:32.970 --> 10:38.040
A może powinienem powiedzieć mózg, ponieważ tak naprawdę stworzyliśmy dwa mózgi dla aktora i jednego krytyka.

10:38.250 --> 10:41.990
Gratuluję ośmiu z mózgami.

10:42.180 --> 10:47.940
Mam nadzieję, że nie było to zbyt przytłaczające, by połączyć się w CNN i Anniston, ale przynajmniej dobrą

10:47.940 --> 10:51.190
wiadomością jest to, że pracujemy z najlepszym i najpotężniejszym modelem.

10:51.300 --> 10:53.010
Więc idziemy.

10:53.010 --> 10:55.950
Zrealizowaliśmy ten pierwszy model rodziny.

10:56.010 --> 10:56.810
Y.

10:56.880 --> 11:02.040
A więc w następnych dwóch toile zajmiemy się optymalizatorem, ponieważ zamierzamy stworzyć

11:02.190 --> 11:03.300
osobny optymalizator.

11:03.300 --> 11:08.850
Nie zamierzamy wycinać każdej linii kodu, ponieważ wiele z nich pochodzi z prac badawczych i

11:08.850 --> 11:10.520
jest to dość specyficzne.

11:10.530 --> 11:16.470
A jeśli zajmiemy się szczegółami tego, co dzieje się z tym optymalizatorem, może to

11:16.470 --> 11:22.410
być trochę zbyt przytłaczające dla tego, co będzie dalej, ponieważ wciąż mamy funkcję pociągu,

11:22.410 --> 11:26.890
która będzie ogromną funkcją i zawiera algorytm, który widzieć.

11:27.030 --> 11:29.240
Zaufaj mi, że chcesz zachować trochę energii na to.

11:29.310 --> 11:32.300
Dlatego nie poświęcamy zbyt wiele czasu na to.

11:32.490 --> 11:37.830
Ale nadal będę rozwijać kod, a zrozumiesz całą ideę stojącą za tą optymalizacją.

11:38.190 --> 11:44.740
Jeszcze raz gratuluję zrobienia tej klasy aktywności, a do zobaczenia w następnym optymizatorze Statoil 290.

11:44.760 --> 11:46.140
Do tego czasu ciesz się.