WEBVTT

00:00.490 --> 00:02.550
Cześć i witamy w tym samouczku.

00:02.560 --> 00:07.550
W porządku, więc zaczniemy od pierwszego człowieka z naszego moralnego i najważniejszego ptactwa, który

00:07.630 --> 00:08.410
jest pomieszany.

00:08.440 --> 00:09.020
Czemu.

00:09.180 --> 00:14.590
I to jest w tym pliku, że zaimplementujemy mózg homo, znasz mózg w sercu 8:

00:14.650 --> 00:20.290
3 Simmo, który jest w tym pliku, który sprawi, że sieć neuronowa, która oczywiście będzie zawierała

00:20.290 --> 00:25.030
pewne splot, będzie wiedzieć, kiedy to zadziała ponieważ oczywiście nadal uczymy się

00:25.030 --> 00:25.570
głębiej.

00:25.690 --> 00:31.690
Więc są w stanie mieć oczy i wewnątrz tej sieci neuronowej zintegrują wszystko, co jest związane

00:31.870 --> 00:34.600
z aktywnym Craigmile i jest bonus.

00:34.630 --> 00:39.550
Jak już mówiłem, wdrażamy jedną z najsilniejszych zasad moralności A-3 i co sprawia,

00:39.550 --> 00:45.910
że jest tak potężna, że zawiera rekordową sieć, a dokładniej w pamięci długoterminowej LCN, abyśmy mogli poznać

00:45.910 --> 00:48.660
czasowe właściwości tego, co jest dziać się.

00:48.670 --> 00:54.710
Ponownie, jest to w rzeczywistości czasowe właściwości danych wejściowych, dzięki czemu prognozy mogą być jeszcze lepsze.

00:55.270 --> 00:56.050
Więc idziemy.

00:56.050 --> 01:01.330
Wdrażamy bardzo wydajny model, który łączy w sobie wszystkie sieci neuronowe, które widzieliśmy w

01:01.420 --> 01:02.590
trakcie pogłębiania.

01:02.680 --> 01:08.070
To sztuczna sieć neuronowa, splotowa sieć neuronowa i nowa, rekordowa sieć.

01:08.260 --> 01:13.240
A w sercu wszystkich tych sieci jest oczywiście model A-380, który sprawi, że AI AI będzie

01:13.240 --> 01:14.040
bardzo potężna.

01:14.410 --> 01:18.300
Zróbmy to, zaatakujmy ten model i zaimplementujmy go.

01:18.430 --> 01:21.760
Zaczniemy od zrobienia dwóch funkcji.

01:21.850 --> 01:26.410
Są tylko niektóre funkcje, które zajmą się tym, jak możemy zainicjować wagi, ponieważ wiesz,

01:26.410 --> 01:30.460
że będziemy mieć kilka nowych sieci i dlatego będziemy mieć ciężary i

01:30.460 --> 01:36.740
chcemy tylko, aby te dwie funkcje były dla nas tak, aby mamy już narzędzie do łatwej integracji w domu,

01:36.750 --> 01:38.090
więc sieć neuronowa.

01:38.290 --> 01:41.600
Te dwie funkcje będą więc znormalizowanymi kolumnami.

01:41.600 --> 01:48.730
Inicjator, który jest w zasadzie funkcją, która może nie tylko zainicjować niektóre wagi, ale ustawia określoną

01:48.730 --> 01:50.370
wariancję ciężarów tensorowych.

01:50.380 --> 01:52.770
Właśnie to właśnie zamierzamy wprowadzić w tej chwili.

01:53.020 --> 01:57.700
A potem zaimplementujemy drugą funkcję, która będzie wagą w tej funkcji i która w

01:57.700 --> 02:01.840
zasadzie zainicjuje wagi w odpowiednim czasie, w sposób umożliwiający uczenie się.

02:01.840 --> 02:02.330
W porządku.

02:02.350 --> 02:08.070
A kiedy skończymy z tymi dwiema funkcjami, zaczniemy wdrażać sieć neuronową.

02:08.330 --> 02:14.770
Zróbmy więc szybko te dwie funkcje, więc zaczynam od def,

02:14.770 --> 02:24.420
a następnie podam nazwę tej funkcji, która jest znormalizowana, a te podstawowe kolumny podkreślają inicjalizator.

02:24.720 --> 02:25.550
No to jedziemy.

02:25.650 --> 02:28.780
A ta funkcja zajmie tylko dwa wejścia.

02:29.010 --> 02:35.790
Najpierw będą wagi, które chcemy zainicjować, i odchylenie standardowe, ponieważ, jak właśnie powiedziałem,

02:35.790 --> 02:40.200
chcemy ustawić określoną wariancję dla naszego tensora wag.

02:40.230 --> 02:45.300
A jeśli chcesz zrozumieć, dlaczego musimy to zrobić, to dlatego, że wiesz, kiedy tworzymy sieć

02:45.620 --> 02:50.490
neuronową, która będzie aktorem i krytykiem według jutra, a zrobimy dwie oddzielne, w pełni

02:50.490 --> 02:53.670
połączone warstwy dla aktora i jeden dla krytyka.

02:53.880 --> 02:59.970
A te dwie w pełni połączone warstwy będą miały ciężary, a my ustalimy odchylenie standardowe dla każdej

02:59.970 --> 03:01.810
z tych dwóch grup wag.

03:01.860 --> 03:05.650
I tak zrobimy, że ustawimy niewielkie odchylenie standardowe dla aktora.

03:05.700 --> 03:12.570
To będzie około 0. 01 i duże odchylenie standardowe dla krytyka, który będzie około 1 myślę.

03:12.750 --> 03:18.690
Dlatego właśnie tworzymy tę funkcję, dzięki czemu możemy bardzo łatwo ustawić odchylenie standardowe dla wag,

03:18.690 --> 03:21.900
które później zainicjujemy dla aktora i craic.

03:21.930 --> 03:23.560
Właśnie dlatego to robimy.

03:23.560 --> 03:28.860
Teraz ustawiamy domyślną wartość, ale zmieni się to później, gdy zainicjujemy

03:28.860 --> 03:29.500
wagi.

03:29.520 --> 03:32.100
Więc używajmy tak dla 1. 0.

03:32.240 --> 03:32.920
W porządku.

03:33.000 --> 03:37.340
A teraz jesteśmy gotowi, aby zdefiniować, co jest w środku tej funkcji.

03:37.410 --> 03:41.960
To, co najpierw przygotujemy, to wynik, który będziemy wywoływać.

03:42.000 --> 03:46.310
Więc to dla wszystkich jest to, co zostanie zwrócone przez tę funkcję.

03:46.380 --> 03:50.210
I na początku to, co zamierzamy zrobić, to to.

03:50.330 --> 03:56.750
Jak zrozumiałeś, ten wynik będzie tensorem wag, który będzie miał określone odchylenie standardowe.

03:56.850 --> 04:01.970
Ale zanim zajmiemy się ustawianiem odchylenia standardowego, chcemy go tylko zainicjować, a następnie ustawimy

04:02.010 --> 04:06.550
tutaj standardowe odchylenie, które jest argumentem, który jest wprowadzeniem tej funkcji.

04:06.870 --> 04:10.670
Aby rozpocząć inwentaryzowanie ciężarów tensorowych, możesz wiedzieć, jak to zrobić.

04:10.680 --> 04:12.150
Już to zrobiliśmy.

04:12.180 --> 04:20.250
Zamierzamy użyć naszej biblioteki torche i z tej biblioteki torche podejmiemy rundę i funkcję,

04:21.180 --> 04:27.540
która zainicjuje podpaloną odpowiedź losowymi wagami, które następują po normalnym rozkładzie.

04:27.540 --> 04:29.630
To dlatego nazywa się rant.

04:29.820 --> 04:31.100
A co do normalności.

04:31.230 --> 04:36.380
Teraz musimy po prostu wprowadzić liczbę elementów, które zawierać będzie rozszerzenie.

04:36.510 --> 04:41.510
I ta liczba elementów to oczywiście liczba wag, ponieważ tak naprawdę zainicjowaliśmy tutaj

04:41.500 --> 04:43.140
tensor dla tych wag.

04:43.350 --> 04:53.410
Aby uzyskać tę liczbę elementów wystarczy po prostu wziąć nasze wagi i dodać kropkę, by uzyskać rozmiar za pomocą nawiasów.

04:53.410 --> 05:00.280
Daje to liczbę elementów i wag, aby utworzyć tensor palnika o tej samej

05:00.280 --> 05:05.320
liczbie elementów naszych odważników i zostanie zainicjowany losowymi obciążeniami po

05:05.320 --> 05:06.860
normalnym rozkładzie.

05:06.860 --> 05:07.330
W porządku.

05:07.360 --> 05:13.390
A teraz nadszedł czas, aby ustawić odchylenie standardowe, które chcemy mieć, czyli odchylenie standardowe tutaj.

05:13.510 --> 05:16.960
Więc teraz zrobimy prostą normalizację.

05:16.960 --> 05:21.400
Mamy torturowane poczucie ciężaru i teraz chcemy go znormalizować.

05:21.600 --> 05:25.810
Aby go znormalizować, wystarczy napisać jawne obliczenia.

05:25.840 --> 05:34.960
A więc musimy po prostu pobrać nasze wyniki, a następnie zaktualizować je, mnożąc je przez odchylenie

05:34.960 --> 05:41.140
standardowe, które chcemy podzielić przez sumę, o której właśnie wspomniałem.

05:41.140 --> 05:44.960
Aby uzyskać sumę, jaką zamierzamy użyć funkcji pierwiastka kwadratowego przez pochodnie.

05:45.010 --> 05:48.700
I tak jest, gdy bierze się tutaj torche, które s q r t.

05:48.820 --> 05:50.710
To jest pierwiastek kwadratowy.

05:50.830 --> 05:55.980
Wewnątrz wprowadzimy kwadrat niektórych wag wektora.

05:56.160 --> 05:58.000
I tak bierzemy nasze produkty.

05:58.210 --> 06:06.040
Następnie używamy funkcji mocy, do której wprowadzamy, ponieważ chcemy wziąć kwadrat sumy,

06:06.040 --> 06:08.950
a następnie wziąć słońce.

06:09.000 --> 06:15.300
Wewnątrz określimy indeks stożka, który zawiera wagę.

06:15.310 --> 06:23.990
Chcielibyśmy, aby niektórzy otrzymali te wagi oddzielnie, ponieważ chcesz je dobrze podsumować, zazwyczaj

06:24.490 --> 06:29.440
rozbudowujemy szkołę w zależności od naszych wyników.

06:29.470 --> 06:29.820
W porządku.

06:29.820 --> 06:37.280
Tak więc otrzymamy wagi, które do tej pory zostały zainicjowane jako rodzaj ciężaru Torchin, który dostaje wszystkie

06:37.340 --> 06:38.320
te wagi.

06:38.330 --> 06:43.850
Przyjmujemy sumę kwadratów, a następnie przyjmujemy pierwiastek kwadratowy, aby zastosować normalizację.

06:44.030 --> 06:50.230
I fakt, że mamy odchylenie standardowe w liczniku, upewnimy się, że możemy to tutaj

06:50.230 --> 06:50.900
zapisać.

06:51.960 --> 06:58.890
Warianty są równe kwadratowi odchylenia standardowego.

06:58.890 --> 07:05.940
Ta formuła sprawi, że ten tensor wag, który zainicjowaliśmy, będzie miał wariancję, która będzie

07:06.030 --> 07:10.860
równa kwadratowi odchylenia standardowego, które umieszczamy jako argumenty.

07:11.190 --> 07:17.940
W ten sposób możemy ustalić konkretne odchylenie standardowe dla przyszłości i krytyka, które wkrótce się

07:17.940 --> 07:24.150
dokona, a my wybierzemy niewielkie odchylenie standardowe dla aktora i większe dla krytyka, a

07:24.340 --> 07:27.780
zrobimy to bardzo łatwo od tej funkcji.

07:27.780 --> 07:28.150
W porządku.

07:28.170 --> 07:31.120
Teraz mamy tylko jedną rzecz do zrobienia.

07:31.200 --> 07:38.940
To oczywiście zwraca wynik, który jest teraz znormalizowany z tym konkretnym odchyleniem standardowym.

07:38.940 --> 07:40.340
W porządku, więc idealnie.

07:40.350 --> 07:42.680
To była pierwsza funkcja, którą musieliśmy wykonać.

07:42.870 --> 07:46.220
To pierwsze narzędzie, z którego będziemy bardzo zadowoleni dziś wieczorem.

07:46.250 --> 07:47.290
Mózg morski H-3.

07:47.370 --> 07:49.250
Mamy teraz jeszcze jedną funkcję do wykonania.

07:49.350 --> 07:51.130
To będzie funkcja wagi.

07:51.360 --> 07:57.160
A to tylko funkcja, która przypomni o wadze, aby nauka była optymalna.

07:57.570 --> 08:01.110
Zróbmy to w następnym ćwiczeniu i do tego czasu I.
