WEBVTT

00:00.270 --> 00:02.250
Witam i zapraszam do sklepu.

00:02.430 --> 00:05.810
Jestem bardzo podekscytowany, ponieważ chcemy, aby A-3 zobaczył mózg.

00:05.810 --> 00:07.430
To jest mózg naszej sztucznej inteligencji.

00:07.590 --> 00:10.800
A mówiąc o mózgach, chciałbym coś podkreślić.

00:10.870 --> 00:15.750
Pamiętaj, że w pierwszym module stworzyliśmy prosty mózg z tylko w pełni połączonymi warstwami.

00:15.840 --> 00:22.260
Następnie w drugim module dla Dhoom stworzyliśmy mózg, który nie tylko miał w pełni połączone warstwy,

00:22.350 --> 00:29.070
ale także oczy, ponieważ dodaliśmy splotowe warstwy, które dały oczom wzrok, ponieważ mogły obserwować obrazy i rozumieć,

00:29.070 --> 00:31.550
co dzieje się w środku.

00:31.830 --> 00:37.590
A teraz powiemy, że nawet na wysokim poziomie, ponieważ zamierzamy stworzyć mózg, który nie tylko będzie miał

00:37.590 --> 00:41.310
oczy i będzie w pełni łączyć warstwy, ale także pamięć.

00:41.430 --> 00:46.710
Ponieważ, jak już wspomniałem w poprzednim tutorialu, dodamy zapis do tej pracy

00:46.710 --> 00:53.490
wewnątrz tego wielkiego mózgu, a to zaowocuje długim wspomnieniem dla naszego mózgu, aby mógł on zrozumieć

00:53.580 --> 00:57.010
związki czasowe we właściwościach czasowych obrazów wejściowych.

00:57.120 --> 01:02.400
A więc idziemy i jeszcze mocniejszy mózg, mogę powiedzieć, że Dymo, którym jesteśmy teraz

01:02.640 --> 01:09.930
na temat Intimana, jest naprawdę bardzo potężny i możemy zobaczyć, jak budować AI i robić coraz głębiej, a uczenie

01:10.260 --> 01:14.820
się Forsmana polega na zbliżaniu się do jak działa ludzki mózg.

01:14.820 --> 01:19.560
Wiesz, że zaczęliśmy od podstawowych związków mózgu z liniowymi połączeniami.

01:19.560 --> 01:22.230
Następnie dodaliśmy oczy i dodaliśmy pamięć.

01:22.230 --> 01:24.900
Kto wie, co dodamy w przyszłych modelach.

01:24.990 --> 01:30.780
Wiesz, w 2018 roku może dodadzą coś, co sprawi, że mózg będzie wyglądał bardziej jak ludzki

01:30.780 --> 01:31.330
mózg.

01:31.680 --> 01:37.590
Ale już przy w pełni połączonych laserach oczu i pamięci mamy już naprawdę dobry i funkcjonalny

01:37.590 --> 01:38.280
mózg.

01:38.790 --> 01:39.690
Więc zróbmy to.

01:39.750 --> 01:41.140
Zróbmy ten mózg.

01:41.310 --> 01:46.470
Jak zwykle zamierzamy zrobić zajęcia na ten temat, ponieważ będzie miał wiele

01:46.470 --> 01:48.780
właściwości ze splotami i nauką.

01:48.870 --> 01:53.770
Tak więc sprawimy, że będzie funkcjonował, aby zainicjować to wszystko, tworząc wszystkie te połączenia.

01:54.090 --> 01:59.220
A potem oczywiście będziemy mieli funkcję Forda, która oczywiście będzie propagować sygnał w

01:59.220 --> 02:02.580
mózgu, tak abyśmy mogli ostatecznie uzyskać moc wyjściową.

02:02.580 --> 02:03.200
W porządku.

02:03.240 --> 02:04.020
Jesteś gotowy.

02:04.140 --> 02:05.400
Zróbmy to.

02:05.400 --> 02:13.700
Tak więc klasy przedstawiamy w klasie, którą nazywamy kredytem aktorskim, ponieważ oczywiście mówię tutaj o mózgach.

02:13.710 --> 02:19.440
Ale nie zapominajmy, że robimy z modelem, który opiera się na aktywnej zasadzie krytyki z

02:19.650 --> 02:24.810
osobnym aktorem i krytykiem, tak naprawdę stanie się jednym z prawie pełnych powiązań dla

02:24.810 --> 02:27.770
aktora i jednym znaczącym połączeniem dla krytyka.

02:27.810 --> 02:30.880
Zobaczysz, jak dobrze to zrobimy, to będzie całkiem proste.

02:30.900 --> 02:39.060
Tak więc aktywny krytyk i ta klasa aktorów odziedziczy po zakończeniu i Maggio, abyśmy mogli użyć

02:39.060 --> 02:40.780
wszystkich narzędzi Pitre.

02:40.860 --> 02:44.130
Zróbmy to, aby odziedziczyć od końca w tym module.

02:44.190 --> 02:53.000
Cóż, musimy najpierw wziąć bibliotekę pochodni, potem, potem i to i Mudgala.

02:53.090 --> 02:54.100
W porządku.

02:54.110 --> 02:55.600
W ten sposób dziedziczymy z niego.

02:56.990 --> 02:57.240
W porządku.

02:57.260 --> 03:01.630
Tak więc idziemy z naszą pierwszą funkcją, która będzie oczywiście w jego funkcji.

03:01.640 --> 03:10.400
Zaczynamy więc od podwójnego podkreślenia, wtedy funkcja ta przyjmie jako argument jaźń z obiektem, a następnie

03:10.850 --> 03:17.970
kształt wejściowy, który jest dominacją naszych obrazów wejściowych i nazywamy to

03:18.050 --> 03:25.820
nie wejściami i fazą czynności, która jest w zasadzie przestrzenią który zawiera wszystkie działania.

03:26.000 --> 03:31.340
Wiemy również z tej przestrzeni działania, że możemy uzyskać szereg działań, które są wieloma możliwymi

03:31.700 --> 03:33.870
działaniami, które wkrótce zostaną osiągnięte.

03:33.870 --> 03:38.290
Dlatego też potrzebowaliśmy tego do argumentów.

03:38.290 --> 03:39.390
To wszystko, czego potrzebujemy.

03:39.650 --> 03:45.450
A następnie przejdźmy do funkcji i stwórzmy wszystkie zmienne właściwe naszemu mózgowi.

03:45.830 --> 03:51.740
Ale zanim to zrobimy, pamiętajmy, co musimy zrobić, aby aktywować w jakiś sposób dziedziczenie,

03:52.040 --> 03:59.450
w którym możemy użyć wszystkich narzędzi od końca Maggio, musimy użyć superfunkcji w ten sposób, w którą

03:59.450 --> 04:00.180
wpisujemy.

04:00.440 --> 04:10.740
Krytyk aktorski, który jest naszą klasą, a następnie sam podejdziemy do obiektu W porządku, i

04:10.740 --> 04:14.840
tam znowu idziemy z funkcją.

04:14.940 --> 04:15.560
No to jedziemy.

04:15.600 --> 04:20.100
To daje nam wszystkie narzędzia, których potrzebujemy od latarki, aby zbudować nasz mózg.

04:20.400 --> 04:21.940
W porządku.

04:22.170 --> 04:24.690
Czas spojrzeć w oczy.

04:24.780 --> 04:26.210
To są zwoje.

04:26.460 --> 04:31.770
Tak więc zrobimy to bardzo szybko, ponieważ już to szczegółowo wyjaśniliśmy dla zagłady.

04:31.800 --> 04:34.210
Ponieważ pamiętam dzień, w którym miałem lód.

04:34.260 --> 04:39.240
Więc to jest dokładnie to samo, które zamierzamy wyciągnąć pewne wnioski i wykorzystamy

04:39.510 --> 04:45.240
bardzo prostą architekturę z 32 detektorami cech wielkości 3, trzema krokami po dwa i dopełnieniem jednego.

04:45.450 --> 04:50.460
To całkiem klasyczna architektura, ale to wystarczy, aby wiedzieć, że rozumiem,

04:50.690 --> 04:53.010
co się dzieje w przerwie.

04:53.010 --> 04:54.090
DOBRZE.

04:54.480 --> 04:56.750
W porządku, więc róbmy te konwulsje.

04:56.790 --> 05:03.900
Więc zaczynamy od jaźni, ponieważ sploty będą zmiennymi obiektów, więc siebie, które możemy nazwać to

05:03.900 --> 05:09.210
przyjdzie, i będzie cztery splotu, i czy ten może jeden.

05:09.540 --> 05:11.040
I oto idziemy.

05:11.040 --> 05:18.900
Przyjmujemy kropkę N i Maggio, a następnie przyjmujemy stożek do klasy, ponieważ faktyczne zwołanie

05:18.930 --> 05:20.670
będzie przedmiotem niesmaku.

05:21.540 --> 05:25.870
A potem w środku umieszczamy wejściowy kształt obrazów.

05:25.920 --> 05:32.780
Tak więc to, co mamy tutaj, możemy skopiować i wprowadzić jako pierwsze wejście.

05:33.090 --> 05:38.600
Drugim argumentem jest liczba detektorów funkcji to także liczba jądra.

05:38.640 --> 05:45.060
Więc weźmiemy 32, ponieważ właśnie powiedzieliśmy klasyczny wybór, wtedy musimy wybrać rozmiar jądra, który

05:45.060 --> 05:50.130
jest liczbą komórek, które będą przesuwać się nad obrazem wejściowym.

05:50.190 --> 05:55.170
I pamiętajmy, że możemy albo wziąć trzy cztery, albo pięć, które mają wybór,

05:55.290 --> 05:58.460
a my wybierzemy trzy, a potem wybierzemy.

05:58.550 --> 06:01.100
Próbował.

06:01.340 --> 06:11.350
I dopełnienie jednego z nich, które wykonujemy dla pierwszego splotu, który przechodzi od obrazu wejściowego do pierwszej

06:11.350 --> 06:16.210
warstwy splotowej, składa się z 32 zawiłych obrazów.

06:16.360 --> 06:18.850
Teraz jesteśmy gotowi, aby dokonać drugiego splotu.

06:18.850 --> 06:27.290
Tak więc będzie to prawie tak samo, więc kopiuję tę linię i opieram ją poniżej wklejoną poniżej ponownie

06:27.310 --> 06:33.490
i wklejając ją po raz ostatni, ponieważ będziemy mieli cztery połączenia z

06:33.490 --> 06:42.640
prawie niczym, aby się zmienić, więc możemy już wymienić. jeden przychodzi jeden do trzech i przychodzi jeden po czwartym.

06:42.670 --> 06:45.160
To będą nasze cztery zwoje.

06:45.160 --> 06:49.330
A teraz oczywiście musimy zmienić niektóre rzeczy tutaj, ale nie wiele, ponieważ będziemy

06:49.370 --> 06:52.280
śledzić dwa dla każdego i jeden z nich.

06:52.420 --> 06:58.620
Wszystkie będą miały 32 detektory cechujące 32 wyjścia z zawiłymi obrazami.

06:58.780 --> 07:04.040
Ale tutaj pamiętaj, że odpowiada to lewej części splotu.

07:04.180 --> 07:09.610
Tak więc, co odpowiada temu, co było w prawej części poprzedniego wniosku, wiesz, że jest

07:09.610 --> 07:10.370
jak domino.

07:10.390 --> 07:11.440
To naprawdę łatwe.

07:11.560 --> 07:22.390
I dlatego musimy umieścić 32 i tutaj, gdzie będziemy widzieć bardzo łatwo 32 i 32.

07:22.390 --> 07:27.790
W porządku, więc podsumowując zaczynamy od naszych obrazów wejściowych, które nie mają żadnych.

07:27.810 --> 07:35.350
Simon Jones był pierwszym splotem, w którym uzyskaliśmy 32 zawiłe obrazy, z których każdy wykrywa określoną cechę,

07:35.800 --> 07:43.120
a następnie z tych 32 zawiłych obrazów stosujemy drugi splot, aby uzyskać 32 nowe zawiłe obrazy, a

07:43.420 --> 07:46.510
następnie te 32 nowe, zawiłe obrazy.

07:46.510 --> 07:52.430
Stosujemy trzeci splot, aby ponownie uzyskać 32 nowe zawiłe obrazy, a następnie ostatecznie

07:52.450 --> 07:57.470
od trzech do zawiłych obrazów, stosujemy czwarty splot, aby uzyskać cechy.

07:57.490 --> 07:57.910
W porządku.

07:57.910 --> 08:03.700
I to wystarczy z tym albo będę mieć nadzór, który bardzo dobrze weźmie piłkę.

08:03.700 --> 08:07.250
W porządku, więc to jest dla splotu Więc to jest dla oczu.

08:07.420 --> 08:09.490
A teraz zajmijmy się pamięcią.

08:09.640 --> 08:15.520
Ta nowa cecha tego mózgu, którą realizujemy wcześniej, aby nie tylko miała

08:15.680 --> 08:23.140
nadzór, ale także będzie miała bardzo długą pamięć, ponieważ będziemy widzieć Długą pamięć krótkotrwałą, która

08:23.170 --> 08:29.230
jest tego rodzaju zapisem lub neuronem. sieć, która daje swojemu modelowi pewien

08:29.230 --> 08:36.580
rodzaj długiej pamięci, dzięki czemu może nauczyć się długich temporalnych relacji z przeszłości, mówiąc, że

08:36.580 --> 08:43.180
stworzymy nowe zmienne od samego siebie, a ta nowa zmienna nazwiemy po prostu ponieważ

08:43.180 --> 08:47.260
będzie to odpowiadać sieci LACMA wewnątrz mózgu.

08:47.290 --> 08:55.240
Więc SVM i zanim piszemy kod dla LCN, upewnijmy się, że rozumiemy, co zrobi ta część LACMA

08:55.240 --> 08:56.270
w mózgu.

08:56.530 --> 09:03.980
Jak zrozumieliśmy, LCN służy do poznania czasowych właściwości wejściowych obrazów wejściowych.

09:04.090 --> 09:09.730
Na przykład, jeśli piłka uderzy w LACMA, zakoduje balans.

09:09.730 --> 09:11.410
To pierwsza rzecz, którą należy zrozumieć.

09:11.410 --> 09:15.070
Będzie to kodować to, co dzieje się w grze.

09:15.070 --> 09:20.080
Następną ważną rzeczą do zrozumienia, kiedy zaimplementowaliśmy to ISTM, jest to, że

09:20.170 --> 09:26.680
musimy wybierać w kolejności czasowe zależności i tutaj, ponieważ będziemy zasilać naszą sieć neuronową sekwencją czterech

09:26.680 --> 09:33.740
obrazów, oznacza to, że możemy już nauczyć się pewnych czasowych zależności porządku, ponieważ istnieją pewne czasowe zależności, w

09:33.740 --> 09:40.310
których to, co dzieje się w 1:20, zależy od tego, co dzieje się w czasie T.

09:40.360 --> 09:45.500
T minus 1 T minus 2 i T minus 3, abyśmy mogli zdecydowanie to zrobić.

09:45.730 --> 09:51.040
Ale dobrą wiadomością jest to, że wykorzystamy analizę YEM i dzięki temu będziemy

09:51.160 --> 09:54.560
mogli nauczyć się jeszcze bardziej złożonych relacji czasowych.

09:54.650 --> 10:00.430
Na przykład możemy nauczyć się prostych właściwości, gdzie to, co dzieje się w 1:20, będzie zależało od tego, co wydarzy się

10:00.430 --> 10:01.370
w czasie T.

10:01.370 --> 10:05.510
T minus 20 minut do zrobienia minus trzy do T minus.

10:05.940 --> 10:13.360
I to jest długa część długoterminowej pamięci z tym testem i możemy nauczyć się

10:13.360 --> 10:15.490
bardzo złożonych relacji czasowych.

10:15.490 --> 10:18.080
W porządku, dodajmy więc naszą LCN.

10:18.160 --> 10:25.030
Aby to zrobić, użyjemy N w module, a następnie dodamy klasę jako T. N. komórka, która stworzy to

10:25.600 --> 10:31.960
jako obiekt, który będzie reprezentował DST i część nowej sieci, ponieważ w tej

10:31.960 --> 10:38.570
chwili ważne jest, abyśmy zrozumieli, że robimy CR, a potem znacie splotowy zapis nowej

10:38.590 --> 10:45.520
sieci, a część arlandowa pochodzi po Część CNN, a zatem właśnie to, co musimy

10:45.610 --> 10:51.350
wprowadzić w tej komórce LACMA, to najpierw wielkość wyjścia po splotach.

10:51.400 --> 10:56.060
To 32 razy trzy razy trzy.

10:56.230 --> 11:02.670
A więc 32 razy trzy razy trzy to wynik po czterech tułowiach tutaj.

11:02.830 --> 11:07.600
Ale to staje się sygnałem wejściowym RNA LSD i działa.

11:07.870 --> 11:13.710
A teraz dlaczego wydajność czterech zwojów jest o połowę mniejsza od trzech razy trzy razy trzy.

11:13.870 --> 11:16.030
Cóż, nie martw się, to nie jest tak bezpośrednie.

11:16.060 --> 11:22.140
W rzeczywistości nie jest to prosta formuła, ale istnieje formuła obliczająca tę liczbę neuronów wyjściowych.

11:22.210 --> 11:26.490
Po spłaszczeniu zebranych i zawiłych obrazów dekonwolucji.

11:26.710 --> 11:32.050
Ale jeśli zebraliśmy warunki tej dużej formuły, otrzymamy 32 razy trzy razy trzy.

11:32.200 --> 11:36.060
Nie chciałem spędzać w tym czasie zbyt wiele czasu, ponieważ mamy dużo więcej do zrobienia.

11:36.190 --> 11:39.470
Poza tym wykonaliśmy już funkcję obliczania tej liczby.

11:39.520 --> 11:43.710
Pamiętajcie, że to było dla losu, kiedy stworzyliśmy funkcję zliczania neuronów.

11:43.870 --> 11:45.750
Możesz więc użyć go ponownie, jeśli chcesz.

11:45.760 --> 11:51.610
Nie jesteś przekonany, ale to jest to, co otrzymujemy po zebraniu warunków tej dużej formuły, takich

11:51.610 --> 11:53.490
jak obliczanie liczby wyników.

11:53.530 --> 11:59.380
To jest pierwszy argument, a drugim argumentem będzie liczba neuronów

11:59.380 --> 12:00.370
wyjściowych.

12:00.610 --> 12:05.220
I pójdziemy za 256 OK.

12:05.220 --> 12:12.180
Co to oznacza teraz oznacza, że mamy teraz wektor, który koduje każde zdarzenie z gry lub

12:12.540 --> 12:19.260
innymi słowy, że mamy zakodowany stan i dlatego teraz możemy rozdzielić aktora i krytyka, ponieważ

12:19.620 --> 12:25.470
Wiemy, że zamierzamy stworzyć dwie odrębne nowe sieci, jedną dla aktora i

12:25.470 --> 12:31.410
jedną dla krytyka, ale będą one tym samym kodowaniem obrazów i relacjami czasowymi

12:31.410 --> 12:33.990
dla tych dwóch sieci neuronowych.

12:33.990 --> 12:37.740
Jest to więc wspólna część, którą robimy dla tych dwóch nowych sieci.

12:37.740 --> 12:43.650
To będzie ten sam początek dla dwóch nowych sieci, ale teraz wszystko zmieni się dla

12:43.650 --> 12:49.710
aktora i potoku, ponieważ zamierzamy zrobić jeden w pełnym związku dla aktora i innego niż prawie

12:49.710 --> 12:52.200
pełnego połączenia dla craic. .

12:52.230 --> 12:56.320
Zróbmy więc krótką przerwę i zróbmy to w następnym kroku.

12:56.400 --> 12:57.860
Do tego czasu ciesz się AI.