WEBVTT

00:00.420 --> 00:04.730
Witam i zapraszam na ostatni krok tej części budynku.

00:04.860 --> 00:10.500
Teraz jedyne, co musimy zrobić, to uczynić z Forda funkcję, która będzie propagować

00:10.500 --> 00:16.650
sygnał od samego początku, kiedy mózg doprowadzi obraz do samego końca, kiedy umieszczę akcję, więc

00:16.650 --> 00:22.260
zrobimy to cała funkcja i to będzie nasz ostatni krok, zanim przejdziemy do

00:22.260 --> 00:26.710
udziału w szkoleniu naszej sztucznej inteligencji z głębokim splotowym kulangiem.

00:26.890 --> 00:28.080
Zróbmy to.

00:28.080 --> 00:34.470
Przejmiemy wywołanie funkcji, które faktycznie jest podobne do funkcji init, która jest istniejącą funkcją,

00:34.470 --> 00:38.760
ale tym razem używamy jej do wywoływania innych funkcji.

00:38.790 --> 00:43.170
Te, które zrobiliśmy wcześniej, ponieważ wiesz, że zamierzamy użyć funkcji do przodu z

00:43.290 --> 00:45.490
mózgu i funkcji portu z ciała.

00:45.630 --> 00:50.270
Używamy teraz tej funkcji, aby w zasadzie wywoływać te funkcje.

00:50.550 --> 00:53.160
Więc połączenie będzie wymagało dwóch argumentów.

00:53.160 --> 00:54.330
Pierwszy to jaźń.

00:54.330 --> 01:00.220
Oczywiście przedmiot i drugi argument, który według ciebie jest tym, czym będzie.

01:00.360 --> 01:02.910
Cóż, tym razem wykonujemy całą propagację.

01:02.910 --> 01:08.460
Więc tym, co chcemy wziąć jako dane wejściowe, są oczywiście obrazy wejściowe, ponieważ oczywiście jest

01:08.460 --> 01:10.860
to punkt wyjścia, kiedy AI gra.

01:10.860 --> 01:16.080
Najpierw wizualizuje obrazy gry, a następnie propaguje sygnały w mózgu, a następnie

01:16.080 --> 01:17.180
odtwarza akcję.

01:17.190 --> 01:20.130
Dlatego drugi argument będzie wejściowy.

01:20.610 --> 01:24.740
A teraz jesteśmy gotowi przeprowadzić tę całą propagację.

01:24.810 --> 01:26.220
Zróbmy to ponownie.

01:26.220 --> 01:31.900
Tak więc pierwszym krokiem, w którym jest pierwszy krok, jest otrzymanie obrazu wejściowego z gry.

01:32.190 --> 01:38.010
A ponieważ te obrazy wejdą do sieci neuronowej, możesz sobie wyobrazić, że musimy je

01:38.010 --> 01:42.840
sformatować w specjalnej strukturze, a struktura jest oczywiście strukturą pochodni.

01:42.840 --> 01:48.420
Tak więc pierwszą rzeczą, która się wydarzy, jest przekonwertowanie tych obrazów na matrycę superarbitrów, a

01:48.420 --> 01:55.320
następnie przekształcimy je w tensor palnika, a następnie w końcu wprowadzimy tensor palnika do zmiennej palnika, która będzie

01:55.500 --> 01:58.260
zawierać zarówno tensor, jak i gradient.

01:58.350 --> 02:03.780
To dla naszych dynamicznych wykresów, aby bardzo wydajnie obliczyć gradienty później Kattie jest wielka w tym

02:03.780 --> 02:04.460
sensie.

02:04.620 --> 02:06.200
To nasz pierwszy krok.

02:06.270 --> 02:12.130
A kiedy już otrzymamy właściwy format naszych obrazów, będą mogli wejść do sieci neuronowej,

02:12.360 --> 02:16.320
a wtedy będziemy mogli przeprowadzić całą propagację sygnałów.

02:16.380 --> 02:20.340
Zróbmy to najpierw, aby przekonwertować obraz na właściwy format.

02:20.430 --> 02:23.050
Więc nasze obrazy są tak na dane wejściowe.

02:23.220 --> 02:26.780
Teraz stworzymy nową zmienną, którą wywołuję input.

02:26.820 --> 02:30.470
To jest prawdziwe wejście sieci neuronowej i tego wejścia.

02:30.510 --> 02:31.760
Gdzie to będzie.

02:31.920 --> 02:34.490
Najpierw musimy wziąć nasze dane wejściowe.

02:34.530 --> 02:36.650
To są nasze oryginalne obrazy.

02:36.870 --> 02:42.190
Następnie, jak powiedzieliśmy, chcemy przekonwertować te obrazy na tablice Nampa.

02:42.330 --> 02:49.260
Aby to zrobić, możemy po prostu nie przyjmować żadnego, za pomocą którego mamy skrót, a następnie tablicę funkcji.

02:49.500 --> 02:52.850
Wstawiamy więc nawiasy w tablicy funkcji.

02:52.890 --> 02:53.340
No to jedziemy.

02:53.340 --> 02:55.940
Teraz jest konwertowany na coś i przez tablice.

02:56.190 --> 03:02.790
Ale ponieważ komórki z tablic numpad będą zawierały piksele, bezpieczniej jest określić

03:02.790 --> 03:04.230
typ float.

03:04.310 --> 03:11.040
Lepiej upewnić się, że mamy teraz trochę spacji, aby upewnić się, że możemy użyć tego float.

03:11.090 --> 03:12.690
Przykro to słyszeć.

03:12.720 --> 03:15.390
W porządku, więc teraz mamy jeszcze sędziego.

03:15.540 --> 03:17.330
Ale z tabletem.

03:17.720 --> 03:24.150
W porządku, a to jeszcze jeden powód, dla którego tensory są z definicji tablicami jednego typu.

03:24.270 --> 03:28.060
Dlatego wybieramy pojedynczy typ jako float float 32.

03:28.060 --> 03:28.350
W porządku.

03:28.350 --> 03:34.440
Teraz, gdy mamy już podbijanie nie bio, kolejnym krokiem jest zamiana tego w czujnik

03:34.440 --> 03:37.990
żółwia, a do tego możemy użyć np. Latarki.

03:38.070 --> 03:45.380
A następnie z niewydajnej funkcji podkreślenia, która zamieni ją na czujnik palnika.

03:45.420 --> 03:46.200
No to jedziemy.

03:46.210 --> 03:52.320
A teraz ostatni krok polega na umieszczeniu tych czujników palnika w zmiennej latarki zawierającej zarówno tensor, jak

03:52.320 --> 03:53.230
i porozumienie.

03:53.400 --> 04:02.010
I wiesz jak to zrobić, oczywiście bierzemy naszą klasę zmiennych, ponieważ właściwie wszystko, co znajduje się wewnątrz tej

04:02.010 --> 04:05.530
zmiennej, jest w rzeczywistości wejściem klasy zmiennej.

04:05.760 --> 04:11.400
Ale chciałem ci to pokazać w ten sposób, ponieważ wiesz, że zaczynamy od naszych obrazów wejściowych, a następnie

04:11.400 --> 04:15.890
przekształcamy je w ponumerowane tablice, a następnie w tace palnika, a następnie jutro.

04:16.170 --> 04:17.220
A teraz jesteśmy dobrzy.

04:17.220 --> 04:23.370
Mogą wejść do sieci neuronowej, która jest najpierw oczami, a następnie w pełni połączone

04:23.370 --> 04:25.770
warstwy, które prowadzą do przewidywań.

04:26.220 --> 04:30.340
Mówiąc o oczach oczu, właśnie to teraz zrobimy.

04:30.480 --> 04:37.280
Zamierzamy teraz rozpowszechniać te dozwolone obrazy w oczach oczu, które przechodzą przez trzy

04:37.290 --> 04:38.720
splotowe warstwy.

04:38.850 --> 04:41.620
I aby to zrobić, zobaczycie teraz, jak to jest takie proste.

04:41.640 --> 04:46.290
To dlatego, że mamy już nasz mózg w naszym ciele z funkcji init.

04:46.320 --> 04:56.190
Musimy po prostu wziąć mózg za ten mózg i zastosować ten mózg do obrazów wejściowych, które będą propagować

04:56.190 --> 04:59.830
rzeczy do funkcji jedzenia z mózgu.

05:00.430 --> 05:06.190
To będzie propagować sygnały wewnątrz mózgu, a ponieważ funkcja przekazania mózgu zwraca

05:06.520 --> 05:13.600
sygnały wyjściowe, że neurony warstwy wyjściowej zawierają wartości Q Cóż, to samo wejście mózgu tutaj

05:13.610 --> 05:19.030
zwróci ten sygnał wyjściowy i dlatego zamierzamy umieścić tutaj czy zostanie

05:19.090 --> 05:26.120
zmieniona w zmienną i będziemy ją nazywać po prostu outwitami, to wyjście jest sygnałem wyjściowym

05:26.120 --> 05:26.690
mózgu.

05:26.930 --> 05:31.970
A teraz, gdy mamy wyjściowy sygnał mózgu Cóż, musimy propagować ten sygnał wyjściowy

05:31.970 --> 05:37.990
do ciała i aby to zrobić, wykorzystamy drugą funkcję do przodu z ciała i zrobimy to.

05:38.030 --> 05:46.370
Musimy po prostu zabrać nasze ciało i zastosować je oczywiście do wyników, ponieważ funkcja Forda ciała

05:46.370 --> 05:50.600
przyjmuje jako sygnał wejściowy sygnały wyjściowe mózgu.

05:50.660 --> 05:55.880
Tak więc właśnie to jest wyjście i zwraca akcje.

05:56.000 --> 05:58.080
I dlatego, że zwraca działania.

05:58.380 --> 06:03.530
Tutaj dodamy działania, które spowodują, że to samo wyjście.

06:03.920 --> 06:09.380
W porządku, teraz widzicie, że po prostu propagowaliśmy sygnały wewnątrz mózgu, a następnie od

06:09.380 --> 06:15.410
mózgu do pierwszego, używając funkcji formy z mózgu, która zabiera nas i umieszcza obrazy wejściowe,

06:15.410 --> 06:19.830
a następnie propaguje je do mózgu, aby zachowaj kluczowe wartości.

06:20.240 --> 06:25.400
A następnie propagujemy ten sygnał wyjściowy w ciele, w którym działa funkcja naszego ciała, aby

06:25.520 --> 06:26.900
uzyskać akcję do odegrania.

06:26.900 --> 06:32.300
A teraz jedyna pozostała rzecz, którą musimy zrobić i to jest ostatnia linia

06:32.300 --> 06:34.510
kodu tej części, która buduje.

06:34.760 --> 06:39.370
Musimy zwrócić akcję, aby grać, i to jest działanie.

06:39.530 --> 06:45.020
Jednak teraz działania muszą mieć format pochodni i musimy je z powrotem przekonwertować z powrotem

06:45.260 --> 06:51.660
na nie, i aby to zrobić, zajmiemy się strukturą danych tych działań, a następnie dodamy tutaj funkcję

06:51.890 --> 06:53.840
niepilotową, a następnie jedziemy.

06:53.840 --> 06:56.780
Teraz mamy działania, które zmieniliśmy we właściwym formacie.

06:56.780 --> 06:58.040
Gratulacje.

06:58.040 --> 07:00.660
Teraz kończymy pierwszą część 1.

07:00.770 --> 07:03.410
Budujemy sztuczną inteligencję w trzech krokach.

07:03.410 --> 07:06.860
Najpierw stworzyliśmy mózg, po którym stworzyliśmy ciało.

07:06.860 --> 07:13.430
Po trzecie, gromadzimy mózg w ciele i propagujemy cały sygnał od oczu do momentu, w

07:13.430 --> 07:15.130
którym wykonujemy akcję.

07:15.560 --> 07:17.100
To pierwszy krok.

07:17.120 --> 07:22.200
To był ogromny krok, ale teraz, kiedy zrozumiałeś, zbudowaliśmy sztuczną inteligencję, ale wciąż jest głupia.

07:22.220 --> 07:24.110
Musimy go wyszkolić, aby był inteligentny.

07:24.170 --> 07:29.030
Musimy więc wyszkolić go do robienia tego, co chcieliśmy, i aby to zrobić, użyjemy

07:29.030 --> 07:34.100
słowa "robić otoczenie", które znasz, ponieważ uczysz się od świata poprzez wzmocnienie, gdy dostajesz dobrą

07:34.100 --> 07:34.690
nagrodę.

07:34.760 --> 07:40.610
A będąc ukaranym lub osłabionym, gdy dostaje złe słowo, w tym miejscu

07:40.610 --> 07:41.670
wkracza nauka.

07:41.690 --> 07:47.510
I właśnie to zrobimy w tej części, aby ćwiczyć w oku z głębokim splotowym uczeniem się Q.

07:47.510 --> 07:50.270
Nie mogę się doczekać rozpoczęcia i do tego czasu.