WEBVTT

00:00.580 --> 00:02.850
Witam i zapraszam do sklepu.

00:03.040 --> 00:07.040
W porządku, więc teraz zamierzamy wprowadzić sztuczną inteligencję od zera.

00:07.040 --> 00:08.870
Zrobimy to linia po linii.

00:09.070 --> 00:12.550
I w tej pierwszej dobrej sekcji będziemy importować biblioteki.

00:12.550 --> 00:17.880
Ale zanim zaczniemy z tą pierwszą sekcją kodu, chciałbym wyjaśnić związek między

00:17.890 --> 00:20.140
sztuczną inteligencją a naszą mapą.

00:20.560 --> 00:24.000
Właśnie dlatego wdrażamy to dla nich.

00:24.040 --> 00:27.880
Jaki jest cel naszej sztucznej inteligencji i gdzie będziemy z niej korzystać.

00:27.880 --> 00:30.160
Jest to bardzo proste.

00:30.170 --> 00:34.900
Robimy tylko naszą sztuczną inteligencję, aby wybrać odpowiednią akcję i za każdym razem.

00:35.140 --> 00:42.390
Tak więc importujemy klasę z naszego pliku, więc zrobimy ten D2 w klasie w tym pliku.

00:42.580 --> 00:51.220
Ale potem zaimportujemy je tylko po to, aby wybrać odpowiednią akcję do zagrania za każdym razem i wybieramy tę akcję dokładnie

00:51.490 --> 00:53.070
w tej linii.

00:53.080 --> 01:00.580
Akcja równa się aktualizacji mózgu mniej nagrody mniej sygnału mniej sygnału będzie wejściem sieci neuronowej.

01:00.760 --> 01:05.950
Wiesz, że składa się on z trzech sygnałów czujników Plus orientacji i orientacji ujemnej.

01:06.130 --> 01:09.890
Więc to są dane wejściowe, ale wyjście jest akcją do grania.

01:10.030 --> 01:14.970
I to tylko to, co zabieramy z naszej sztucznej inteligencji, poczułem, że zaraz zrobimy.

01:15.250 --> 01:16.310
Miej to na uwadze.

01:16.390 --> 01:17.590
To jest bardzo proste.

01:17.590 --> 01:25.900
Najpierw importujemy dekryminalizację z AI AI, a następnie tworzymy mózg obiektu z klasy ludzkiej, która jako dane

01:25.990 --> 01:32.110
wejściowe przyjmuje zakodowane wektory dla stanów pięciu wymiarów trzy sygnały plus orientacja

01:32.290 --> 01:33.970
plus orientacja ujemna.

01:34.030 --> 01:36.910
Reakcje idą w lewo, idź prosto lub idź w prawo.

01:37.030 --> 01:38.470
A potem ten parametr gamma.

01:38.560 --> 01:42.410
To jedyne parametry klasy, którą będziemy robić.

01:42.490 --> 01:50.140
A kiedy już stworzymy ten obiekt, wybierzemy w klasie gry akcję do zagrania za każdym razem.

01:50.140 --> 01:51.760
A to zależy od ostatniego słowa.

01:51.940 --> 01:58.450
I Lusignan, który jest wkładem i to jest jedyny cel, aby to powiedzieć, że aby

01:58.450 --> 02:03.620
prawdziwa sztuczna inteligencja grała właściwe działania, za każdym razem, gdy poruszamy się

02:04.030 --> 02:08.480
w prawo, zamiast losowych działań, jak zaobserwowaliśmy w poprzednim tutorialu.

02:08.500 --> 02:12.620
W porządku, zróbmy to, wykorzystajmy naszą sztuczną inteligencję.

02:12.760 --> 02:18.430
Jak już powiedzieliśmy, zaczniemy od zaimportowania wszystkich bibliotek, których będziemy używać do implementacji.

02:18.460 --> 02:21.160
W ten sposób otrzymamy wszystkie potrzebne narzędzia.

02:21.160 --> 02:22.790
W porządku, zacznijmy od pierwszego.

02:22.810 --> 02:28.870
Pierwszym z nich jest nieunikniona biblioteka non-packa z biblioteki nie-tajlandzkiej.

02:28.870 --> 02:35.270
Zawsze polecam zaimportować to biblioteka, która pozwala nam grać i pracować z Irakijczykami.

02:35.620 --> 02:40.180
A to jest skrótem, wygodniejszym, gdy chcemy używać numeru.

02:40.590 --> 02:44.050
W porządku, druga biblioteka jest losowa.

02:44.050 --> 02:50.530
A więc dzieje się tak dlatego, że podczas wdrażania powtórzeń będziemy pobierać losowe próbki z

02:50.530 --> 02:51.770
różnych partii.

02:51.940 --> 02:54.650
Musimy więc również zaimportować tę losową bibliotekę.

02:54.880 --> 03:02.470
Następnie zaimportujemy os, które będą użyteczne, gdy chcemy wczytać model, ponieważ wiesz, że gdy model będzie

03:02.470 --> 03:08.710
gotowy, zaimplementujemy kod, aby zapisać model, a następnie inny kod do załadowania modelu.

03:08.700 --> 03:14.140
Właśnie wtedy chcemy, abyście oszczędzali mózg i ładowali mózg za każdym razem, gdy chcecie zamknąć komputer,

03:14.140 --> 03:18.850
a my używamy mózgu, który został wcześniej wyszkolony do jakiegoś nowego eksperymentu.

03:19.060 --> 03:20.410
To ważne.

03:20.740 --> 03:27.230
Następnie zaimportujemy bibliotekę pochodni niezbędną.

03:27.250 --> 03:32.170
To dlatego, że będziemy wdrażać naszą sieć neuronową z moją latarką, którą polecam znacznie

03:32.170 --> 03:36.670
więcej niż innym sztucznym inteligencjom, ponieważ potrafi poradzić sobie z dynamicznymi wykresami.

03:36.670 --> 03:46.150
Więc idziemy z torche, a następnie z torche mamy zamiar importować torche start i end, moduł końcowy jest najbardziej niezbędny, który

03:46.150 --> 03:51.730
jest moduł, który zawiera wszystkie narzędzia do realizacji niektórych sieci neuronowych.

03:51.820 --> 03:57.370
I oczywiście będzie głęboka sieć neuronowa, która weźmie jako sygnały wejściowe trzy

03:57.370 --> 04:03.910
sygnały z trzech czujników plus orientacja i orientacja ujemna i zwróci jako wyjście akcję do grania.

04:04.090 --> 04:09.220
Właściwie, aby zwrócić q wartości różnych akcji i używając miękkiego Max.

04:09.220 --> 04:15.970
Zwrócimy akcję, aby zagrać tylko jedną, która jest najbardziej

04:16.000 --> 04:26.500
istotna, aby karty poszły na tortury, a najistotniejsze, a następnie podamy skrót do pakietu funkcjonalnego.

04:26.550 --> 04:29.960
Stąd idziemy z pakietem funkcjonalnym od końca i Maggio.

04:29.970 --> 04:36.310
Tak więc ten pakiet funkcjonalny zawiera różne funkcje, których używamy przy wdrażaniu sieci neuronowej.

04:36.340 --> 04:42.240
Zwykle ostatnia funkcja, którą będziemy wykorzystywać do utraty danych, ponieważ poprawia ona konwergencję, a

04:42.240 --> 04:46.950
strata jest zawarta w tym funkcjonalnym module częściowym z modułu końcowego.

04:47.190 --> 04:54.330
A ponieważ wszystko to trwa dość długo, zamierzamy nadać mu skrót i nazwijmy to po prostu.

04:54.460 --> 04:57.260
Następnie tylko 3 moduły do zaimportowania w lewo.

04:57.340 --> 05:05.710
Więc następny to kolejny centralny, który należy do niego, a my zabieramy go z

05:06.220 --> 05:12.870
biblioteki tortur, a potem idziemy tam i nazwijmy to zamiast nim.

05:13.030 --> 05:15.250
To oczywiście dla optymalizatora.

05:15.340 --> 05:22.030
Będziemy importować niektóre optymalizatory do wykonywania C-klasy w takim sensie, że zdecydowanie będziemy tego

05:22.030 --> 05:25.100
potrzebować, a następnie musimy zaimportować autografy.

05:25.210 --> 05:28.670
I to tylko po to, abyśmy zmienili klasę z naszego żalu.

05:29.170 --> 05:31.630
Tak więc jego cel jest trochę techniczny.

05:31.630 --> 05:39.010
Zasadniczo musimy zaimportować klasę zmiennych, aby dokonać konwersji z tensorów, które są jak bardziej zaawansowane

05:39.010 --> 05:43.160
tablice, aby uniknąć wszystkiego, co zawiera gradient.

05:43.210 --> 05:46.640
Tak więc nie chcemy mieć tylko tensora samodzielnie.

05:46.660 --> 05:51.940
Chcemy umieścić tensor w zmiennej, która będzie również zawierała gradient i aby

05:51.940 --> 05:58.350
to zrobić, musimy użyć klasy zmiennej, aby przekształcić ten tensor w zmienną zawierającą tensor i gradient.

05:58.520 --> 06:02.550
To trochę techniczne, ale to właśnie musimy zrobić, pracując z latarką PI.

06:02.680 --> 06:04.830
I robimy to dzięki zmiennej klasie.

06:04.840 --> 06:13.220
Zanim jednak przejdziemy do klasy zmiennej, musimy zaimportować torche

06:13.220 --> 06:26.430
tego gradu i dać krótki skrót, a następnie z pochodni, którą poddajemy, importujemy Roybala. Idziemy.

06:26.560 --> 06:31.390
A teraz mamy wszystkie biblioteki, których będziemy używać do implementacji naszej sztucznej inteligencji.

06:31.600 --> 06:34.050
Nie będziemy więc zajmować się importowaniem żadnej innej biblioteki.

06:34.060 --> 06:35.670
Mamy wszystkie potrzebne narzędzia.

06:35.830 --> 06:40.000
A teraz jesteśmy gotowi, aby stworzyć architekturę sieci neuronowej.

06:40.030 --> 06:42.680
Tak właśnie zrobimy w następnym samouczku.

06:42.760 --> 06:44.370
A do tego czasu ciesz się AI.
