WEBVTT

00:00.360 --> 00:06.360
Witam i zapraszam do zabawnego samouczka tego pierwszego modułu do samodzielnego prowadzenia samochodu, który będzie epicki.

00:06.360 --> 00:11.850
Będziemy testować nasze oko na środowisko i będziemy testować je na czterech różnych poziomach.

00:11.850 --> 00:16.620
Będziemy grać w cztery różne poziomy trudności, a cel będzie musiał

00:16.620 --> 00:18.280
przejść cztery poziomy.

00:18.420 --> 00:20.640
Więc będziemy tymi czterema poziomami.

00:20.640 --> 00:27.480
Pierwszy poziom pierwszy to dotarcie na lotnisko, a następnie odbyć kilka podróży między lotniskiem

00:27.480 --> 00:29.160
a centrum miasta.

00:29.340 --> 00:35.430
Tak więc, jak tylko zobaczymy, że samochód odbywa się w tych obiegowych trasach, przechodzimy na poziom 1, a następnie poziom 2

00:35.450 --> 00:37.490
poziomu 2 będzie nadal wykonywać te rundy.

00:37.560 --> 00:43.290
Ale na konkretnej drodze, którą sami narysujemy, ale będzie to łatwa droga, ponieważ jest to poziom

00:43.290 --> 00:43.840
2.

00:43.980 --> 00:49.030
I oczywiście samochód będzie musiał sam jechać, pozostając na tej drodze.

00:49.170 --> 00:53.420
Tak więc będzie to droga, która jedzie z lotniska do centrum, a następnie w drugą stronę.

00:53.420 --> 00:57.010
Tak więc samochód będzie musiał odbyć te okrągłe podróże siedząc na tej drodze.

00:57.210 --> 01:00.980
Jeśli tak, przejdziemy na poziom 2 i poziom 3.

01:01.030 --> 01:07.410
Poziom 3 będzie polegał na narysowaniu przeszkód na mapie, aby sprawdzić, czy samochódowi udało się ominąć przeszkody

01:07.410 --> 01:08.850
i osiągnąć cel.

01:08.910 --> 01:12.730
Żadne zmartwienia nie spowodują trudnych przeszkód, których samochód będzie musiał unikać.

01:12.930 --> 01:20.010
Zobaczymy, czy udało mu się dotrzeć do lotniska i centrum miasta, a na końcu poziom dla najbardziej

01:20.010 --> 01:25.380
wymagającego poziomu, ponieważ samochód będzie musiał narysować bardzo trudną drogę do centrum.

01:25.440 --> 01:28.060
Więc nie wiem, że to będzie droga jak zygzak.

01:28.200 --> 01:31.720
Nie jestem genialnym architektem, ale spróbuję zrobić trudną drogę.

01:31.950 --> 01:37.830
Miejmy więc nadzieję, że miniemy przynajmniej pierwszy poziom, który byłby wspaniały, więc miejmy nadzieję, że zdołamy również przejść na

01:37.920 --> 01:39.190
poziom drugi i trzeci.

01:39.420 --> 01:42.180
A jeśli przejdziemy na poziom 4, byłoby wspaniale.

01:42.180 --> 01:44.540
Zróbmy to, podejmijmy wyzwanie.

01:44.610 --> 01:49.840
Cóż, w rzeczywistości samolubny samochód podejmie wyzwanie, ale my jesteśmy mózgami tego.

01:49.860 --> 01:52.110
Powiedzmy więc, jak to działa.

01:52.110 --> 01:57.280
W porządku, więc pierwszą rzeczą, którą zrobię, jest przypomnienie o mapie.

01:57.330 --> 01:59.060
Więc to jest mapa.

01:59.190 --> 02:03.810
Najpierw przyjrzymy się mapie, na którą spojrzymy na samozasilający się samochód bez

02:04.020 --> 02:09.540
AI, po prostu będzie to samochód z tymi przypadkowymi czynnościami, które widzieliście na początku tego modelu.

02:09.600 --> 02:10.970
Jak możemy na to patrzeć?

02:11.040 --> 02:15.330
Musimy dezaktywować sztuczną inteligencję i aktywność.

02:15.570 --> 02:19.590
Po prostu musimy ustawić temperaturę równą zero.

02:19.620 --> 02:22.380
Pamiętaj, że parametr tutaj jest temperaturą.

02:22.560 --> 02:24.240
A teraz jest równa siedmiu.

02:24.300 --> 02:25.830
To niska temperatura.

02:25.830 --> 02:27.280
Zwiększymy to później.

02:27.510 --> 02:32.700
Ale jeśli nie chcemy, aby samochód miał mózg, który jest, jeśli nie chcemy aktywować

02:32.700 --> 02:36.210
AI, wystarczy ustawić temperaturę na zero równą zero.

02:36.210 --> 02:39.980
I to samo tutaj jest oczywiście prawdziwą temperaturą w chłodzie.

02:39.990 --> 02:40.460
No to jedziemy.

02:40.470 --> 02:45.580
A potem nie możemy zapomnieć powiedzieć, ponieważ w przeciwnym razie nie będzie to zmiana.

02:45.800 --> 02:47.120
Chyba teraz nie mamy żadnych.

02:47.130 --> 02:49.210
Widzę, że kiedyś go aktywowałem.

02:49.260 --> 02:53.180
Rzućmy okiem na mapę, aby szybko się odświeżyć.

02:53.220 --> 02:55.370
Szybkie przypomnienie o tym, jak to wygląda.

02:55.530 --> 03:01.070
Więc wybieram wszystko i wciskam enter.

03:01.090 --> 03:01.630
W porządku.

03:01.630 --> 03:03.840
I jest nasza mapa i jest nasz samochód.

03:03.880 --> 03:09.540
Tak więc, jak widać, samochód ma całkowicie losowe działania, które znasz, aby jechać w lewo, aby jechać

03:09.540 --> 03:16.480
prosto w prawo i dlatego nie dociera do lotniska, co przypomina mi w lewym górnym rogu mapy i nie dociera do

03:16.870 --> 03:17.500
niego.

03:17.550 --> 03:18.410
Po prostu tak.

03:18.470 --> 03:20.230
To całkowicie losowe.

03:20.230 --> 03:26.680
Widać to teraz na lotnisku i nie dociera do drugiego celu, który znajduje się w centrum miasta w

03:26.680 --> 03:28.220
prawym dolnym rogu mapy.

03:28.480 --> 03:34.030
Więc byliśmy jak tutaj, ale teraz wyraźnie widzimy, że działania są całkowicie przypadkowe.

03:34.030 --> 03:40.270
Nigdzie się nie udaje i zdecydowanie nie ma sztucznej inteligencji, ale nie ma zmartwień.

03:40.270 --> 03:42.080
Aktywujemy go teraz.

03:42.370 --> 03:49.480
Zamierzam zamknąć mapę, a następnie zamierzam zrestartować restart DeCarlo jądra.

03:49.760 --> 03:52.390
Klikasz ten przycisk narzędzia tutaj, a następnie tak.

03:52.820 --> 04:00.730
A teraz czas na przedstawienie, w końcu włożymy ten pociąg, który zrobiliśmy w samochodzie i aktywujemy sztuczną

04:00.730 --> 04:01.350
inteligencję.

04:01.700 --> 04:04.090
Jestem bardzo podekscytowany, aby zobaczyć, co się stanie.

04:04.180 --> 04:10.730
Zamierzamy teraz aktywować powietrze i aby to zrobić, musimy podnieść temperaturę, aby zmienić

04:10.730 --> 04:17.300
temperaturę, która jest zamieniana na zero, no cóż, zacznijmy od siedmiu, tak jak poprzednio.

04:17.450 --> 04:19.660
Określmy tutaj siedem.

04:19.670 --> 04:21.510
W porządku, nie zapominajmy o tym.

04:21.590 --> 04:26.870
A teraz wróćmy do naszej mapy, a teraz możemy ponownie ją ponownie uruchomić, ponieważ

04:26.870 --> 04:27.790
zrestartowaliśmy jądro.

04:27.890 --> 04:29.470
Więc powiedzmy to.

04:29.990 --> 04:31.790
I oto idziemy, mamy samochód.

04:31.790 --> 04:33.600
I co to robi.

04:33.890 --> 04:41.180
Cóż, stara się znaleźć sposób, w jaki odkrywa swoje zrozumienie, co musi zrobić, a co za tym idzie dotrzeć na

04:41.180 --> 04:47.900
lotnisko i tam pierwszy raz osiągniemy wspaniałe, a teraz następnym celem jest dotarcie do centrum, a tam

04:48.140 --> 04:50.540
martwi po prostu docierają do centrum.

04:50.810 --> 04:56.750
A teraz próbuje znaleźć lotnisko z powrotem na lotnisko i tam znowu Wonderfalls, które

04:56.750 --> 04:57.450
działa.

04:57.470 --> 05:03.200
Naprawdę nie zajęło Ci czasu, aby dowiedzieć się czegoś na temat błędów, które popełniłeś,

05:03.200 --> 05:04.380
będąc błędem.

05:04.520 --> 05:08.770
To tam karze samochód, przyznając mu lekko negatywną nagrodę.

05:08.780 --> 05:10.270
Znasz jego minus 0. 2.

05:10.550 --> 05:16.760
Z tego błędu wynika, że ucząc się z tego błędu, udało mu się uzyskać pozytywne korzyści,

05:17.000 --> 05:18.980
zbliżając się do celu.

05:19.310 --> 05:21.940
A teraz w końcu zrozumiał, co ma robić.

05:21.980 --> 05:28.530
Zdecydowanie docieramy na lotnisko, a następnie docieramy do centrum, a potem robimy te okrągłe wycieczki.

05:28.550 --> 05:29.970
To idealne.

05:29.990 --> 05:36.090
Mamy samochód do samodzielnego prowadzenia, ale nie mogę nie zauważyć, że wygląda jak owad.

05:36.170 --> 05:38.510
Samochód naprawdę nie wydaje się pewny siebie.

05:38.510 --> 05:40.610
Nie, nie ma pewności ruchu.

05:40.610 --> 05:44.570
To jest jak twoja lewa i prawa, która nie porusza się jak ruch samochodu.

05:44.660 --> 05:46.090
Wygląda bardziej jak błąd.

05:46.490 --> 05:47.820
Więc to naprawimy.

05:47.930 --> 05:54.560
I jak mogłeś się domyślić, jak to naprawić, to zwiększ temperaturę, ponieważ pamiętaj, że temperatura jest

05:54.560 --> 05:59.690
parametrem w funkcji Macintosh, którą możemy zwiększyć, aby akcja została zwrócona z

05:59.690 --> 06:00.730
większą pewnością.

06:00.830 --> 06:05.630
Sensowne jest więc, że jeśli zwiększymy temperaturę, może się zdarzyć, że samochód stanie się

06:05.630 --> 06:09.750
bardziej pewny siebie, ponieważ AI będzie bardziej pewna, która akcja powinna grać.

06:10.220 --> 06:15.350
I pamiętajcie, że akcja będzie odgrywana z większym prawdopodobieństwem.

06:15.350 --> 06:20.780
Jedynym problemem związanym z tym wzrostem temperatury jest to, że pamiętaj, że sztuczna

06:20.780 --> 06:26.380
inteligencja jest mniej odkrywaniem innych działań, ponieważ zwiększając temperaturę innych działań będziemy mieli niskie prawdopodobieństwa.

06:26.380 --> 06:31.760
Ale teraz to nie wydaje się być problemem, ponieważ samochód wydaje się nie mieć problemu z osiągnięciem swoich

06:31.760 --> 06:32.310
celów.

06:32.420 --> 06:38.840
Lotnisko do centrum, więc możemy całkowicie podnieść temperaturę, jeśli chcemy tego, co do tej pory wygląda

06:38.840 --> 06:41.140
jak owad wygląda jak samochód.

06:41.390 --> 06:42.620
Zróbmy to.

06:42.620 --> 06:45.530
Zamierzam to teraz zamknąć.

06:45.530 --> 06:46.370
No to jedziemy.

06:46.370 --> 06:48.310
Zrestartuj jądro ponownie.

06:49.430 --> 06:50.590
I naciśnij tak.

06:50.830 --> 06:52.810
A teraz zwiększymy temperaturę.

06:53.200 --> 06:54.090
Zróbmy to.

06:54.100 --> 07:02.170
Wracam do pliku, a potem zastępuję siedem na 100. Idziemy.

07:02.340 --> 07:03.410
Potem oszczędzamy.

07:03.720 --> 07:07.890
A teraz mamy własny samochód samojezdny.

07:07.890 --> 07:11.990
Więc możemy uzyskać lepsze wyniki i możemy uzyskać coś, co wygląda bardziej jak samochód.

07:12.270 --> 07:15.780
Zróbmy mapę, a następnie do tego jeszcze raz.

07:16.610 --> 07:18.900
W porządku, co się stało.

07:18.920 --> 07:19.730
DOBRZE.

07:19.830 --> 07:21.340
Zrobiło coś w rodzaju wypalenia zawodowego.

07:21.350 --> 07:22.190
Nie pewny dlaczego.

07:22.310 --> 07:25.980
Ale teraz mamy coś, co wygląda bardziej jak samochód.

07:26.060 --> 07:28.240
Widać, że idzie bardziej prosto.

07:28.240 --> 07:31.190
Nie wykonuje tych szybkich ruchów w lewo i w prawo.

07:31.190 --> 07:36.410
To dlatego, że teraz samochód jest bardziej pewny, w którym kierunku i za każdym razem, gdy

07:36.410 --> 07:40.720
wiesz, że chce wybrać najlepszą drogę na lotnisko, a następnie do centrum miasta.

07:41.000 --> 07:44.490
Więc wyraźnie możemy teraz powiedzieć, że przeszliśmy poziom pierwszy.

07:44.510 --> 07:47.840
Samochód jeździ tymi rundami między lotniskiem a centrum miasta.

07:47.990 --> 07:52.610
Więc zamierzamy to uratować, to zamierzam wam pokazać, jak uratować mózg.

07:52.610 --> 07:59.520
Musimy tylko kliknąć ten przycisk zapisu i sprawdzić, co się tutaj dzieje.

07:59.520 --> 08:04.640
Mamy krzywa, na której byliśmy na początku, możemy zaobserwować pewne błędy, które popełniła.

08:04.740 --> 08:06.990
A więc tam jest nagroda negatywna.

08:07.170 --> 08:14.280
Ale potem nauczyło się na błędach, a nagroda wzrastała stopniowo, aż osiągnięcie stałej, pozytywnej nagrody

08:14.280 --> 08:19.100
równa się otwartej, ale to jest maksymalna nagroda jaką ustalamy.

08:19.200 --> 08:21.640
A to dlatego, że skończyło się odkrywaniem.

08:21.870 --> 08:23.490
To jest faza wygaśnięcia.

08:23.670 --> 08:26.200
A potem po prostu wiedział, co musi zrobić.

08:26.230 --> 08:32.230
Właśnie tam robił te okrągłe Rountree między lotniskiem a centrum miasta, bez żadnego błędu.

08:32.640 --> 08:33.450
Więc idziemy.

08:33.450 --> 08:34.470
Przeszliśmy poziom pierwszy.

08:34.470 --> 08:35.850
Gratulacje.

08:35.850 --> 08:38.170
Teraz zwiększmy wymagania.

08:38.190 --> 08:40.120
Weźmy rzeczy na następny poziom.

08:40.140 --> 08:45.810
Spróbujmy przejść poziom, na który przypominam, że wykonujemy te okrągłe podróże na konkretnej drodze.

08:45.830 --> 08:47.060
Narysujemy się.

08:47.120 --> 08:49.170
Sprawdźmy to w następnej pracy.

08:49.200 --> 08:50.780
I do tego czasu I.
