WEBVTT

00:00.620 --> 00:03.480
Helen wróci na kurs sztucznej inteligencji.

00:03.510 --> 00:08.760
W dzisiejszym tutorialu robimy pierwszy krok do świata A-3, a jako pierwszy krok

00:08.760 --> 00:11.220
dowiemy się, co oznacza odrzucenie.

00:11.400 --> 00:14.270
Zatem A-3 C oznacza przewagę synchroniczną.

00:14.310 --> 00:16.040
Krytyczny algorytm aktorski.

00:16.260 --> 00:23.310
Jest to algorytm, który został opracowany przez Google w głębokim umyśle w 2016 roku przez

00:23.370 --> 00:27.760
grupę badaczy i jest najnowocześniejszym algorytmem sztucznej inteligencji.

00:27.780 --> 00:33.120
Do tej pory ma wiele powiadomień i omówimy to więcej w trakcie kursu,

00:33.390 --> 00:35.050
zwłaszcza w praktycznych samouczkach.

00:35.160 --> 00:42.000
Niemniej jednak ten algorytm wysadza wszystko inne, łącznie z głębokimi splotowymi sieciami uczenia Q, z

00:42.240 --> 00:45.870
wody całkowicie z wody i jest szybszy.

00:45.930 --> 00:50.300
Szkolenie zajmuje mniej czasu, a wyniki są lepsze.

00:50.340 --> 00:55.680
Tak więc podczas tej części kursu będziemy się odwoływać, a my już

00:55.680 --> 01:02.140
wspomnieliśmy, że będziemy odwoływać się do jeszcze większej ilości artykułów na temat opublikowanego artykułu, w którym

01:02.140 --> 01:09.030
po raz pierwszy wprowadzono morze A-3 zwane synchronicznymi metodami głębszego egzekwowania, ucząc się, dlaczego Vladimir minae i

01:09.140 --> 01:15.660
inni z głębokiej kopalni Google, którzy pokażą ci teraz ten artykuł, abyś miał do niego wstęp.

01:16.020 --> 01:24.180
A więc oto ten artykuł, który chciałem wam pokazać, abyście mogli go poczuć i gotowi, abyście go

01:24.180 --> 01:25.180
trochę zapoznali.

01:25.380 --> 01:33.270
Oczywiście zaleca się przeczytanie artykułu i zrozumienie, o czym dokładnie mówią, a przekonasz

01:33.270 --> 01:39.900
się, że podczas praktycznych ćwiczeń Adlon przeprowadzi Cię przez określone

01:39.900 --> 01:48.240
części artykułu przez niektóre akapity lub sekcje, które będą mieć znaczenie dla tego, co

01:48.300 --> 01:51.870
będzie programować w tym momencie.

01:51.960 --> 01:57.810
I to, co chciałem tu wskazać, to jak widać wiele badań w tym

01:57.810 --> 02:04.890
kierunku, ale jest też wiele odniesień, ale jak część tego obszaru jest taka, jak na końcu i

02:04.920 --> 02:09.950
porównują różne algorytmy porównując wyniki i to właśnie chciałem wskazać tutaj.

02:10.170 --> 02:11.450
Więc powiększmy trochę.

02:11.580 --> 02:18.090
Tak więc, jak możesz zobaczyć, nawet w Google, kopalni ich szkolenia lub oceniają swoje algorytmy w grach,

02:18.150 --> 02:20.550
tak jak robimy w wynikach.

02:20.550 --> 02:27.690
Tak więc ta sama zasada, ponieważ gry są symulowanym środowiskiem lub małym środowiskiem zamkniętym w otoczeniu

02:27.690 --> 02:32.780
pewnych reguł i chcą zrozumieć, jak dobrze działa sztuczna inteligencja w tych

02:32.790 --> 02:33.570
grach.

02:33.570 --> 02:34.080
I oto idziemy.

02:34.080 --> 02:34.670
Dokładnie.

02:34.680 --> 02:43.200
Wszystkie te gry, które można znaleźć wiele z nich można znaleźć na siłowni i gier, z którymi

02:43.200 --> 02:44.250
pracowaliśmy.

02:44.250 --> 02:46.940
Tak na przykład w tej sekcji pracujemy z breakoutami.

02:46.940 --> 02:50.600
Jest także tutaj, jak widać w przypadku Breakout.

02:50.610 --> 02:55.470
Pogrubili, że mają najlepszy algorytm podświetlony, więc Dick un to algorytm, z

02:55.470 --> 03:02.180
którym pracowaliśmy, a następnie kilka innych algorytmów, a następnie macie A-3, zobaczcie, czy LSD ma długą lub

03:02.180 --> 03:03.540
krótką pamięć .

03:03.540 --> 03:08.270
Tak więc to ten, który będziemy realizować w tej części kursu, wszyscy będą mieć A-3 widzieć z

03:08.280 --> 03:10.270
zespołem nélisse, co czyni go jeszcze silniejszym.

03:10.320 --> 03:15.620
Jak widać, przełom jest najlepszym wynikiem osiągniętym przez trzykrotnie.

03:15.630 --> 03:17.010
Więc to jest wynik.

03:17.110 --> 03:19.680
Sześć sześć punktów osiem w porównaniu do innych.

03:19.890 --> 03:28.740
Możesz też zobaczyć, że dla większości z nich, więc jeśli teraz zrobisz większy obraz, zobaczysz, że większość z tych

03:28.800 --> 03:31.990
odważnych jest w tej ostatniej kolumnie.

03:32.010 --> 03:36.990
Więc tak, jest kilka gier, w których inne algorytmy radzą sobie

03:36.990 --> 03:43.890
lepiej, ale jak widać, Dijk un faktycznie nie radzi sobie lepiej w żadnej z gier, ale

03:43.890 --> 03:50.600
widać, że istnieją inne algorytmy, które inne algorytmy działają lepiej, ale A-3 cel ystem działa najlepiej.

03:50.640 --> 03:57.570
W większości przypadków widać, że ta piłka to ta różdżka ta jedna i tak dalej.

03:57.570 --> 04:01.910
Widać więc, że system atrezji jest naprawdę potężnym algorytmem.

04:01.920 --> 04:08.430
To rzeczywiście jest na czele sztucznej inteligencji i właśnie to będzie wdrażać.

04:08.610 --> 04:15.600
Dlatego bardzo ekscytująca sekcja gorąco zachęci Cię do przeczytania tego artykułu i naprawdę poczujesz,

04:15.600 --> 04:18.170
o czym będziemy rozmawiać.

04:18.420 --> 04:24.650
A następnie w tej sekcji i we wszystkich praktycznych aspektach praktycznej strony Stroh'a

04:24.660 --> 04:27.240
będziemy szczegółowo omawiać tę kwestię.

04:27.240 --> 04:33.470
Będziemy pracować z ich pseudo kodem, który jest dostępny i będziemy.

04:33.570 --> 04:37.010
Pokażę ci, jak to wdrożyć i jak będziemy z tym pracować.

04:37.380 --> 04:42.680
I w tej notatce mam nadzieję, że spodoba ci się ta gazeta i nie mogę się doczekać spotkania z tobą następnym razem.

04:42.690 --> 04:44.270
A do tego czasu ciesz się AI.