WEBVTT

00:00.330 --> 00:07.100
Cześć i witam w trzecim module dyskursu morze H-3 jako synchroniczni aktywni krytycy.

00:07.200 --> 00:11.850
I tak teraz mogę naprawdę przywitać się ze stanem techniki uczenia maszynowego.

00:12.180 --> 00:16.560
W tym czasie mówię, ponieważ niektórzy z was mogą wziąć udział w kursie od roku do

00:16.590 --> 00:20.080
dwóch lat, ale w tym czasie mówię to w 2017 roku.

00:20.190 --> 00:25.410
Cóż, masz zamiar pracować nad jednym z najpotężniejszych modeli sztucznej inteligencji, ale nie

00:25.410 --> 00:28.780
jest to jedyna wyjątkowa cecha tego modułu.

00:28.830 --> 00:35.280
Nie tylko będziemy pracować z najpotężniejszym modelem, ale zamierzamy wdrożyć najpotężniejszą wersję

00:35.280 --> 00:42.630
tego algorytmu, która jest najbardziej zoptymalizowaną wersją zaimplementowanej wersji modelu A-380, ponieważ można

00:42.990 --> 00:47.030
sobie wyobrazić, że istnieje serce algorytm.

00:47.190 --> 00:50.880
Ale istnieje wiele narzędzi, które możemy wykorzystać do optymalizacji całego modelu.

00:50.970 --> 00:55.110
W ten sposób nie tylko będziesz musiał przejść przez algorytm,

00:55.110 --> 00:59.450
ale także wdrożysz wszystkie te narzędzia, aby model był niesamowicie wydajny.

00:59.670 --> 01:01.490
I dlaczego chciałem to zrobić.

01:01.590 --> 01:03.110
Cóż, to z dwóch powodów.

01:03.120 --> 01:06.210
Pierwszym powodem jest to, że zbliżamy się do końca dyskursu.

01:06.210 --> 01:10.770
Ten kurs jest kursem na najwyższym poziomie pomiędzy trzema kursami i będzie zajmował się sztuczną inteligencją.

01:10.870 --> 01:14.340
Chodzi o to, że teraz myślę, że jesteś gotowy, aby zabrać go na wyższy poziom.

01:14.400 --> 01:19.230
Drugi powód jest taki, że rozwiązanie breakoutu jest naprawdę bardzo trudne.

01:19.230 --> 01:24.270
Zapamiętaj w wideo promocyjnym, które chcieliśmy umieścić jako pierwszy moduł, ponieważ uważaliśmy, że

01:24.270 --> 01:29.410
będzie to najłatwiejsze wyzwanie, ale w rzeczywistości nie było to najtrudniejsze wyzwanie i prostszym

01:29.400 --> 01:36.060
sposobem wyjaśnienia tego jest to, że w potworności potwory są duże i dlatego łatwiejsze do wykrycia, a zatem łatwiejsze

01:36.060 --> 01:37.620
do zabicia lub uniknięcia.

01:37.830 --> 01:44.160
Ale w Breakout mamy tę małą kulkę, którą oko również musi wykryć, ponieważ oko nadal będzie miało

01:44.160 --> 01:44.810
oczy.

01:44.800 --> 01:47.670
Nadal będziemy uczyć się głębokiego wzmacniania.

01:47.910 --> 01:53.340
Jest to w rzeczywistości bardzo trudne i dlatego tak naprawdę nie mamy wyboru do wdrożenia.

01:53.340 --> 01:59.080
Najpotężniejsza wersja A-3 zobacz teraz dlaczego mówię, że jest to najmocniejsza wersja.

01:59.120 --> 02:00.350
To z konkretnego powodu.

02:00.350 --> 02:05.270
Nie mówię, że zamierzam wprowadzić najmocniejszą wersję A-380.

02:05.460 --> 02:06.420
Nie, to nie to.

02:06.540 --> 02:11.550
Powodem, dla którego to mówię, jest to, że wersja, którą zamierzaliśmy zaimplementować,

02:11.550 --> 02:18.090
jest czymś bardzo wyjątkowym, co zamierzamy zrobić, to faktycznie wersja 3 C, która została zaimplementowana przez kogoś,

02:18.240 --> 02:23.910
ale poprawiona przez jedną z najbardziej wpływowych osób w dzisiejszym uczeniu maszynowym, który jest twórcą

02:23.910 --> 02:24.810
latarki Pi.

02:24.810 --> 02:27.330
Nazywa się Dan Pashka.

02:27.710 --> 02:28.840
Teraz, co zamierzamy zrobić.

02:29.040 --> 02:35.430
Będziemy kontynuować na głównej stronie, a jeśli przewiniesz w dół do końca,

02:35.790 --> 02:40.700
zobaczysz zespół, który walczy z twórcami i współtwórcami.

02:40.800 --> 02:45.500
I widać tutaj, że moją pochodnię obecnie prowadzi Adam Pascal.

02:45.690 --> 02:51.340
To jest osoba, za którą powinniśmy być wdzięczni, ponieważ jest bardzo mało wersji tych

02:51.340 --> 02:57.120
trzech rzeczy, które działają dobrze na breakout i poprawił jeden z kodów dla A-380, aby

02:57.120 --> 02:58.470
breakout działał doskonale.

02:58.470 --> 03:04.320
Tak więc Pascal nie tylko podtrzymuje To w kierunku Ale także jest jednym z twórców przez pochodnie i jak

03:04.320 --> 03:08.090
powiedziałem dzisiaj jest w pierwszej dziesiątce najbardziej wpływowych osób w uczeniu maszynowym.

03:08.190 --> 03:13.500
Możemy więc być pewni, że wersja, którą zamierzamy zaimplementować, jest prawdopodobnie

03:13.500 --> 03:15.050
najpotężniejszą wersją A-3.

03:15.240 --> 03:17.580
A więc jaka jest ta implementacja.

03:17.760 --> 03:23.100
Oryginalnie pochodzi od programisty zwanego historią.

03:23.220 --> 03:29.400
Jak widać, zrobił to przez implementację A3 C, który początkowo nie działał dobrze na

03:29.400 --> 03:32.950
breakout, ale wtedy ktoś wykonał żądanie pull.

03:32.970 --> 03:39.170
Jeśli przejdziemy do wniosku o pulę, zobaczymy w zbliżeniu, że idziemy, mamy to czystsze

03:39.170 --> 03:41.030
rozwiązanie problemu Gretchen.

03:41.190 --> 03:43.810
I zgadnij, z kogo pochodzi ta prośba o pociągnięcie.

03:43.950 --> 03:51.060
Został wykonany od Adama Pashki stworzonego przez latarkę i rozwiązał problem, który sprawia, że A-380 działa bardzo dobrze

03:51.060 --> 03:54.720
na wybuchu bez czekania na dni i dni.

03:55.200 --> 04:01.950
I dlatego jeśli wrócimy do tej implementacji, zobaczymy czterech współpracowników tej najpotężniejszej

04:01.950 --> 04:02.900
implementacji.

04:03.180 --> 04:04.590
A oto współtwórcy.

04:04.590 --> 04:10.380
Bardzo dziękuję wszystkim i możemy powiedzieć ogromne i specjalne podziękowanie Adamowi za

04:10.380 --> 04:12.810
naprawienie problemu z dzieleniem wątku.

04:12.810 --> 04:16.590
Zaczął od zrobienia widelca, który jest podgałęsem kodu.

04:16.590 --> 04:20.970
Następnie poprosił dewelopera o polecenie usunięcia problemu.

04:20.970 --> 04:26.790
Nie było kodu, który byłby świetnym i dzielącym się problemem, i dlatego stał się głównym

04:26.790 --> 04:32.850
uczestnikiem tej implementacji, dzięki czemu wszystko działa doskonale i uwierzcie mi, że przeprowadziłem wiele eksperymentów na

04:33.000 --> 04:36.390
modelu AC DC, który faktycznie zaimplementował pięć modeli.

04:36.390 --> 04:41.430
Byłem nawet zdesperowany, że to nie działa dobrze, więc zrobiłem własny breakout i cavy, aby mieć

04:41.550 --> 04:44.300
większą piłkę i dlatego łatwiejsze wstępne przetwarzanie obrazów.

04:44.340 --> 04:48.780
Potem wróciłem do oka i wykonałem własną implementację 3C.

04:48.860 --> 04:53.280
Ale to trwało całe wieki, aby biegać i trenować na całkiem potężnym komputerze.

04:53.460 --> 04:55.190
Więc chciałem znaleźć lepszy sposób.

04:55.380 --> 04:56.990
I tak to właśnie jest.

04:57.150 --> 05:03.460
Bardzo potężna implementacja Silmaril, której jednym z głównych współpracowników jest Stwórca przy pomocy

05:03.530 --> 05:04.530
latarki.

05:04.580 --> 05:11.270
To, co zamierzamy zrobić w tym Mudgalu Myślę, że jesteście gotowi na to, to implementuj ten

05:11.270 --> 05:13.980
najwyższy poziom kodu dla implementacji A3.

05:14.060 --> 05:19.720
Zasadniczo zamierzamy ponownie wdrożyć wszystkie te pliki, a my będziemy głównie nalegać na pliki, które są bezpośrednio

05:19.720 --> 05:24.650
związane z trzema C wszystkimi częściami, które są bezpośrednio związane z naszym widzeniem.

05:24.680 --> 05:27.800
Wdrażamy kod linii po linii dla pozostałych.

05:27.820 --> 05:33.290
Po prostu rozbuduję kod, abyśmy mogli rozwiązać ten problem, nie uznając go za zbyt przytłaczający,

05:33.850 --> 05:36.150
abyśmy przeszli całkiem specjalny moduł.

05:36.170 --> 05:42.220
Nie tylko pracujemy w najnowocześniejszym modelu sztucznej inteligencji, ale także w czasie, gdy mówię i

05:42.230 --> 05:45.730
jestem bardzo pewny, że wdrażamy najpotężniejszą wersję A-380.

05:46.070 --> 05:47.050
Więc zróbmy to.

05:47.090 --> 05:51.740
Wróćmy do Pythona i zacznijmy to wszystko, zanim zaczniemy.

05:51.770 --> 05:54.800
Zrobimy najprostszą rzecz, którą zrobimy w tym module.

05:54.830 --> 05:56.870
Ustawianie folderu roboczego.

05:57.080 --> 06:02.660
Przejdźmy do naszej sztucznej inteligencji, to moduły folderów szablonów wybieramy najbardziej wymagające.

06:02.930 --> 06:03.830
I oto idziemy.

06:03.830 --> 06:05.070
To wszystkie nasze pliki.

06:05.240 --> 06:09.130
Zobaczmy, które z nich są bezpośrednio związane z A-3 C.

06:09.200 --> 06:11.610
Zobaczmy więc, które z nich zamierzamy zaimplementować.

06:11.690 --> 06:14.770
Linia po linii i skup się na naszej energii.

06:14.840 --> 06:16.450
Tak naprawdę istnieją dwa pliki.

06:16.490 --> 06:22.250
Ten pierwszy nie jest taki, jak ten, więc będziemy ponownie wdrażać linię po linii, ponieważ

06:22.250 --> 06:25.450
to jest najważniejsze, gdzie robimy A-3 widzieć mózgi.

06:25.550 --> 06:30.590
Najważniejszą rzeczą do zrozumienia jest to, że będziemy mieć wspólny model, który będzie

06:30.590 --> 06:34.340
miał te same dane wag dla aktora i krytyka.

06:34.370 --> 06:39.490
To część tej specjalnej wersji A-3, zobacz wspólny model z udostępnionymi danymi

06:40.130 --> 06:43.890
wagi, a następnie innego najważniejszego założyciela do wdrożenia.

06:43.910 --> 06:51.270
Linia po linii to wytresowany dziki ptak zaraz po tym, jak zrobiliśmy mózg widzów.

06:51.500 --> 06:55.940
Musimy ich wyszkolić, a my szkolimy ich w tym pociągu, który z żoną.

06:56.180 --> 07:02.720
Jest to więc dość długi kod, ale zawiera on sedno modelu A3 C, który będzie musiał

07:02.720 --> 07:08.900
odnieść się do Lassa, aby obniżyć wartość w USA, która jest ostatnia związana z

07:09.230 --> 07:14.640
przewidywaniami krytyka i ostatnią polityką, która jest ostatnia. związane z przewidywaniami atomu.

07:14.840 --> 07:20.570
Jest to całkiem nowe, ale wiesz, że to dlatego, że A-380 pracowały zasadniczo z kilkoma agentami, z

07:20.810 --> 07:23.210
których każdy miał własną kopię środowiska.

07:23.330 --> 07:28.790
Mamy również tę w pełni połączoną warstwę, która generuje wartość funkcji i zasadniczo jest to wspólna

07:28.790 --> 07:31.540
wizja tego, co dzieje się w grze.

07:31.550 --> 07:34.130
To będzie dość trudne.

07:34.220 --> 07:40.840
Więc upewnij się, że jesteś w dobrej formie i dla reszty kolegów Dobrze, wyjaśnię je szczegółowo, ale nie poświęcając

07:40.880 --> 07:45.810
im zbyt dużo czasu, uwierz mi, że chcesz zachować na to swoją energię.

07:45.830 --> 07:47.110
To będzie już dużo.

07:47.150 --> 07:55.490
Tak więc ci koledzy to mrówki ducky Y, które są ulepszeniem środowiska siłowni dzięki wszechświatowi.

07:55.490 --> 08:00.920
Zasadniczo po prostu poprawia się otoczenie sali gimnastycznej wszechświatem, co pozwala

08:00.920 --> 08:07.150
nam uzyskać optymalną obróbkę wstępną obrazów, a także znormalizować wszystkie wartości otoczenia, takie

08:07.160 --> 08:10.160
jak intensywność kolorów lub intensywność nagród.

08:10.280 --> 08:15.710
Cóż, wszystkie wartości środowiska tego pliku normalizują wszystkie te wartości, a także upewniają się, że mamy wystarczająco

08:15.800 --> 08:18.110
dużo, aby nie kontynuować przetwarzania obrazów.

08:18.170 --> 08:24.720
A jak widzicie, to jest zaczerpnięte z tego otwarcia, a ja dostaję jej stronę, na której znajduje się agent historii wszechświata.

08:24.830 --> 08:28.870
Więc nie będziemy spędzać zbyt wiele czasu na tym, że rzeczywiście zatrzymamy się tutaj.

08:28.910 --> 08:34.390
Musisz tylko zrozumieć, że udoskonaliliśmy środowisko siłowni ze wszechświatem, aby uzyskać wystarczającą ilość,

08:34.390 --> 08:36.390
aby nie przetwarzać obrazów.

08:36.440 --> 08:39.900
Reszta nie jest tak ważna, szczególnie na PC.

08:40.340 --> 08:45.190
W takim razie mamy główne P, które jest kodem, który wykona całą rzecz.

08:45.200 --> 08:50.190
Więc znasz kod, który będzie zarządzał całą sprawą, a mózg wytrenuje mózg i wypuszcza wideo.

08:50.210 --> 08:53.810
A to dlatego, że uruchomi wszystkie te kody tutaj.

08:54.350 --> 08:57.700
Więc więcej widzieliśmy, gdzie to było, może się pojawiło.

08:57.710 --> 09:00.130
Dlaczego jest specjalny optymalizator.

09:00.380 --> 09:06.240
To w zasadzie optymalizator atomu, ale dostosowany do tego wspólnego modelu, który wdrażamy.

09:06.260 --> 09:09.290
Więc wyjaśnimy cały ten kod w jednym samouczku.

09:09.290 --> 09:11.490
Potem mamy test W-dlaczego.

09:11.530 --> 09:13.610
To naprawdę ostatni test.

09:13.610 --> 09:17.410
P Dlaczego właściwie jest to plik, który zaimplementuje agenta testowego.

09:17.510 --> 09:22.440
Jest więc agent, który będzie grał bez aktualizacji modelu.

09:22.490 --> 09:24.740
Jest to całkowicie niezależne od treningu.

09:24.860 --> 09:27.460
I będziemy również rozszerzać ten kod w szczegółach.

09:27.530 --> 09:33.710
Poza tym dobrą wiadomością jest to, że będziesz miał dwa kody jeden kod, który będzie kod

09:33.710 --> 09:36.080
implementujemy w samouczkach, ale bez komentarza.

09:36.290 --> 09:40.580
I jeden z kodów, który jest jednym z folderów kodu z wszystkimi kodami, komendy to.

09:40.700 --> 09:44.060
A więc wszystkie te sześć fauli są dobrze połączone.

09:44.180 --> 09:49.520
Tak więc, jeśli czegoś nie dostrzeżesz i samouczek. Będziesz mógł przejrzeć zawartość kodu, aby zrozumieć,

09:49.640 --> 09:51.010
co się dzieje.

09:51.200 --> 09:52.130
Więc idziemy.

09:52.130 --> 09:54.500
Mam nadzieję, że jesteście podekscytowani, aby to wdrożyć.

09:54.500 --> 09:59.020
Jesteś naprawdę na szczycie góry teraz lub tuż pod szczytem, ponieważ najpierw musisz to

09:59.120 --> 10:01.160
zrozumieć, ale dotrzesz do celu.

10:01.190 --> 10:02.910
Więc weź dobry oddech.

10:03.020 --> 10:05.690
I oto idziemy z bardzo ekscytującą podróżą.

10:05.720 --> 10:06.870
Do tego czasu ciesz się.
