WEBVTT

00:01.110 --> 00:04.770
Witam z powrotem na kursie na temat sztucznej inteligencji.

00:04.770 --> 00:09.420
Dzisiaj omówimy plan ataku dla sekcji, o której mówimy, na temat nauki o zabijaniu.

00:09.450 --> 00:15.000
Mamy też kilka samouczków, więc myślę, że dobrze jest, abyśmy

00:15.000 --> 00:20.580
szybko je przejrzeli, aby zrozumieć, czego się spodziewać w nadchodzących filmach.

00:20.580 --> 00:21.650
Więc zaczynamy.

00:22.140 --> 00:22.560
W porządku.

00:22.560 --> 00:25.230
Czego dowiemy się w tej sekcji.

00:25.230 --> 00:31.650
Najpierw porozmawiamy o tym, czym właściwie jest uczenie się wzmacniania i czym jest filozofia stojąca za

00:31.690 --> 00:37.890
uczeniem się wzmacniającym i jak faktycznie można postrzegać uczenie się wzmacniania w prawdziwym życiu

00:37.890 --> 00:44.540
i jak odnosi się do rzeczy, które obserwujemy w rzeczywistości, to rzeczy, które sami robimy sami. .

00:44.790 --> 00:51.630
Nie mówią o równaniu bellmanów, o bardzo fundamentalnej koncepcji leżącej u podstaw wszystkiego lub wielu rzeczy, które się

00:51.630 --> 00:56.580
dzieją, oraz o uczeniu się o wzmocnieniu, szczególnie w przestrzeni uczenia CULE i

00:56.940 --> 01:01.700
tego, o czym będziemy dyskutować w tej części kursu. następujące sekcje.

01:01.800 --> 01:09.280
Następnie porozmawiamy o planie i planie, w którym i sztucznej inteligencji surowego żelaza pojawi się w

01:09.300 --> 01:15.990
celu poruszania się w środowiskach, zobaczymy, co to razem, że łączy się bardzo szybko, ale

01:15.990 --> 01:17.270
całkiem interesujące.

01:17.720 --> 01:22.890
Tam porozmawiamy o rynku procesów decyzyjnych, a twoja koncepcja wprowadzi zupełnie

01:22.890 --> 01:31.620
nową koncepcję, która powoli doda jeszcze warstwę wyrafinowania do naszego równania Belmana, do całej naszej wiedzy o uczeniu się naszych

01:31.800 --> 01:37.070
koncepcji uczenia CULE i tak się dzieje. ta sekcja jest skonstruowana tak,

01:37.290 --> 01:43.080
że wprowadzamy równanie Bollmanna w bardzo uproszczoną formę, a następnie powoli w trakcie

01:43.260 --> 01:48.550
samouczków dodajemy do niego warstwy wyrafinowania, aby dostać się do wersji ostatecznej.

01:48.690 --> 01:53.880
To jest nasz wyznaczony cel pod względem Hillary, ale dotrzemy tam powoli.

01:54.000 --> 01:58.830
Abyśmy mieli wystarczająco dużo czasu, aby przetworzyć wszystkie te informacje i pozwolić im się ustatkować.

01:58.890 --> 02:05.400
A ocena prozy dysydenckiej jest dodatkową warstwą wyrafinowania w stosunku do tego, o czym rozmawialiśmy lub

02:05.400 --> 02:11.220
co będziemy mieli lub omawiana przez niego, wtedy będzie mowa o politykach a planach.

02:11.220 --> 02:13.830
Kolejny interesujący Tauriel, wszystkie są interesujące.

02:13.830 --> 02:19.590
Kolejny szybki samouczek na temat tego, jak polityka różni się od planów i jakie są

02:19.590 --> 02:25.980
różnice i są to terminy, które prawdopodobnie usłyszysz lub przeczytasz w literaturze, jeśli zamierzasz zagłębić się w to,

02:25.980 --> 02:29.980
aby uzyskać dodatkowe informacje na temat uczenia się o wzmocnieniu.

02:29.980 --> 02:34.590
Wszyscy oni mówią o dodaniu kary za życie do naszych środowisk.

02:34.770 --> 02:41.850
I to jest inny sposób na dodanie złożoności do środowisk, w których nasi agenci

02:41.850 --> 02:43.340
będą działać.

02:43.370 --> 02:48.780
Wszyscy mówią o intuicji, która polega na ciągłym uczeniu się, aż do tego tutoriala, będziemy

02:48.780 --> 02:50.690
mówić o wartościach stanów.

02:50.790 --> 02:57.300
A potem w końcu przejdziemy do mówienia o wartościach lub działaniach lub wartościach kostki,

02:57.300 --> 02:59.880
a następnie wprowadzimy różnicę czasową.

02:59.910 --> 03:06.690
To jest samouczek, w którym wszystko, czego się nauczyliśmy, zbierze się, aby wyjaśnić, jak

03:06.690 --> 03:13.930
dokładnie agenci lub sztuczne sztuczna inteligencja dowiadują się, jak aktualizuje swoje wartości poprzez cały iteracyjny

03:14.090 --> 03:16.420
proces, przez który przechodzi.

03:16.830 --> 03:23.100
I na koniec przyjrzymy się widocznej nauce, więc weźmiemy wszystko, czego się nauczymy, i

03:23.100 --> 03:29.550
patrzymy na to, co dzieje się na naszych oczach, i obserwujemy, jak sztuczna inteligencja faktycznie

03:29.730 --> 03:35.870
wykonuje CULE i Czy wszystkie rzeczy, które zamierzamy omówić na poziomie intuicyjnym, faktycznie

03:35.880 --> 03:42.600
wykonają się w praktyce, a to pomoże nam jeszcze lepiej zrozumieć tę wiedzę, którą zamierzamy ujawnić

03:42.810 --> 03:44.530
w tej sekcji.

03:44.550 --> 03:47.460
Mam nadzieję, że jesteś bardzo podekscytowany nadchodzącymi tutorialami.

03:47.460 --> 03:48.800
Zdecydowanie jestem.

03:48.810 --> 03:55.380
I tu pojawiają się bardzo interesujące slajdy, a co ważniejsze, same koncepcje są bardzo ciekawe i

03:55.380 --> 03:59.540
jestem pewien, że będziesz się nimi cieszył bardzo często.

03:59.760 --> 04:01.410
I nie mogę się doczekać, aby zobaczyć cię następnym razem.

04:01.410 --> 04:03.080
Do tego czasu ciesz się AI.