WEBVTT

00:01.050 --> 00:03.770
Cześć i witam z powrotem na kursie na temat sztucznej inteligencji.

00:03.810 --> 00:08.280
A dzisiaj mówimy o Mark procesów decyzyjnych lub M. RE..

00:08.760 --> 00:11.120
Zobaczmy, co mamy dzisiaj.

00:11.430 --> 00:14.060
Ostatnim razem zatrzymaliśmy się na koncepcji mapy.

00:14.070 --> 00:19.980
Ponieważ obliczyliśmy wartości na podstawie równania Belmana, możemy wyprowadzić tę mapę dla naszego agenta w

00:20.010 --> 00:21.060
tym labiryncie.

00:21.240 --> 00:27.570
Zasadniczo oznacza to, gdziekolwiek ange się zaczyna agent, powiedzmy, że zaczyna się tam.

00:27.570 --> 00:33.270
Dokładnie wie, jakie kroki podjąć, aby dostać się do mety, więc po prostu idzie w górę.

00:33.270 --> 00:35.040
Dobrze i gotowe.

00:35.070 --> 00:37.540
A więc pytanie brzmi: to.

00:37.590 --> 00:39.780
Czy to naprawdę takie proste?

00:39.780 --> 00:44.690
Czy uczenie się wzmacniania jest naprawdę tym, co znacie z braku lepszego nudnego słowa.

00:44.790 --> 00:46.420
To jest tak.

00:46.440 --> 00:50.830
Gdy już masz matematykę, to wszystko, co musisz zrobić, to zrobić to po prostu pełne.

00:51.090 --> 00:55.460
W rzeczywistości nie jest to takie proste.

00:55.500 --> 01:01.020
I to jest dobre, ponieważ sprawia, że kurs jest dla nas bardziej interesujący i że możemy rozwiązać

01:01.020 --> 01:02.610
znacznie bardziej złożone problemy.

01:02.610 --> 01:05.460
I tu właśnie nadchodzi znak procesu.

01:05.490 --> 01:07.770
Ale najpierw porozmawiamy o dwóch rzeczach.

01:07.760 --> 01:11.450
W grę wchodzi wyszukiwanie deterministyczne a wyszukiwanie niedeterministyczne.

01:11.700 --> 01:14.750
Pomówmy więc o pojęciu deterministycznego wyszukiwania.

01:14.820 --> 01:21.570
To jest nasz agent w labiryncie, a deterministyczne wyszukiwanie oznacza, że jeśli agent zdecyduje się pójść w

01:21.570 --> 01:26.980
górę, to co się stanie to 100 procentowe prawdopodobieństwo, że się podniesie.

01:27.030 --> 01:28.700
Dokładnie to się stanie.

01:28.700 --> 01:29.740
Nie ma innych opcji.

01:29.740 --> 01:33.690
Raz, gdy powiesz, idź w górę lub kliknij strzałkę w górę, a ona się podniesie.

01:33.690 --> 01:35.070
Nie ma innych opcji.

01:35.250 --> 01:41.950
Z drugiej strony, niedeterministyczne poszukiwania mają miejsce, gdy nasz agent mówi, że chce iść w górę.

01:42.130 --> 01:44.430
W rzeczywistości są kilka opcji.

01:44.460 --> 01:48.820
Na przykład mogą być trzy opcje, a my będziemy szukać przykładu, gdzie są

01:48.830 --> 01:53.400
trzy opcje, ale nie musi to być granica do trzech, zanim będzie różna,

01:53.400 --> 01:59.640
w zależności od problemu losowość może być inna, ale w naszym przypadku może to być trzy opcje, z 80-procentowym

01:59.640 --> 02:01.640
prawdopodobieństwem, że pójdzie w górę.

02:01.860 --> 02:07.500
Ale z 10-procentową szansą, kiedy chce się podnieść, w rzeczywistości pójdzie w lewo tylko dlatego.

02:07.500 --> 02:11.080
Ponieważ tak działa środowisko, w którym żyje.

02:11.430 --> 02:14.840
A przy kolejnej kontroli w 10 procentach szansa, że rzeczywiście pójdzie dobrze.

02:14.880 --> 02:17.770
I w tym przypadku wpadnie do paleniska.

02:17.850 --> 02:20.730
Tak to wszystko działa.

02:20.760 --> 02:26.760
Jest to przykład niedeterministycznego, pewnego przeszukiwania procesu stochastycznego, a celem jest stworzenie

02:26.760 --> 02:35.370
bardziej realistycznego modelu tego, co może się wydarzyć w prawdziwym świecie w prawdziwym świecie, ponieważ bardzo rzadko pojawiają

02:35.370 --> 02:40.560
się takie sytuacje kiedy coś robisz i dzieje się dokładnie

02:40.560 --> 02:41.390
tak.

02:41.520 --> 02:46.560
Nawet jeśli myślisz o tym w kategoriach gier, powiedzmy, że masz agenta grającego Pac-Mana.

02:46.740 --> 02:51.270
Nie zawsze jest tak, że jeśli stoi na placu, idzie w górę.

02:51.360 --> 02:54.260
Za każdym razem uzyska taki sam dokładny wynik.

02:54.460 --> 02:59.820
Cóż, on rzeczywiście pójdzie w górę, ale może tak być w jednym przypadku nie zostaniesz zjedzony przez ducha w obu przypadkach.

02:59.820 --> 03:01.570
Zostanie zjedzony przez ducha.

03:01.590 --> 03:05.970
Jak widać, jest w tym pewna losowość, ponieważ zależy to od tego, jak poruszają się duchy i nie zawsze poruszają

03:05.970 --> 03:07.350
się w ten sam sposób.

03:07.350 --> 03:09.370
Nie zawsze zaczynają się w tych samych lokalizacjach.

03:09.510 --> 03:16.140
Więc bardzo logiczne jest bardzo uczciwe, że istnieje przypadkowość, jest coś, co nie jest pod kontrolą agenta i to

03:16.140 --> 03:21.810
jest po prostu sposób, abyśmy to przedstawili, abyśmy mogli dowiedzieć się, jak sobie z tym

03:21.810 --> 03:27.240
poradzić i jak wpływa to na równanie Belmana, w jaki sposób wpływa ono na cały

03:27.240 --> 03:29.010
proces uczenia się zbrojenia.

03:29.070 --> 03:33.780
Ale w tym samym czasie przypadkowość nie ogranicza się do tego, że jeśli pójdziesz w górę, masz 10 procent szans na to, że

03:33.780 --> 03:38.400
pójdziesz w prawo lub na prawo i po prostu pójdziesz w lewo, lub jeśli zejdziesz do 10 procent szansy pójdziesz w prawo

03:38.400 --> 03:42.840
lub w lewo, albo ty. W porządku, jest 10 procent szans, że subtelność w górę lub w dół ogranicza się

03:42.840 --> 03:45.550
do miejsca, w którym skończysz, czasami możesz mieć problem, który jest dokładnie.

03:45.570 --> 03:47.390
Czasami możliwości mogą być inne.

03:47.430 --> 03:52.990
Czasami przypadkowość może sprowadzać się do czegoś innego, co można by sprowadzić tak jak ten przykład.

03:52.980 --> 03:58.890
Duchy Pacmana jedzące cię nie jedzą lub może sprowadzają się do czegoś innego.

03:58.890 --> 04:05.550
Na przykład, tak jak tam, jest tak, jakby agent grał Dooma, a potem jest coś takiego jak potwór,

04:05.700 --> 04:11.040
który ma go zastrzelić w jednym przypadku, a w innych jest prawdopodobieństwo, że wszyscy

04:11.060 --> 04:14.380
powinni zostać postrzeleni, a my nie zostaniemy zastrzeleni.

04:14.550 --> 04:19.710
A więc coś, co jest poza kontrolą agentów, jest czymś, czego nie potrafię przewidzieć.

04:19.710 --> 04:25.740
To właśnie tutaj modelujemy w poszukiwaniu niedeterministycznym i tutaj bezpośrednio podeszliśmy do dwóch nowych

04:25.950 --> 04:32.780
koncepcji jako znaku procesów i / lub znaku procesu i znaku znacznika procesu decyzyjnego, więc spójrzmy

04:32.790 --> 04:34.130
na nie.

04:34.150 --> 04:39.080
I wiesz, jak bardzo nie lubię stawiać definicji i mnóstwa tekstu na boku.

04:39.090 --> 04:42.280
Ale w tym przypadku musimy przejść przez to.

04:42.280 --> 04:46.220
Spójrzmy więc, jak proces stochastyczny ma znak własności.

04:46.240 --> 04:51.750
Jeśli warunkowy rozkład prawdopodobieństwa przyszłych stanów procesu jest warunkowy, a stan zarówno

04:51.750 --> 04:58.200
przeszłych, jak i obecnych zależy tylko od obecnego stanu, nie od sekwencji zdarzeń, które go poprzedzały.

04:58.230 --> 05:00.410
Proces z tą właściwością nazywany jest znacznikiem.

05:01.040 --> 05:06.470
Bardzo złożona definicja i to, że wprowadzasz trochę, nie tylko jest sprzeczne z samym sobą, ale wydaje się być

05:06.470 --> 05:11.110
sprzeczne z samym sobą, więc tutaj jest warunkiem pozytywnej obecności, która zależy od twojego punktu

05:11.110 --> 05:11.450
widzenia.

05:11.480 --> 05:14.450
Ale jednocześnie zależy tylko od obecnego stanu.

05:14.510 --> 05:17.510
Więc nie wpadaj w to zbyt mocno.

05:17.670 --> 05:23.050
Zrobię to w prosty sposób, więc cechą właściwości jest twoja przyszłość.

05:23.060 --> 05:25.310
Więc nie tylko twój wybór, ale cała sprawa.

05:25.310 --> 05:31.640
Twój wybór i środowisko, które podoba się tylko wynikom wszystkich działań, które podejmiesz w tym środowisku, będzie zależało

05:31.640 --> 05:33.900
tylko od tego, gdzie teraz jesteś.

05:33.920 --> 05:35.770
To nie zależy od tego, jak się tam dostałeś.

05:36.110 --> 05:36.560
I to wszystko.

05:36.560 --> 05:40.630
Jest to kwestia publiczna, a proces, który ma tę właściwość, nazywa się procesem rynkowym.

05:40.880 --> 05:47.570
Tak więc, aby umieścić go w przykładzie, więc jeśli twój agent jest tutaj i jeśli pójdzie, jeśli zdecyduje się pójść, może

05:47.570 --> 05:48.030
odejść.

05:48.040 --> 05:52.940
On w naszym przypadku w naszym niedeterministycznym przykładzie wyszukiwania może faktycznie pójść w lewo i prawo.

05:53.000 --> 05:53.680
W porządku.

05:53.690 --> 05:58.940
Dzieje się tak dlatego, że mamy kij ten miasto w naszym środowisku, mamy przypadkowość wewnątrz

05:58.940 --> 05:59.710
naszego środowiska.

05:59.810 --> 06:01.820
Tak więc każda z tych rzeczy może się zdarzyć.

06:01.820 --> 06:07.250
Ale kluczem jest to, że jest to oznaką procesu, ponieważ nie obchodzi nas, jak się tu dostałeś.

06:07.250 --> 06:10.700
Mógł pochodzić z góry, tutaj skończył, mógł pochodzić z lewej strony i tu mógłbyś

06:10.700 --> 06:12.370
przyjść od dołu i tu dotrzeć.

06:12.380 --> 06:16.640
Mógłby grać tutaj przeniósł się jak 100 000 razy, a potem przyszedł.

06:16.700 --> 06:22.490
Nieważne, co się wydarzyło wcześniej, tylko to, w jakim jest stanie, w jakim stanie jest teraz.

06:22.520 --> 06:31.160
Tak więc prawdopodobieństwo pójścia w lewo, w prawo lub w górę, będzie zawsze takie samo, jeśli teraz jest w

06:31.160 --> 06:32.250
tym stanie.

06:32.690 --> 06:37.530
Tak więc po prostu mówię, że nie ma znaczenia, co się stało, zanim tu jesteśmy.

06:37.640 --> 06:39.150
To jest stan, w którym się znajdujesz.

06:39.200 --> 06:42.320
I nie zapominaj, że stan nie oznacza tylko tego, gdzie on stoi.

06:42.320 --> 06:48.140
Stan jest stanem całego agenta w środowisku, tak jak potwory z prawej strony lub potwory po lewej

06:48.140 --> 06:53.030
lub wiesz, że duch pochodzi z góry lub z dołu, niezależnie od tego, w

06:53.090 --> 06:54.530
jakim jesteś stanie .

06:54.560 --> 06:58.460
Nie ważne jak się tam dostałeś, nie ma znaczenia jak i jak to się stało, że jesteś w tym

06:58.460 --> 06:58.790
stanie.

06:58.790 --> 07:02.990
To, co stanie się w przyszłości, zależy tylko od tego, w jakim jesteś stanie.

07:02.990 --> 07:07.440
Plus działania, które je wykonasz plus oczywiście losowość, która jest na nie nałożona.

07:07.460 --> 07:14.280
Jest to więc znak procesu i procesu decyzji znacznika lub procesu decyzyjnego MVP lub znacznika.

07:14.390 --> 07:20.390
Zapewnienie ram matematycznych do modelowania podejmowania decyzji w sytuacjach, w których wyniki są częściowo losowe

07:20.420 --> 07:23.430
i częściowo pod kontrolą nad podejmowaniem decyzji.

07:23.570 --> 07:29.120
Tak ważne, aby zrozumieć, że znak procesów decyzyjnych procesu decyzyjnego jest inny, a inny

07:29.150 --> 07:32.210
cały proces oznaczania procesu jako oznaczenia procesu.

07:32.340 --> 07:34.810
Są tak jak ramy matematyczne.

07:34.970 --> 07:39.080
Ale jednocześnie uważałem, że ważne jest dla nas zrozumienie, co jest

07:39.170 --> 07:45.140
oznaką procesu, ponieważ myślę, że nadal pomaga to w zrozumieniu markowania procesu decyzyjnego, a więc jest oznaką

07:45.200 --> 07:46.130
procesu decyzyjnego.

07:46.230 --> 07:50.950
Właśnie o tym rozmawialiśmy do tej pory, aby agent mieszkał w tym środowisku, w którym

07:51.290 --> 07:56.570
wcześniej kontrolował go tak jak on i miał pełną kontrolę nad tym, co się dzieje, ale teraz ma

07:56.570 --> 07:57.530
nieco mniej kontroli.

07:57.590 --> 08:00.270
Może zdecydować się pójść w górę, ale tak naprawdę wie.

08:00.290 --> 08:05.570
OK, więc jeśli pójdę na górę, mam szansę na małpę. Podejdę do tej próby i szanse się zmniejszą, a szansa

08:05.560 --> 08:06.170
pójdzie dobrze.

08:06.170 --> 08:08.930
Więc nie wszystko jest w pełni pod jego kontrolą.

08:08.930 --> 08:13.280
W tym środowisku jest pewna losowość i właśnie to jest znak procesu decyzyjnego

08:13.280 --> 08:18.830
i proces decyzyjny Markowa, który jest ramą, której użyje agent, aby zrozumieć, co robić w tym

08:18.830 --> 08:19.400
środowisku.

08:19.400 --> 08:22.400
Mamy więc pewną losowość jakiegoś toksycznego środowiska.

08:22.550 --> 08:27.000
A teraz agent musi wybrać na przykład powinien iść w dół w lewo lub w prawo.

08:27.370 --> 08:28.530
Musi podjąć tę decyzję.

08:28.520 --> 08:29.820
On nie wie, co robić.

08:30.140 --> 08:36.200
Aby ta decyzja mogła zostać zastosowana, struktura będzie korzystała ze znaku procesu

08:36.200 --> 08:40.960
decyzyjnego, aby podjąć decyzję, co się wydarzy, dokąd zmierza.

08:40.970 --> 08:47.600
Zasadniczo to środowisko, które stwarza ten problem, jest odnoszone do znaku procesu decyzyjnego, więc jest to środowisko, z

08:47.600 --> 08:52.820
którego korzysta agent w tym samym czasie, gdy mówi się o środowisku, że agent

08:52.820 --> 08:55.810
działa w środowisku procesu decyzyjnego na rynku.

08:56.280 --> 09:01.190
Tak więc w zasadzie mamy dwie koncepcje, które mamy na oku procesu, to sposób, w jaki

09:01.190 --> 09:03.740
to środowisko jest zaprojektowane, aby PA działała.

09:03.770 --> 09:07.020
To, co dzieje się z miejsca, w którym teraz jesteś, nie zależy od przeszłości.

09:07.130 --> 09:11.240
I w tym samym czasie mamy znak procesu decyzyjnego, który będzie wykorzystywany

09:11.240 --> 09:13.630
przez agenta do rozwiązania tego środowiska.

09:13.970 --> 09:18.830
Dobra wiadomość jest taka, że znakiem procesu decyzyjnego lub tej struktury, o której

09:18.830 --> 09:24.730
mówimy, jest w istocie dodanie do naszego równania z równania Belmana równania Belmana, ale nieco bardziej wyrafinowanego.

09:24.740 --> 09:26.960
Więc spójrzmy na to.

09:27.050 --> 09:28.910
To jest nasze równanie Belmana do tej pory.

09:29.030 --> 09:31.030
To maksimum wszystkich możliwych działań.

09:31.040 --> 09:35.150
Tak więc wartość bycia w stanie to maksimum wszystkich możliwych działań, które można podjąć z

09:35.150 --> 09:35.990
tego stanu.

09:36.260 --> 09:41.930
Maksymalne jest brane z nagrody, którą otrzymasz, biorąc tę akcję w tym stanie plus współczynnik

09:41.930 --> 09:45.410
dyskonta razy wartość następnego stanu, który jest jako główny.

09:45.410 --> 09:47.390
Tak to było do tej pory.

09:47.400 --> 09:52.550
Teraz, ponieważ mamy pewną losowość w całym naszym procesie, ta część się zmieni, ponieważ tak naprawdę

09:52.550 --> 09:57.620
nie wiemy, który stan się skończy i nie wiemy, co będzie skazane, czy będzie, jeśli

09:57.630 --> 10:03.680
będziemy podnosić się, to będzie w górę lub w lewo będzie mieć rację, więc musimy umieścić to z oczekiwaną

10:03.680 --> 10:04.960
wartością następnej daty.

10:04.970 --> 10:08.810
Tak więc zamierzamy to zastąpić, abyśmy mogli znaleźć się w trzech możliwych stanach.

10:08.810 --> 10:15.480
I tak zastąpimy to pewną wartością, że stan ma wartość jako jeden główny.

10:15.520 --> 10:18.190
Że ma widok na prime do premiery.

10:18.470 --> 10:22.490
I ten stan ma wartość nas trzech Bryne.

10:22.640 --> 10:28.790
Więc teraz zamierzamy pomnożyć stan, do którego faktycznie zamierzamy wejść przez 80 procent, ponieważ w

10:28.790 --> 10:33.770
ten sposób prawdopodobieństwo osiągnięcia tego stanu plus prawdopodobieństwo osiągnięcia tego stanu wynosi

10:33.770 --> 10:39.800
10 procent plus ludzie wchodzący w stan Więc to jest tylko nasza oczekiwana wartość, więc

10:39.800 --> 10:46.880
jeśli ze statystyk, jeśli przyjmiemy oczekiwaną wartość wchodzenia w stan, w który wejdziemy, to trochę jak średnia. Jaka

10:47.060 --> 10:52.040
jest średnia z tego, co otrzymamy, a następnie zastąpimy ją tutaj.

10:52.040 --> 10:56.210
Wtedy dostajemy tę agresję i bardzo szybko skacze, ponieważ jest duża, ale jeśli spojrzysz

10:56.210 --> 10:59.930
na nią uważnie, zobaczysz to samo, co powiedział Max tutaj, tutaj Max.

10:59.960 --> 11:06.340
Potem masz r S i A R S i oni mają gamma, w której masz gamma.

11:06.410 --> 11:08.600
I w końcu tutaj masz v.

11:08.630 --> 11:13.640
Więc wiedziałeś dokładnie, że to deterministyczne wyszukiwanie, wiesz, do których stanów się dostaniesz.

11:13.640 --> 11:16.120
Teraz nie wiesz, do jakiego stanu wejdziesz, odkąd przyjmiesz V.

11:16.120 --> 11:23.300
Przyjmujesz oczekiwaną wartość stanu, w który wejdziesz, lub przyszłego stanu, lub po prostu w prostszych słowach, biorąc

11:23.300 --> 11:25.920
pod uwagę średnią tego, co dostaniesz.

11:26.060 --> 11:32.900
Więc wiesz, jakby to było dla 30 plus 3 procent szans, będzie to tak jak dzielenie przez Plus trzech w zasadzie.

11:32.900 --> 11:37.130
Ale w tym przypadku nie jest to dokładnie tak, jak średnia.

11:37.130 --> 11:40.410
Jest to średnia ważona z powodu prawdopodobieństw tutaj.

11:40.430 --> 11:45.980
Tak więc masz prawdopodobieństwo, że jesteś na tym etapie, aby podjąć tę akcję dostania się do stanu jako najwyższego

11:46.040 --> 11:50.630
czasu, wartości s prime, a niektóre do przekroczenia wszystkich tych liczb pierwszych, które możesz wnieść do

11:50.630 --> 11:51.830
tego, kim jesteśmy.

11:51.830 --> 11:54.690
Więc dokładnie to, co mieliśmy trzy tutaj jeden dwa trzy.

11:54.890 --> 11:57.330
Dodaj je pomnożyć, dodaj je.

11:57.330 --> 11:58.040
To samo tutaj.

11:58.040 --> 11:58.820
Raz Dwa Trzy.

11:58.820 --> 12:01.660
Pomnóż je przez prawdopodobieństwo i dodaj je.

12:02.090 --> 12:05.180
I to jest twoje nowe równanie Belmana.

12:05.180 --> 12:06.440
Gratulacje.

12:06.470 --> 12:08.990
Właśnie z tym będziemy pracować.

12:09.140 --> 12:15.590
I to jest struktura, która jest wykorzystywana w procesach decyzyjnych, więc jest to struktura, która

12:15.590 --> 12:16.490
rozwiązuje to.

12:16.620 --> 12:22.670
Agenci używali rozwiązania tego całego stochastycznego niedeterministycznego problemu wyszukiwania, w którym zdarzają się przypadkowe

12:22.670 --> 12:25.460
zdarzenia, których nie mogą kontrolować.

12:25.460 --> 12:26.920
Jest to o wiele bardziej skomplikowane.

12:26.930 --> 12:30.150
Ale jak widać, powoli się do tego zmobilizowaliśmy.

12:30.290 --> 12:33.120
Teraz już wiemy o tym, o czym wiemy.

12:33.130 --> 12:35.090
Martwi się tym.

12:35.090 --> 12:36.160
Wiemy o tym.

12:36.170 --> 12:36.710
Wiemy, jakie one są.

12:36.710 --> 12:42.500
Więc wszystko, co zrobiliśmy, właśnie wprowadziliśmy tę część tutaj, ponieważ istnieją prawdopodobieństwa

12:42.920 --> 12:49.000
związane z działaniem lub konsekwencje twojego działania na nieokreśloność są oparte na prawdopodobieństwach.

12:49.220 --> 12:50.600
I tak idziemy.

12:50.600 --> 12:58.280
W ten sposób działa marker procesu decyzyjnego i leżące u jego podstaw równanie.

12:58.330 --> 13:04.630
Po raz kolejny jest to coś, co bardziej przypomina rzeczywiste problemy rzeczywiste lub Sinatras, a

13:04.670 --> 13:08.690
nawet scenariusze gry, ponieważ nie wszystko jest proste.

13:08.690 --> 13:15.880
Istnieje pewna losowość wszystkich zaangażowanych i nie zawsze będzie podejmować działania w pewnym stanie zawsze będzie Nawal nie

13:15.870 --> 13:18.810
zawsze doprowadzi do tego samego wyniku.

13:18.890 --> 13:23.150
I tak będziemy mieli do czynienia z przyszłością, co sprawi, że sprawy

13:23.150 --> 13:24.310
będą bardziej interesujące.

13:24.380 --> 13:29.290
Mam więc nadzieję, że jesteście podekscytowani i podekscytowani, aby zobaczyć, co będzie dalej.

13:29.690 --> 13:35.870
A w międzyczasie znalazłem naprawdę fajną gazetę, na którą możesz teraz rzucić okiem.

13:35.870 --> 13:37.460
To bardzo stosowny papier.

13:37.460 --> 13:40.150
Ten naprawdę jest naprawdę ciekawy do przeczytania.

13:40.160 --> 13:46.810
Nazywa się to przeglądem zastosowań Mark procesów procesów decyzyjnych i został napisany przez biały w

13:46.820 --> 13:47.970
1993 roku.

13:47.990 --> 13:56.000
Jest link i Ill pokazują przykłady miejsc, w których procesy decyzyjne Markowa są używane do modelowania prawdziwych

13:56.000 --> 13:59.560
Sinatras. Myślę, że byłem tym bardzo podekscytowany.

13:59.560 --> 14:03.880
Byłem pod wrażeniem kilku przykładów zbioru populacji na przykład.

14:03.880 --> 14:09.290
Powiedzmy, że masz trochę ryb i wiesz, jaka jest populacja ryb, aby zdecydować, ile

14:09.290 --> 14:12.910
ryb możemy wyłowić w tym roku i jakie.

14:13.250 --> 14:14.330
To jest twój obecny stan.

14:14.330 --> 14:17.220
To jest akcja, którą robisz. Ilu możemy zastrzelić w tym roku.

14:17.230 --> 14:20.420
Więc jakie są możliwe wyniki tego.

14:20.540 --> 14:22.100
Ile ryb będziemy mieli w przyszłym roku.

14:22.160 --> 14:25.210
Ile ryb będziemy mieli rok później i rok później i tak dalej.

14:25.250 --> 14:30.230
I to nie jest deterministyczne, ponieważ nie jest tak, że jeśli weźmiesz to w godzinę, a 90 procent populacji

14:30.230 --> 14:34.640
w przyszłym roku będziesz wiedział, że wrócisz do 100 procent, nie jest to dokładnie kazanie.

14:34.640 --> 14:39.590
W grę wchodzą pewne czynniki losowe, które są poza naszą kontrolą i dlatego musimy

14:39.760 --> 14:43.640
zrozumieć, co się wydarzy, musimy modelować, co się wydarzy, czyli

14:43.860 --> 14:46.060
gdzie decyzja rynkowa przetwarza rolnictwo.

14:46.070 --> 14:50.250
Jest taki przykład jak zbieranie plonów, ile plonów zbieramy, ile pieniędzy

14:50.280 --> 14:51.440
nie zbieramy.

14:51.470 --> 14:58.190
Kolejny, który przyjrzałem się finansom i inwestycjom, jak firma ubezpieczeniowa, musi zdecydować, ile ze swoich

14:58.190 --> 15:04.990
funduszy zainwestuje w dowolny dzień, rok lub jakiś okres czasu i istnieją pewne czynniki, nad

15:05.020 --> 15:06.490
którymi ma kontrolę.

15:06.490 --> 15:11.260
Na przykład znasz ruchy rynkowe, nie wiesz, co może się zdarzyć, więc trzeba to

15:11.260 --> 15:12.070
jakoś wymodelować.

15:12.110 --> 15:14.350
Znak procesów decyzyjnych wykorzystanych do tego.

15:14.350 --> 15:16.890
Tutaj możesz zobaczyć wiele przykładów.

15:16.900 --> 15:20.340
I to jest liczba przykładów, które myślę dla każdego.

15:20.650 --> 15:28.030
A więc wiesz nawet sportowe przykłady sportów i epidemii oraz przeglądów szkód komunikacyjnych i napraw

15:28.090 --> 15:31.030
samochodowych, a także bardzo interesujące.

15:31.030 --> 15:31.900
Spójrz na to.

15:31.930 --> 15:40.390
Tylko po to, by dać ci zrozumienie hej, to nie jest po prostu wymyślony materiał hipotetyczny typu

15:40.390 --> 15:41.130
Matrycy.

15:41.140 --> 15:45.580
W rzeczywistości jest to scenariusz z prawdziwego świata, więc pozwolę ci lepiej zrozumieć

15:45.580 --> 15:50.410
i to jest to, o czym rozmawialiśmy w teledysku do tych wyników lub opisu kursu,

15:50.410 --> 15:55.900
który zainspirujemy Ciebie i twoja intuicja, by dać ci pomysły jak używać sztucznej inteligencji w prawdziwym życiu.

15:55.900 --> 15:57.820
To jest twoja szansa.

15:57.820 --> 15:59.790
Popatrz na ten artykuł, aby zrozumieć.

15:59.900 --> 16:02.890
OK, więc zamierzamy postępować z marką procesu decyzyjnego.

16:02.890 --> 16:07.210
To naprawdę fajne, jak oni wyglądają w prawdziwym życiu, a to może wywołać

16:07.210 --> 16:13.300
dla ciebie kilka pomysłów, jak możesz zastosować w przyszłości, aby uczynić świat lepszym miejscem i bylibyśmy bardzo szczęśliwi z tego

16:13.300 --> 16:13.650
powodu.

16:13.690 --> 16:18.560
Będziemy szczęśliwi, jeśli wykorzystasz to, czego nauczysz się na tym kursie, aby uczynić świat lepszym.

16:18.730 --> 16:20.050
Cóż za fantastyczny.

16:20.380 --> 16:23.170
W związku z tym mam nadzieję, że podobał się wam dzisiejszy tutorial.

16:23.170 --> 16:24.540
Nie mogę się doczekać Do zobaczenia następnym razem.

16:24.610 --> 16:26.420
A do tego czasu ciesz się AI.
