WEBVTT

00:01.050 --> 00:03.770
Halo dan selamat datang kembali ke kursus tentang kecerdasan buatan.

00:03.810 --> 00:08.280
Dan hari ini kita berbicara tentang Markus proses pengambilan keputusan atau M. D ..

00:08.760 --> 00:11.120
Mari kita lihat apa yang kita miliki hari ini.

00:11.430 --> 00:14.060
Jadi terakhir kali kami berhenti pada konsep peta.

00:14.070 --> 00:19.980
Jadi karena kami telah menghitung nilai berdasarkan persamaan Belman, kami dapat menurunkan peta ini untuk agen kami

00:20.010 --> 00:21.060
di labirin ini.

00:21.240 --> 00:27.570
Dan pada dasarnya apa artinya itu di mana pun agen mulai katakanlah itu dimulai di sana.

00:27.570 --> 00:33.270
Ia tahu persis langkah mana yang harus diambil untuk sampai ke garis finish sehingga hanya naik ke kanan.

00:33.270 --> 00:35.040
Benar dan dilakukan.

00:35.070 --> 00:37.540
Jadi pertanyaannya di sini adalah itu.

00:37.590 --> 00:39.780
Apakah sesederhana itu.

00:39.780 --> 00:44.690
Apakah penguatan pembelajaran benar-benar Anda ketahui karena tidak ada kata membosankan yang lebih baik.

00:44.790 --> 00:46.420
Itu ya.

00:46.440 --> 00:50.830
Setelah Anda memiliki matematika itu semua yang harus Anda lakukan adalah Anda telah melakukannya hanya dengan mereka.

00:51.090 --> 00:55.460
Kenyataannya adalah itu tidak sesederhana itu.

00:55.500 --> 01:01.020
Dan itu hal yang baik karena membuat kursus ini lebih menarik bagi kami dan kami benar-benar dapat memecahkan

01:01.020 --> 01:02.610
masalah yang jauh lebih kompleks.

01:02.610 --> 01:05.460
Jadi di sinilah tanda proses akan datang.

01:05.490 --> 01:07.770
Tapi pertama-tama kita akan membicarakan dua hal.

01:07.760 --> 01:11.450
Kami masuk ke dalamnya pencarian deterministik versus pencarian non-deterministik.

01:11.700 --> 01:14.750
Jadi mari kita bicara tentang konsep pencarian deterministik.

01:14.820 --> 01:21.570
Ini adalah agen kami di labirin dan pencarian deterministik berarti bahwa jika agen memutuskan untuk

01:21.570 --> 01:26.980
naik maka yang akan terjadi adalah 100 persen kemungkinannya akan naik.

01:27.030 --> 01:28.700
Itulah yang akan terjadi.

01:28.700 --> 01:29.740
Tidak ada pilihan lain.

01:29.740 --> 01:33.690
Setelah itu mengatakan naik atau klik panah ke atas itu akan naik.

01:33.690 --> 01:35.070
Tidak ada pilihan lain.

01:35.250 --> 01:41.950
Sekarang di sisi lain pencarian nondeterministic adalah ketika agen kami mengatakan ingin naik.

01:42.130 --> 01:44.430
Mereka sebenarnya beberapa pilihan.

01:44.460 --> 01:48.820
Misalnya mungkin ada tiga opsi dan kita akan melihat contoh di

01:48.830 --> 01:53.400
mana ada tiga opsi tetapi tidak harus menjadi batas tiga sebelum bisa

01:53.400 --> 01:59.640
berbeda tergantung pada masalah, keacakannya bisa berbeda tetapi dalam kasus kami, itu bisa menjadi tiga opsi dengan

01:59.640 --> 02:01.640
peluang 80 persen dia naik.

02:01.860 --> 02:07.500
Tetapi dengan peluang 10 persen ketika dia ingin naik, dia benar-benar akan pergi ke kiri hanya karena.

02:07.500 --> 02:11.080
Karena begitulah lingkungan bekerja itulah dunia tempat ia tinggal.

02:11.430 --> 02:14.840
Dan dengan cek 10 persen kemungkinan dia benar-benar akan benar.

02:14.880 --> 02:17.770
Dan dalam hal ini dia akan jatuh ke firepit.

02:17.850 --> 02:20.730
Jadi begitulah cara kerjanya.

02:20.760 --> 02:26.760
Itu adalah contoh dari pencarian pasti proses stokastik dan apa gunanya adalah untuk membuat model

02:26.760 --> 02:35.370
yang lebih realistis dari apa yang sebenarnya bisa terjadi di dunia nyata dalam jenis masalah dunia nyata karena sangat jarang Anda

02:35.370 --> 02:40.560
mendapatkan situasi seperti ini ketika Anda melakukan sesuatu dan itu terjadi persis seperti

02:40.560 --> 02:41.390
itu.

02:41.520 --> 02:46.560
Dan bahkan jika Anda memikirkannya dalam hal permainan katakanlah Anda memiliki agen yang bermain Pac-Man.

02:46.740 --> 02:51.270
Yah, tidak selalu masalahnya jika dia berdiri di alun-alun dia naik.

02:51.360 --> 02:54.260
Dia akan mendapatkan hasil yang persis sama setiap saat.

02:54.460 --> 02:59.820
Yah dia memang akan naik tetapi mungkin dalam satu kasus Anda tidak akan dimakan oleh hantu dalam kedua kasus.

02:59.820 --> 03:01.570
Dia akan dimakan oleh hantu.

03:01.590 --> 03:05.970
Jadi seperti yang Anda lihat ada keacakan karena tergantung pada bagaimana hantu bergerak dan mereka tidak selalu

03:05.970 --> 03:07.350
bergerak dengan cara yang sama.

03:07.350 --> 03:09.370
Mereka tidak selalu mulai di lokasi yang sama.

03:09.510 --> 03:16.140
Jadi sangat logis sangat adil bahwa ada beberapa keacakan ada sesuatu yang tidak berada di bawah kendali

03:16.140 --> 03:21.810
agen dan ini hanya cara bagi kita untuk mempresentasikan bahwa agar kita dapat belajar bagaimana

03:21.810 --> 03:27.240
kita bisa menghadapinya dan bagaimana yang mempengaruhi persamaan Belman bagaimana hal itu memengaruhi

03:27.240 --> 03:29.010
seluruh proses pembelajaran penguatan.

03:29.070 --> 03:33.780
Tetapi pada saat yang sama, keacakan itu tentu saja tidak terbatas pada jika Anda naik, ada peluang 10 persen

03:33.780 --> 03:38.400
Anda akan ke kanan atau temp dan pergi ke kiri atau jika Anda turun ke 10 persen kemungkinan Anda

03:38.400 --> 03:42.840
ke kanan atau kiri atau Anda ' Benar, ada peluang 10 persen naik turun halus terbatas di mana

03:42.840 --> 03:45.550
Anda akan berakhir kadang-kadang Anda mungkin memiliki masalah yang sebenarnya.

03:45.570 --> 03:47.390
Terkadang kemungkinannya mungkin berbeda.

03:47.430 --> 03:52.990
Kadang-kadang keacakan mungkin berubah menjadi sesuatu yang lain itu mungkin direbus seperti contoh itu.

03:52.980 --> 03:58.890
Hantu pacman memakan Anda tidak memakan Anda atau mungkin mendidih ke sesuatu yang berbeda.

03:58.890 --> 04:05.550
Misalnya seperti ada seperti jika agen bermain Doom dan kemudian ada sesuatu seperti monster yang akan

04:05.700 --> 04:11.040
menembaknya dalam satu kasus dan kasus lain ada seperti ada kemungkinan jika kita

04:11.060 --> 04:14.380
semua ditembak dan kita tidak akan ditembak.

04:14.550 --> 04:19.710
Dan sesuatu yang berada di luar kendali agen adalah sesuatu yang tidak dapat saya prediksi.

04:19.710 --> 04:25.740
Itulah yang kami modelkan di sini dalam pencarian nondeterministik dan di sinilah kami telah secara

04:25.950 --> 04:32.780
langsung mendekati dua konsep baru tanda proses dan atau tanda proses dan tanda penanda proses keputusan jadi mari

04:32.790 --> 04:34.130
kita lihat ini.

04:34.150 --> 04:39.080
Dan Anda tahu betapa saya tidak suka menempatkan definisi dan banyak teks di samping.

04:39.090 --> 04:42.280
Tetapi dalam hal ini perlu bagi kita untuk melalui itu.

04:42.280 --> 04:46.220
Jadi mari kita lihat proses stokastik memiliki tanda properti.

04:46.240 --> 04:51.750
Jika distribusi probabilitas bersyarat dari keadaan masa depan dari proses bersyarat dan kondisi

04:51.750 --> 04:58.200
masa lalu dan masa kini hanya bergantung pada kondisi saat ini bukan pada urutan peristiwa yang mendahuluinya.

04:58.230 --> 05:00.410
Proses dengan properti ini disebut penanda.

05:01.040 --> 05:06.470
Definisi yang sangat kompleks dan sepertinya Anda perkenalkan sedikit tidak hanya bertentangan dengan dirinya sendiri tetapi rasanya

05:06.470 --> 05:11.110
juga bertentangan sendiri, jadi di sini syarat untuk kehadiran positif yang tergantung pada poin

05:11.110 --> 05:11.450
Anda.

05:11.480 --> 05:14.450
Tetapi pada saat yang sama itu hanya tergantung pada keadaan saat ini.

05:14.510 --> 05:17.510
Jadi jangan terlalu terjebak dalam hal itu.

05:17.670 --> 05:23.050
Saya akan memecahnya secara sederhana sehingga tanda properti adalah ketika masa depan Anda.

05:23.060 --> 05:25.310
Jadi bukan hanya pilihan Anda tetapi semuanya.

05:25.310 --> 05:31.640
Pilihan Anda dan lingkungan itu hanya akan menyukai hasil dari semua tindakan yang Anda lakukan di lingkungan itu hanya akan

05:31.640 --> 05:33.900
bergantung pada di mana Anda berada sekarang.

05:33.920 --> 05:35.770
Itu tidak akan tergantung pada bagaimana Anda sampai di sana.

05:36.110 --> 05:36.560
Dan itu saja.

05:36.560 --> 05:40.630
Jadi itu masalah publik dan proses yang memiliki properti ini disebut proses pasar.

05:40.880 --> 05:47.570
Jadi, berikan contoh jadi jika agen Anda ada di sini dan jika dia pergi jika dia memutuskan untuk naik, dia mungkin

05:47.570 --> 05:48.030
pergi.

05:48.040 --> 05:52.940
Dia dalam kasus kami dalam contoh pencarian nondeterministik kami, ia mungkin benar-benar ke kiri dan kanan.

05:53.000 --> 05:53.680
Baiklah.

05:53.690 --> 05:58.940
Itu karena kita memiliki tongkat itu di kota ini di dalam lingkungan kita, kita memiliki keacakan di dalam

05:58.940 --> 05:59.710
lingkungan kita.

05:59.810 --> 06:01.820
Jadi salah satu dari hal ini mungkin terjadi.

06:01.820 --> 06:07.250
Tetapi kuncinya di sini adalah bahwa ini adalah tanda proses karena kami tidak peduli bagaimana Anda sampai di sini.

06:07.250 --> 06:10.700
Dia bisa saja datang dari atas, berakhir di sini. Dia bisa saja datang dari kiri dan di atas sini

06:10.700 --> 06:12.370
kau bisa datang dari bawah dan berakhir di sini.

06:12.380 --> 06:16.640
Dia bisa saja suka bermain bergerak di sekitar sini seperti 100.000 kali dan kemudian sampai di sini.

06:16.700 --> 06:22.490
Tidak masalah apa yang terjadi sebelumnya hanya yang penting adalah negara mana dia sekarang

06:22.520 --> 06:31.160
Jadi kemungkinan untuk ke kiri atau ke kanan atau ke atas mereka akan selalu sama jika dia dalam kondisi

06:31.160 --> 06:32.250
ini sekarang.

06:32.690 --> 06:37.530
Dan itu pada dasarnya hanya mengatakan tidak masalah apa yang terjadi sebelum kita di sini sekarang.

06:37.640 --> 06:39.150
Ini adalah keadaan Anda.

06:39.200 --> 06:42.320
Dan jangan lupa bahwa keadaan tidak hanya berarti di mana dia berdiri.

06:42.320 --> 06:48.140
Keadaan adalah keadaan keseluruhan dari seluruh agen di lingkungan sehingga ada seperti monster di kanan atau monster di

06:48.140 --> 06:53.030
sebelah kiri atau Anda tahu adalah hantu yang datang dari atas atau bawah apa pun

06:53.090 --> 06:54.530
keadaan Anda sekarang .

06:54.560 --> 06:58.460
Tidak masalah bagaimana Anda sampai di sana, tidak masalah bagaimana dan bagaimana semuanya terjadi sehingga Anda berada di sana dalam keadaan

06:58.460 --> 06:58.790
itu.

06:58.790 --> 07:02.990
Sekarang apa yang akan terjadi di masa depan hanya ditentukan oleh keadaan Anda sekarang.

07:02.990 --> 07:07.440
Ditambah tindakan Anda akan mengambil mereka ditambah tentu saja keacakan yang overlay di atas itu.

07:07.460 --> 07:14.280
Jadi itulah tanda proses dan proses pengambilan keputusan penanda atau proses keputusan penanda atau MVP.

07:14.390 --> 07:20.390
Berikan kerangka matematika untuk pemodelan pengambilan keputusan dalam situasi di mana hasil sebagian acak

07:20.420 --> 07:23.430
dan sebagian di bawah kendali pengambilan keputusan

07:23.570 --> 07:29.120
Jadi penting untuk dipahami bahwa tanda proses pengambilan keputusan berbeda dan seluruh konsep

07:29.150 --> 07:32.210
berbeda tanda proses untuk tanda proses.

07:32.340 --> 07:34.810
Ada seperti kerangka kerja matematika begitu.

07:34.970 --> 07:39.080
Tetapi pada saat yang sama saya pikir penting bagi kita untuk memahami apa tanda

07:39.170 --> 07:45.140
proses itu karena saya pikir itu masih membantu dalam memahami tanda tanda proses keputusan dan tanda proses keputusan ada

07:45.200 --> 07:46.130
di sana.

07:46.230 --> 07:50.950
Ini adalah persis apa yang telah kita bahas sampai sekarang sehingga agen tinggal di lingkungan ini

07:51.290 --> 07:56.570
di mana dia memiliki kontrol seperti dia sebelumnya dan memiliki kendali penuh atas apa yang terjadi tetapi sekarang memiliki

07:56.570 --> 07:57.530
kontrol sedikit kurang.

07:57.590 --> 08:00.270
Itu bisa memutuskan untuk naik tetapi sebenarnya tahu.

08:00.290 --> 08:05.570
OK jadi jika saya naik ada kesempatan kera saya akan naik upaya ini dan peluang ke kiri dan kesempatan akan

08:05.560 --> 08:06.170
ke kanan.

08:06.170 --> 08:08.930
Jadi tidak semuanya sepenuhnya di bawah kendalinya.

08:08.930 --> 08:13.280
Ada beberapa keacakan dalam lingkungan ini dan itulah yang merupakan tanda proses pengambilan keputusan dan

08:13.280 --> 08:18.830
proses pengambilan keputusan Markov adalah kerangka kerja yang akan digunakan agen untuk memahami apa yang harus dilakukan dalam lingkungan

08:18.830 --> 08:19.400
ini.

08:19.400 --> 08:22.400
Jadi kita punya lingkungan dengan keracunan beberapa keacakan.

08:22.550 --> 08:27.000
Dan sekarang agen harus memilih misalnya naik ke kiri atau kanan.

08:27.370 --> 08:28.530
Dia harus membuat keputusan itu.

08:28.520 --> 08:29.820
Dia tidak tahu harus berbuat apa.

08:30.140 --> 08:36.200
Dan untuk membuat keputusan itu akan menerapkan kerangka kerja akan menggunakan tanda proses keputusan untuk

08:36.200 --> 08:40.960
membuat keputusan apa yang akan terjadi di mana ia akan pergi.

08:40.970 --> 08:47.600
Dan pada dasarnya lingkungan ini yang menimbulkan masalah ini disebut tanda proses pengambilan keputusan sehingga kerangka

08:47.600 --> 08:52.820
kerja yang digunakan agen pada saat yang sama lingkungan disebut bahwa agen beroperasi

08:52.820 --> 08:55.810
di lingkungan proses pengambilan keputusan pasar.

08:56.280 --> 09:01.190
Jadi pada dasarnya di sini kita memiliki dua konsep. Kita memiliki tanda proses adalah cara

09:01.190 --> 09:03.740
lingkungan ini dirancang sehingga PA melakukan pekerjaannya.

09:03.770 --> 09:07.020
Apa yang terjadi dari tempat Anda sekarang tidak bergantung pada masa lalu.

09:07.130 --> 09:11.240
Dan pada saat yang sama kita mendapat tanda proses keputusan adalah kerangka kerja yang

09:11.240 --> 09:13.630
akan digunakan agen untuk menyelesaikan lingkungan ini.

09:13.970 --> 09:18.830
Dan kabar baiknya adalah bahwa tanda proses pengambilan keputusan atau kerangka kerja yang sedang

09:18.830 --> 09:24.730
kita bicarakan sebenarnya hanyalah tambahan untuk pertanyaan persamaan Belman kita adalah persamaan Belman tetapi hanya sedikit lebih canggih.

09:24.740 --> 09:26.960
Jadi mari kita lihat itu.

09:27.050 --> 09:28.910
Ini adalah persamaan Belman kami sejauh ini.

09:29.030 --> 09:31.030
Ini adalah maksimum dari semua tindakan yang mungkin.

09:31.040 --> 09:35.150
Jadi nilai berada dalam keadaan adalah maksimum dari semua tindakan yang mungkin dapat Anda ambil

09:35.150 --> 09:35.990
dari keadaan itu.

09:36.260 --> 09:41.930
Maksimum diambil dari hadiah yang akan Anda dapatkan dengan mengambil tindakan itu di negara itu ditambah

09:41.930 --> 09:45.410
faktor diskon kali nilai negara berikutnya yang sebagai prima.

09:45.410 --> 09:47.390
Jadi itulah yang kami miliki sejauh ini.

09:47.400 --> 09:52.550
Sekarang karena kita memiliki beberapa keacakan dalam seluruh proses kita, bagian ini akan berubah karena kita tidak benar-benar

09:52.550 --> 09:57.620
tahu negara bagian mana yang akan berakhir dan kita tidak tahu akan menjadi apa jadinya jika

09:57.630 --> 10:03.680
kita naik maka ke atas atau akan ke kiri akan benar sehingga kami benar-benar harus menempatkan ini dengan nilai yang

10:03.680 --> 10:04.960
diharapkan pada tanggal berikutnya.

10:04.970 --> 10:08.810
Jadi di sini kita akan mengganti ini sehingga ada tiga kemungkinan negara kita bisa berakhir.

10:08.810 --> 10:15.480
Jadi kita akan menggantinya dengan beberapa nilai yang dinyatakan sebagai nilai satu prima.

10:15.520 --> 10:18.190
Bahwa ia memiliki pandangan sebagai prima ke prima.

10:18.470 --> 10:22.490
Dan keadaan ini memiliki nilai kita bertiga, Bryne.

10:22.640 --> 10:28.790
Jadi sekarang kita akan melipatgandakan keadaan bahwa kita benar-benar bermaksud masuk ke dalam 80 persen karena itulah bagaimana

10:28.790 --> 10:33.770
kemungkinan untuk mencapai keadaan itu ditambah probabilitas untuk mencapai keadaan ini adalah 10 persen

10:33.770 --> 10:39.800
ditambah orang yang masuk ke negara bagian Jadi ini adalah hanya nilai yang kami harapkan jadi jika

10:39.800 --> 10:46.880
dari statistik jika kami mengambil nilai yang diharapkan untuk memasuki kondisi yang akan kami masuki, ini seperti rata-rata. Apa yang

10:47.060 --> 10:52.040
rata-rata dari apa yang akan kami dapatkan dan kemudian kami ganti di sini.

10:52.040 --> 10:56.210
Kemudian kita mendapatkan agresi ini dan melompat sangat cepat hanya karena ada yang besar tetapi jika Anda melihatnya

10:56.210 --> 10:59.930
dengan cermat Anda akan melihat hal yang sama dikatakan tentang Max di sini Max di sini.

10:59.960 --> 11:06.340
Kemudian Anda mendapatkan r dari S dan A R dari S dan mereka memiliki gamma, Anda memiliki gamma.

11:06.410 --> 11:08.600
Dan akhirnya di sini Anda punya v.

11:08.630 --> 11:13.640
Jadi Anda tahu persis itu adalah pencarian deterministik yang Anda tahu negara bagian mana yang akan Anda masuki.

11:13.640 --> 11:16.120
Sekarang Anda tidak tahu negara bagian mana yang akan Anda masuki sejak mengambil V.

11:16.120 --> 11:23.300
Anda mengambil nilai yang diharapkan dari negara bagian yang akan Anda masuki atau negara bagian masa depan atau hanya secara sederhana Anda hanya

11:23.300 --> 11:25.920
mengambil rata-rata dari apa yang akan Anda dapatkan.

11:26.060 --> 11:32.900
Jadi, Anda tahu rasanya seperti untuk 30 plus 3 persen kemungkinannya akan seperti membagi Plus ini dengan tiga pada dasarnya.

11:32.900 --> 11:37.130
Tetapi dalam kasus ini bukan tidak seperti rata-rata rata-rata.

11:37.130 --> 11:40.410
Ini rata-rata tertimbang karena probabilitas di sini.

11:40.430 --> 11:45.980
Jadi di sini Anda memiliki kemungkinan ketika Anda berada dalam tahap ini untuk mengambil tindakan memasuki kondisi prima ini sebagai

11:46.040 --> 11:50.630
nilai prime time dan beberapa untuk melewati semua bilangan prima ini yang mungkin bisa Anda dapatkan

11:50.630 --> 11:51.830
tentang siapa kami.

11:51.830 --> 11:54.690
Jadi persis apa yang kita punya tiga di sini satu dua tiga.

11:54.890 --> 11:57.330
Tambahkan mereka, kalikan ini tambahkan.

11:57.330 --> 11:58.040
Sama disini.

11:58.040 --> 11:58.820
Satu dua tiga.

11:58.820 --> 12:01.660
Lipat gandakan dengan probabilitas dan tambahkan.

12:02.090 --> 12:05.180
Dan itu adalah persamaan Belman baru Anda.

12:05.180 --> 12:06.440
Selamat.

12:06.470 --> 12:08.990
Inilah yang akan kita kerjakan untuk maju.

12:09.140 --> 12:15.590
Dan itu adalah kerangka kerja yang digunakan dalam proses pengambilan keputusan sehingga kerangka itulah yang

12:15.590 --> 12:16.490
memecahkan ini.

12:16.620 --> 12:22.670
Agen yang digunakan untuk menyelesaikan seluruh masalah pencarian stokastik nondeterministik ini di mana ada peristiwa acak

12:22.670 --> 12:25.460
yang terjadi yang tidak dapat mereka kendalikan.

12:25.460 --> 12:26.920
Jadi ini jauh lebih kompleks.

12:26.930 --> 12:30.150
Tapi seperti yang Anda lihat karena kami membangunnya perlahan.

12:30.290 --> 12:33.120
Sekarang kita sudah tahu tentang ini, kita tahu tentang.

12:33.130 --> 12:35.090
Ada kekhawatiran tentang ini.

12:35.090 --> 12:36.160
Kami tahu tentang ini.

12:36.170 --> 12:36.710
Kami tahu apa itu.

12:36.710 --> 12:42.500
Jadi yang kami lakukan adalah kami baru saja memperkenalkan bagian ini di sini karena ada

12:42.920 --> 12:49.000
kemungkinan yang terlibat dalam tindakan atau konsekuensi dari tindakan Anda pada nondeterministic mereka didasarkan pada probabilitas.

12:49.220 --> 12:50.600
Jadi begitulah.

12:50.600 --> 12:58.280
Begitulah penanda proses keputusan bekerja dan persamaan yang mendasari di belakangnya.

12:58.330 --> 13:04.630
Sekali lagi itu adalah sesuatu yang lebih mirip dengan masalah dunia nyata nyata atau Sinatras

13:04.670 --> 13:08.690
atau bahkan skenario permainan karena tidak semuanya mudah.

13:08.690 --> 13:15.880
Ada beberapa keacakan dari semua yang terlibat dan tidak selalu akan mengambil tindakan dalam keadaan tertentu akan selalu Nawal tidak

13:15.870 --> 13:18.810
selalu akan mengarah pada hasil yang sama.

13:18.890 --> 13:23.150
Dan inilah yang akan kita hadapi ke depan dan itu akan membuat segalanya

13:23.150 --> 13:24.310
menjadi lebih menarik.

13:24.380 --> 13:29.290
Jadi semoga Anda bersemangat untuk itu dan bersemangat untuk melihat apa yang akan terjadi selanjutnya.

13:29.690 --> 13:35.870
Dan sementara itu saya menemukan kertas yang sangat keren untuk Anda lihat saat ini.

13:35.870 --> 13:37.460
Ini kertas yang sangat diterapkan.

13:37.460 --> 13:40.150
Jadi yang ini sebenarnya sangat menarik untuk dibaca.

13:40.160 --> 13:46.810
Ini disebut survei aplikasi Mark proses keputusan proses dan ditulis oleh kulit putih pada

13:46.820 --> 13:47.970
tahun 1993.

13:47.990 --> 13:56.000
Ada tautannya dan saya akan tunjukkan contoh di mana proses keputusan Markov sebenarnya digunakan

13:56.000 --> 13:59.560
untuk memodelkan kehidupan nyata Sinatras.

13:59.560 --> 14:03.880
Saya terkesan dengan beberapa contoh panen penduduk misalnya.

14:03.880 --> 14:09.290
Jadi katakanlah Anda memiliki beberapa ikan dan Anda tahu berapa populasi ikan yang Anda butuhkan untuk memutuskan

14:09.290 --> 14:12.910
berapa banyak ikan yang bisa kita ikan tahun ini dan apa.

14:13.250 --> 14:14.330
Jadi itulah kondisi Anda saat ini.

14:14.330 --> 14:17.220
Itulah tindakan yang Anda ambil. Berapa banyak yang bisa kami tembak tahun ini.

14:17.230 --> 14:20.420
Jadi, apa masalahnya apa hasil yang mungkin dari itu.

14:20.540 --> 14:22.100
Berapa banyak ikan yang akan kita miliki tahun depan.

14:22.160 --> 14:25.210
Berapa banyak ikan yang akan kita dapatkan setelah tahun dan tahun sesudahnya dan seterusnya.

14:25.250 --> 14:30.230
Dan itu tidak deterministik karena tidak seperti jika Anda mengambilnya pada satu jam dan 90 persen dari

14:30.230 --> 14:34.640
populasi tahun depan Anda akan memiliki Anda tahu kembali ke 100 persen tidak persis khotbah.

14:34.640 --> 14:39.590
Ada beberapa faktor acak yang terlibat yang berada di luar kendali kami dan oleh karena itu kami

14:39.760 --> 14:43.640
harus memahami apa yang akan terjadi, kami harus memodelkan apa yang akan terjadi

14:43.860 --> 14:46.060
di situlah keputusan pasar memproses pertanian.

14:46.070 --> 14:50.250
Ada contoh seperti panen panen, berapa banyak panen yang kita panen, berapa banyak uang yang

14:50.280 --> 14:51.440
tidak kita panen.

14:51.470 --> 14:58.190
Satu lagi yang saya lihat di bidang keuangan dan investasi seperti perusahaan asuransi perlu memutuskan berapa banyak dana

14:58.190 --> 15:04.990
yang akan diinvestasikan dalam setiap hari atau tahun yang saya pikirkan atau periode waktu tertentu dan ada faktor-faktor

15:05.020 --> 15:06.490
tertentu dari kendalinya.

15:06.490 --> 15:11.260
Misalnya Anda tahu pergerakan pasar itu tidak tahu apa yang bisa terjadi sehingga perlu benar-benar

15:11.260 --> 15:12.070
memodelkan itu.

15:12.110 --> 15:14.350
Tanda proses keputusan yang digunakan untuk itu.

15:14.350 --> 15:16.890
Jadi di sini Anda dapat melihat banyak sekali contoh.

15:16.900 --> 15:20.340
Dan ini adalah jumlah contoh yang saya pikir untuk masing-masing.

15:20.650 --> 15:28.030
Jadi, Anda tahu contoh olahraga untuk olahraga dan epidemi serta inspeksi dan pemeliharaan klaim asuransi kendaraan

15:28.090 --> 15:31.030
dan perbaikannya juga sangat menarik.

15:31.030 --> 15:31.900
Lihatlah itu.

15:31.930 --> 15:40.390
Hanya untuk memberi Anda pemahaman tentang hei ini bukan hanya semua hal-hal hipotetis yang dibuat semacam

15:40.390 --> 15:41.130
itu.

15:41.140 --> 15:45.580
Ini sebenarnya adalah skenario dunia nyata sehingga saya akan memberi Anda pemahaman yang lebih

15:45.580 --> 15:50.410
baik dan ini adalah apa yang kami bicarakan dalam video promosi untuk skor yang atau deskripsi dari

15:50.410 --> 15:55.900
kursus yang akan menginspirasi Anda dan intuisi Anda untuk memberi Anda ide untuk cara menggunakan AI dalam kehidupan nyata.

15:55.900 --> 15:57.820
Ini adalah kesempatanmu.

15:57.820 --> 15:59.790
Lihatlah makalah ini untuk mengerti.

15:59.900 --> 16:02.890
OK jadi kita akan berurusan dengan tanda proses pengambilan keputusan ke depan.

16:02.890 --> 16:07.210
Itu benar-benar keren seperti apa mereka dalam kehidupan nyata dan ini mungkin bisa memicu beberapa ide

16:07.210 --> 16:13.300
untuk Anda bagaimana Anda bisa menerapkannya di masa depan untuk membuat dunia menjadi tempat yang lebih baik dan kami akan sangat senang tentang

16:13.300 --> 16:13.650
itu.

16:13.690 --> 16:18.560
Kami akan senang jika Anda dapat menggunakan apa yang Anda pelajari dalam kursus ini untuk membuat dunia menjadi tempat yang lebih baik.

16:18.730 --> 16:20.050
Betapa fantastisnya itu.

16:20.380 --> 16:23.170
Jadi pada catatan itu saya harap Anda menikmati tutorial hari ini.

16:23.170 --> 16:24.540
Saya menantikan Anda nanti.

16:24.610 --> 16:26.420
Dan sampai saat itu nikmati AI.