WEBVTT

00:00.360 --> 00:06.360
Halo dan selamat datang di tutorial menyenangkan dari mobil self-driving modul pertama ini.

00:06.360 --> 00:11.850
Kita akan menguji mata kita pada lingkungan dan kita akan mengujinya pada empat tingkatan yang berbeda.

00:11.850 --> 00:16.620
Artinya kita akan memainkan permainan, permainan akan memiliki empat tingkat kesulitan dan tujuannya harus

00:16.620 --> 00:18.280
melewati empat tingkat ini.

00:18.420 --> 00:20.640
Jadi kita akan menjadi empat level ini.

00:20.640 --> 00:27.480
Tingkat Pertama Satu tingkat pertama akan mencapai bandara dan kemudian melakukan beberapa perjalanan bolak-balik antara bandara

00:27.480 --> 00:29.160
dan pusat kota.

00:29.340 --> 00:35.430
Jadi begitu kita melihat mobil melakukan perjalanan bolak-balik ini Nah kita lulus level 1 maka Level 2 Level 2 akan

00:35.450 --> 00:37.490
tetap melakukan perjalanan pulang pergi ini.

00:37.560 --> 00:43.290
Tetapi pada jalan khusus yang kita gambar sendiri tetapi itu akan menjadi jalan yang mudah karena tingkat

00:43.290 --> 00:43.840
2.

00:43.980 --> 00:49.030
Dan tentu saja mobil harus menyetir sendiri dengan tetap berada di jalan itu.

00:49.170 --> 00:53.420
Jadi itu akan menjadi jalan yang pergi dari bandara ke pusat kota dan kemudian ke arah lain.

00:53.420 --> 00:57.010
Maka mobil harus melakukan perjalanan bolak-balik ini dengan duduk di jalan itu.

00:57.210 --> 01:00.980
Jika berhasil, kami akan melewati level 2 dan level 3.

01:01.030 --> 01:07.410
Level 3 akan menggambar beberapa rintangan di peta untuk melihat apakah mobil berhasil menghindari rintangan dan

01:07.410 --> 01:08.850
masih mencapai tujuannya.

01:08.910 --> 01:12.730
Jadi tidak ada kekhawatiran akan menarik beberapa hambatan sulit yang harus dihindari oleh mobil.

01:12.930 --> 01:20.010
Dan kita akan melihat apakah itu berhasil mencapai bandara dan pusat kota dan akhirnya tingkat untuk tingkat yang paling

01:20.010 --> 01:25.380
menantang untuk mobil adalah dengan menggambar jalan yang sangat sulit untuk mencapai pusat kota.

01:25.440 --> 01:28.060
Jadi saya tidak tahu Anda tahu itu akan menjadi jalan seperti zigzag.

01:28.200 --> 01:31.720
Saya bukan arsitek yang brilian tetapi saya akan mencoba membuat jalan yang menantang.

01:31.950 --> 01:37.830
Jadi mari kita berharap kita melewati setidaknya level pertama yang akan bagus maka mari kita berharap kita juga bisa melewati

01:37.920 --> 01:39.190
level dua dan tiga.

01:39.420 --> 01:42.180
Dan jika kita melewati level 4 itu akan luar biasa.

01:42.180 --> 01:44.540
Jadi mari kita lakukan ini, mari kita ambil tantangan.

01:44.610 --> 01:49.840
Yah sebenarnya mobil self-driving akan mengambil tantangan tetapi kita adalah otak di balik ini.

01:49.860 --> 01:52.110
Jadi, mari kita beri tahu cara kerjanya.

01:52.110 --> 01:57.280
Baiklah, hal pertama yang akan saya lakukan adalah memberi Anda pengingat cepat tentang peta.

01:57.330 --> 01:59.060
Jadi itu peta.

01:59.190 --> 02:03.810
Dan pertama kita akan melihat peta kita akan melihat mobil self-driving tanpa AI

02:04.020 --> 02:09.540
untuk itu hanya akan menjadi mobil yang memiliki tindakan acak yang Anda lihat di awal model ini.

02:09.600 --> 02:10.970
Jadi bagaimana kita melihatnya?

02:11.040 --> 02:15.330
Kita harus menonaktifkan AI dan aktivitasnya.

02:15.570 --> 02:19.590
Kita hanya perlu menempatkan suhu yang sama dengan nol.

02:19.620 --> 02:22.380
Ingat parameter di sini adalah suhu.

02:22.560 --> 02:24.240
Dan sekarang ini sama dengan tujuh.

02:24.300 --> 02:25.830
Itu suhu rendah.

02:25.830 --> 02:27.280
Kami akan meningkatkannya sesudahnya.

02:27.510 --> 02:32.700
Tetapi jika kita tidak ingin mobil memiliki otak yaitu jika kita tidak ingin mengaktifkan AI

02:32.700 --> 02:36.210
kita hanya perlu mengatur suhu ke nol sama dengan nol.

02:36.210 --> 02:39.980
Dan yang sama di sini tentu saja itu adalah suhu sebenarnya dalam dingin juga.

02:39.990 --> 02:40.460
Itu dia.

02:40.470 --> 02:45.580
Dan kemudian kita tidak boleh lupa untuk mengatakan karena kalau tidak itu tidak akan termasuk perubahan.

02:45.800 --> 02:47.120
Saya kira sekarang kita tidak punya.

02:47.130 --> 02:49.210
Saya melihat saya dulu mengaktifkannya.

02:49.260 --> 02:53.180
Jadi mari kita lihat peta hanya untuk memberi kita penyegaran cepat.

02:53.220 --> 02:55.370
Pengingat cepat tentang bagaimana tampilannya.

02:55.530 --> 03:01.070
Jadi saya akan memilih semuanya dan tekan enter.

03:01.090 --> 03:01.630
Baiklah.

03:01.630 --> 03:03.840
Dan ada peta kita dan ada mobil kita.

03:03.880 --> 03:09.540
Jadi seperti yang Anda lihat, mobil melakukan tindakan yang benar-benar acak, Anda tahu untuk belok kiri

03:09.540 --> 03:16.480
untuk langsung ke kanan dan karena itu tidak mencapai bandara yang saya ingatkan di kiri atas peta dan tidak

03:16.870 --> 03:17.500
mencapainya.

03:17.550 --> 03:18.410
Yah baru saja melakukannya.

03:18.470 --> 03:20.230
Itu benar-benar acak.

03:20.230 --> 03:26.680
Anda melihatnya sekarang di bandara dan tidak mencapai tujuan lain yang merupakan pusat kota di

03:26.680 --> 03:28.220
kanan bawah peta.

03:28.480 --> 03:34.030
Jadi kami seperti di sini tapi kami bisa melihat dengan jelas bahwa tindakannya benar-benar acak.

03:34.030 --> 03:40.270
Ini tidak ke mana-mana dan jelas tidak ada kecerdasan buatan tetapi tidak ada kekhawatiran.

03:40.270 --> 03:42.080
Kami akan mengaktifkannya sekarang.

03:42.370 --> 03:49.480
Saya akan menutup peta dan kemudian saya akan me-restart kernel restart DeCarlo.

03:49.760 --> 03:52.390
Anda mengklik tombol alat ini di sini dan kemudian ya.

03:52.820 --> 04:00.730
Dan sekarang saatnya untuk pertunjukan, kita akhirnya akan meletakkan kereta ini yang kita buat di mobil dan mengaktifkan

04:00.730 --> 04:01.350
AI.

04:01.700 --> 04:04.090
Saya sangat senang melihat apa yang akan terjadi.

04:04.180 --> 04:10.730
Kita akan mengaktifkan udara sekarang dan untuk melakukan ini kita perlu menaikkan suhu sehingga

04:10.730 --> 04:17.300
untuk mengubah suhu yang diganti nol dengan baik mari kita mulai dengan tujuh seperti sebelumnya.

04:17.450 --> 04:19.660
Jadi mari kita tentukan tujuh di sini.

04:19.670 --> 04:21.510
Baiklah, jangan lupa untuk mengatakannya.

04:21.590 --> 04:26.870
Dan sekarang mari kita kembali ke peta kita dan sekarang kita bisa menjalankan ini lagi karena kita

04:26.870 --> 04:27.790
me-restart kernel.

04:27.890 --> 04:29.470
Jadi katakan saja.

04:29.990 --> 04:31.790
Dan di sana kita pergi, kita punya mobil.

04:31.790 --> 04:33.600
Dan apa yang dilakukannya.

04:33.890 --> 04:41.180
Yah itu sedang mencoba untuk menemukan jalannya menjelajahi pemahamannya apa yang harus dilakukan dan tentang untuk mencapai bandara dan di

04:41.180 --> 04:47.900
sana kita pergi dulu, mencapai indah dan sekarang tujuan berikutnya adalah untuk mencapai pusat kota dan ada

04:48.140 --> 04:50.540
yang mati hanya mencapai pusat kota.

04:50.810 --> 04:56.750
Dan sekarang sedang berusaha menemukan bandara kembali ke bandara dan di sana lagi Keajaiban yang

04:56.750 --> 04:57.450
bekerja.

04:57.470 --> 05:03.200
Sebenarnya tidak butuh waktu untuk mengeksplorasi belajar dari kesalahan yang Anda tahu kesalahan di sini adalah untuk

05:03.200 --> 05:04.380
melangkah lebih jauh.

05:04.520 --> 05:08.770
Itulah tempat kami menghukum mobil dengan memberinya hadiah yang sedikit negatif.

05:08.780 --> 05:10.270
Anda tahu minusnya 0. 2.

05:10.550 --> 05:16.760
Jadi ia belajar dari kesalahan itu dan dengan belajar dari kesalahan itu ia berhasil mendapatkan imbalan

05:17.000 --> 05:18.980
positif dengan semakin mendekati tujuannya.

05:19.310 --> 05:21.940
Dan sekarang akhirnya mengerti apa yang harus dilakukan.

05:21.980 --> 05:28.530
Ini pasti mencapai bandara dan kemudian mencapai pusat kota dan kemudian melakukan perjalanan bolak-balik ini.

05:28.550 --> 05:29.970
Itu sempurna.

05:29.990 --> 05:36.090
Kami memiliki mobil yang bisa menyetir sendiri, tetapi saya tidak bisa melihat mobil itu seperti serangga.

05:36.170 --> 05:38.510
Mobil itu sepertinya tidak begitu yakin.

05:38.510 --> 05:40.610
Tidak, itu tidak memiliki gerakan yang sangat percaya diri.

05:40.610 --> 05:44.570
Ini seperti kiri dan kanan Anda yang tidak bergerak seperti gerakan mobil.

05:44.660 --> 05:46.090
Itu lebih mirip bug.

05:46.490 --> 05:47.820
Jadi kita akan memperbaikinya.

05:47.930 --> 05:54.560
Dan seperti yang Anda duga cara untuk memperbaikinya yaitu meningkatkan suhu karena ingat suhu adalah parameter

05:54.560 --> 05:59.690
dalam fungsi soft Mac yang dapat kita tingkatkan sehingga tindakan dikembalikan dengan

05:59.690 --> 06:00.730
lebih pasti.

06:00.830 --> 06:05.630
Jadi masuk akal bahwa jika kita meningkatkan suhu dengan baik kita mungkin akhirnya mendapatkan mobil lebih

06:05.630 --> 06:09.750
percaya diri karena AI akan lebih yakin tindakan mana yang harus dimainkan.

06:10.220 --> 06:15.350
Dan yang diingat adalah karena aksinya akan dimainkan dengan probabilitas yang lebih tinggi.

06:15.350 --> 06:20.780
Satu-satunya masalah dengan kenaikan suhu ini adalah bahwa mengingat AI kurang mengeksplorasi

06:20.780 --> 06:26.380
tindakan lain karena dengan meningkatkan suhu tindakan lain kita akan memiliki probabilitas rendah.

06:26.380 --> 06:31.760
Tetapi saat ini itu tampaknya tidak menjadi masalah karena mobil itu tampaknya tidak memiliki masalah dalam mencapai

06:31.760 --> 06:32.310
tujuannya.

06:32.420 --> 06:38.840
Bandara menjadi pusat kota sehingga kita benar-benar dapat meningkatkan suhu jika kita menginginkan benda yang sejauh ini

06:38.840 --> 06:41.140
terlihat seperti serangga seperti mobil.

06:41.390 --> 06:42.620
Jadi mari kita lakukan ini.

06:42.620 --> 06:45.530
Saya akan menutup ini sekarang.

06:45.530 --> 06:46.370
Itu dia.

06:46.370 --> 06:48.310
Nyalakan kembali kernel.

06:49.430 --> 06:50.590
Dan tekan ya.

06:50.830 --> 06:52.810
Dan sekarang kita akan meningkatkan suhu.

06:53.200 --> 06:54.090
Jadi mari kita lakukan ini.

06:54.100 --> 07:02.170
Saya akan kembali ke file saya kemudian mengganti tujuh dengan 100.

07:02.340 --> 07:03.410
Lalu kita simpan.

07:03.720 --> 07:07.890
Dan sekarang kami memiliki mobil self-driving yakin dengan sendirinya.

07:07.890 --> 07:11.990
Jadi kita mungkin mendapatkan hasil yang lebih baik dan kita mungkin mendapatkan sesuatu yang lebih mirip mobil.

07:12.270 --> 07:15.780
Mari kita ambil peta lalu mari kita kembali ke sana.

07:16.610 --> 07:18.900
Baiklah, apa yang terjadi.

07:18.920 --> 07:19.730
BAIK.

07:19.830 --> 07:21.340
Itu semacam kelelahan.

07:21.350 --> 07:22.190
Tidak yakin kenapa.

07:22.310 --> 07:25.980
Tapi bagaimanapun, sekarang kita memiliki sesuatu yang lebih mirip mobil.

07:26.060 --> 07:28.240
Anda dapat melihat bahwa ini berjalan lebih lurus.

07:28.240 --> 07:31.190
Ini tidak melakukan gerakan cepat kiri dan kanan ini.

07:31.190 --> 07:36.410
Itu karena sekarang mobil lebih yakin ke arah mana untuk mengambil dan setiap kali Anda tahu

07:36.410 --> 07:40.720
itu ingin mengambil arah terbaik pergi ke bandara dan kemudian ke pusat kota.

07:41.000 --> 07:44.490
Jadi jelas sekarang kita dapat mengatakan bahwa kita telah melewati level satu.

07:44.510 --> 07:47.840
Mobil sedang melakukan perjalanan bolak-balik antara bandara dan pusat kota.

07:47.990 --> 07:52.610
Jadi kita akan menghemat bahwa saya akan menunjukkan kepada Anda bagaimana cara menyelamatkan otak.

07:52.610 --> 07:59.520
Kita hanya perlu mengklik tombol simpan ini dan jika kita melihat apa yang terjadi di sini.

07:59.520 --> 08:04.640
Nah kita memiliki lekukan dari kita dulu di mana kita bisa mengamati beberapa kesalahan yang dibuatnya.

08:04.740 --> 08:06.990
Jadi di situlah imbalannya negatif.

08:07.170 --> 08:14.280
Tetapi kemudian ia belajar dari kesalahannya dan ganjarannya meningkat sedikit demi sedikit sampai mencapai ganjaran positif konstan

08:14.280 --> 08:19.100
sama dengan membukanya, tetapi itulah ganjaran maksimal yang kami tetapkan.

08:19.200 --> 08:21.640
Dan itu karena akhirnya menjelajah.

08:21.870 --> 08:23.490
Itu fase kedaluwarsa.

08:23.670 --> 08:26.200
Dan kemudian dia tahu apa yang harus dilakukan.

08:26.230 --> 08:32.230
Di situlah ia melakukan putaran Rountree antara bandara dan pusat kota tanpa kesalahan.

08:32.640 --> 08:33.450
Jadi begitulah.

08:33.450 --> 08:34.470
Kami melewati level satu.

08:34.470 --> 08:35.850
Selamat.

08:35.850 --> 08:38.170
Sekarang mari kita membuat segalanya lebih menantang.

08:38.190 --> 08:40.120
Mari kita ambil hal-hal di tingkat berikutnya.

08:40.140 --> 08:45.810
Mari kita coba melewati level yang saya ingatkan bahwa kita melakukan perjalanan bolak-balik ini di jalan tertentu.

08:45.830 --> 08:47.060
Kita akan menggambar diri kita sendiri.

08:47.120 --> 08:49.170
Jadi mari kita periksa dalam kerja keras berikutnya.

08:49.200 --> 08:50.780
Dan sampai saat itu aku.
