WEBVTT

00:00.390 --> 00:05.320
Halo dan selamat datang untuk melatih mata dengan kuning konvolusional yang mendalam.

00:05.490 --> 00:06.240
Betul.

00:06.240 --> 00:11.550
Sekarang kita membangun AI AI dengan arsitektur jaringan saraf tubuh seperti cara aksi

00:11.550 --> 00:12.830
dimainkan dan semuanya.

00:12.840 --> 00:17.040
Sudah waktunya untuk melatih aku dengan Cuellar convolutional yang mendalam.

00:17.220 --> 00:21.100
Jadi mulai sekarang kami akan menerapkan Anda tahu pengalaman replay.

00:21.210 --> 00:23.770
Bekerja dengan nilai-nilai bekerja dengan kata-kata.

00:24.000 --> 00:27.820
Dan bahkan akan ada bonus yang akan meningkat banyak.

00:27.840 --> 00:33.870
Proses pelatihan dan itu disebut jejak kelayakan. Kelayakan jejak adalah teknik yang kuat

00:34.110 --> 00:41.880
yang terdiri dari akumulasi kata melalui beberapa langkah dan nilai kubus dipelajari pada akumulasi kata-kata ini sebagai

00:41.880 --> 00:46.860
lawan sebelumnya di mana nilai kubus dipelajari setelah setiap transisi.

00:46.860 --> 00:52.800
Karena itu setelah mendapatkan setiap kata kali ini kita akan mempelajari nilai-nilai setelah mendapatkan beberapa penghargaan, bukan

00:53.040 --> 00:54.480
hanya satu kata.

00:54.660 --> 01:00.530
Jadi, alih-alih memiliki satu transisi setelah yang lain dan Anda tahu memperbarui nilai Q setiap kali.

01:00.660 --> 01:07.620
Nilai q akan diperbarui setiap langkah karena kelayakan melacak radikal dan langkah kelayakan jejak dan

01:07.710 --> 01:13.820
akhir adalah angka ini setelah nilai q akan diperbarui dan dalam model kami.

01:13.820 --> 01:15.600
Di sini kita akan menerima panggilan apa pun.

01:15.630 --> 01:21.570
Jadi itu berarti bahwa akan ada 10 langkah penelusuran kelayakan dan oleh karena itu kami akan memperbarui dan mempelajari nilai q

01:21.840 --> 01:22.880
setiap 10 langkah.

01:22.890 --> 01:26.820
Setelah mengumpulkan kata-kata pada 10 langkah ini jadi itu bonus.

01:26.820 --> 01:32.400
Itu akan membuat model kami lebih kuat dan Anda akan melihat bahwa pada akhirnya kami akan mendapatkan hasil yang

01:32.400 --> 01:33.180
luar biasa.

01:33.180 --> 01:36.020
Saya sangat kagum ketika melihat hasil akhirnya.

01:36.030 --> 01:40.430
Saya dulu bekerja pada Merle's yang membutuhkan banyak waktu untuk mengeksekusi.

01:40.430 --> 01:45.780
Anda tahu AI membutuhkan banyak waktu untuk berlatih, tetapi Anda akan melihat bahwa dengan yang ini plus jaringan saraf

01:45.780 --> 01:46.640
yang kami buat.

01:46.860 --> 01:49.390
Itu adalah otak kita dan tubuh kita di sini dengan barang-barang.

01:49.390 --> 01:55.740
Selanjutnya kita akan mendapatkan massa yang sangat kuat dan karena itu AI sangat kuat karena Anda akan melihat bahwa itu benar-benar akan

01:55.740 --> 01:56.600
menyembuhkan kebohongan.

01:56.610 --> 01:59.090
Apakah Anda mengerti apa yang saya bicarakan.

01:59.370 --> 02:05.440
Jadi seperti yang Anda lihat di bagian 2 ini kita mulai dengan mendapatkan lingkungan Dume dan benar-benar menyiapkan baris

02:05.440 --> 02:06.740
kode untuk Anda.

02:06.780 --> 02:12.790
Kami hanya menggunakan file eksternal pra-pemrosesan gambar dari folder direktori yang berfungsi.

02:12.930 --> 02:19.520
Jadi pada dasarnya urutannya adalah lebih dulu mengambil baris kode ini, bukankah membuatnya di pengadilan.

02:19.590 --> 02:24.450
0 0 adalah nama lingkungan game yang kami mainkan.

02:24.450 --> 02:30.930
Jadi pertama-tama kita mengimpor lingkungan dengan permata ini yang membuat Itulah yang dapat Anda temukan di halaman terbuka

02:30.930 --> 02:31.970
dan tutorial.

02:32.190 --> 02:40.230
Tapi kemudian kita menggunakan kelas gambar preproses ini yang merupakan kelas dari pra-pemrosesan gambar untuk pra-diproses gambar yang akan datang ke

02:40.290 --> 02:45.870
yang baru yang bekerja dan kami memprosesnya sehingga mereka memiliki format persegi dengan dominasi

02:45.870 --> 02:54.060
80 oleh 80 dan yang perlu diingat adalah karena pada yang baru kami yang bekerja dengan baik kami mengatur gambar input

02:54.360 --> 02:58.530
kami untuk memiliki mesin waktu satu demi 80 oleh 80.

02:58.560 --> 03:03.490
Ingat satu adalah jumlah saluran dan satu berarti kita bekerja dengan gambar hitam putih.

03:03.660 --> 03:06.350
Jadi itulah skala abu-abu di sini.

03:06.900 --> 03:14.070
Dan 80 x 80 berarti bahwa dominasi gambar input kami akan 80 x 80 dan itulah yang kami atur di

03:14.070 --> 03:20.190
jaringan saraf tetapi tentu saja kita perlu menentukan ini ketika meletakkan gambar yang persis seperti yang kita

03:20.190 --> 03:23.150
lakukan di sini dengan preprocess ini kelas gambar.

03:23.670 --> 03:29.610
Dan kemudian setelah kami mengimpor lingkungan dengan format yang tepat dari gambar input sementara kami mengimpor seluruh permainan

03:29.610 --> 03:34.920
dengan video dengan baris kode ini dan ingat hal keren tentang ini adalah bahwa pada akhirnya

03:34.920 --> 03:40.350
kita akan melihat video diputar Doom Jadi kita akan melihat bagaimana itu akan membunuh monster yang mencoba

03:40.350 --> 03:43.410
mencapai yang terbaik dan semuanya akan sangat menarik.

03:43.440 --> 03:48.170
Dan ingat bahwa video ini akan masuk ke folder video ini.

03:48.630 --> 03:49.100
Baiklah.

03:49.230 --> 03:54.990
Dan baris terakhir di sini tetapi saya ingin menunjukkannya kepada Anda karena itu penting yang sekarang lebih terkait dengan AI

03:55.200 --> 03:56.710
AI yang sedang kami bangun.

03:56.910 --> 04:02.680
Ingat juga bahwa jaringan saraf kita mengambil tindakan sebagai nomor masukan.

04:02.880 --> 04:07.950
Itu karena Anda tahu kami ingin membuat AI AI yang dapat kami uji dengan mudah di beberapa

04:07.950 --> 04:09.660
lingkungan dan beberapa lingkungan Dume.

04:09.660 --> 04:15.100
Dan karena lingkungan yang berbeda memiliki jumlah tindakan yang berbeda. Kita menentukan variabel

04:15.120 --> 04:19.070
tindakan angka ini sebagai input dari CNN otak.

04:19.380 --> 04:26.250
Dan karena itu sekarang yang akan kita lakukan adalah mendapatkan variabel tindakan angka ini menggunakan lingkungan Dumah yang baru saja

04:26.250 --> 04:29.340
kita buat dan buat ke dalam variabel ini.

04:29.340 --> 04:34.860
Dan nantinya angka ini sebenarnya sangat baik yang akan kita buat akan menjadi input otak.

04:34.890 --> 04:36.000
Jadi mari kita lakukan ini.

04:36.000 --> 04:42.690
Saya memperkenalkan tindakan nomor variabel sekarang nyata jumlah tindakan ini sama dengan.

04:42.720 --> 04:47.870
Sekarang kita akan mengambil lingkungan malapetaka kita yang merupakan variabel yang kita buat.

04:48.150 --> 04:49.330
Saya juga.

04:49.500 --> 04:56.250
Kemudian kita tambahkan di sini dan kemudian di sini kita mulai, kita mengambil ruang tindakan pertama di sini yang merupakan set

04:56.250 --> 04:57.200
tindakan Anda.

04:57.230 --> 05:01.960
Saya mendorong Anda untuk melihat pembukaan di Horrible's untuk melihat cara kerjanya.

05:02.010 --> 05:05.530
Anda tahu untuk memahami cara membuka lingkungan gym bekerja.

05:05.670 --> 05:07.940
Tetapi pada dasarnya ini adalah serangkaian tindakan.

05:08.040 --> 05:14.070
Dan dari serangkaian tindakan ini, kita dapat mengakses sejumlah tindakan di lingkungan dan melakukan data ini

05:14.120 --> 05:15.770
di sini dan kemudian.

05:16.080 --> 05:25.050
Dan itulah jumlah tindakan dan karenanya malapetaka dan ruang tindakan itu akan mengembalikan 7 6:48 karena ada

05:25.050 --> 05:26.550
tujuh tindakan.

05:26.760 --> 05:32.640
Saya tahu bahwa kami dapat melihat enam tindakan di dua lingkungan di halaman pembuka tetapi saya pikir kami juga

05:32.640 --> 05:33.400
dapat menjalankannya.

05:33.490 --> 05:39.000
Dan agar Anda tahu kami dapat bergerak maju bergerak kiri, kanan, kiri, kanan, dan tembak.

05:39.000 --> 05:45.090
Dan selain itu kita dapat menjalankan yang membuat tujuh tindakan baik-baik saja dan hanya itu untuk melakukan lingkungan kita

05:45.330 --> 05:47.010
harus melakukan lingkungan kita.

05:47.040 --> 05:52.640
Kami memiliki sejumlah tindakan sehingga sejauh ini kami memiliki semua yang kami butuhkan untuk otak kami.

05:52.800 --> 05:58.320
Kami kemudian hanya akan membuat objek atau objek otak yang akan kita sebut huruf minimal CNN.

05:58.500 --> 06:04.500
Dan karena fungsi apa pun mengambil sejumlah tindakan sebagai argumen dengan baik, kami akan menempatkan jumlah

06:04.900 --> 06:11.160
tindakan dalam adegan sebagai objek yang akan kita buat dan tentu saja kita akan membuat tubuh dan akhirnya

06:11.160 --> 06:11.690
AI.

06:11.850 --> 06:18.090
Dan itulah mengapa bagian selanjutnya saya akan menyebutnya membangun AI AI karena sekarang kita dapat membangun mata sebanyak

06:18.090 --> 06:19.170
yang kita inginkan.

06:19.170 --> 06:22.070
Itu hal yang luar biasa tentang pemrograman berorientasi objek.

06:22.110 --> 06:24.290
Kita dapat membangun AI apa pun seperti yang kita inginkan.

06:24.320 --> 06:29.820
Jadi kita akan membangun AI kita yang memiliki otak canggih dan itulah yang akan kita

06:29.970 --> 06:31.690
lakukan di tutorial selanjutnya.

06:31.860 --> 06:33.430
Sampai kemudian menikmati AI.