WEBVTT

00:00.420 --> 00:04.730
Halo dan selamat datang di langkah terakhir bagian satu ini membangun.

00:04.860 --> 00:10.500
Sekarang satu-satunya hal yang harus kita lakukan adalah membuat fungsi Ford yang akan menyebarkan sinyal

00:10.500 --> 00:16.650
dari awal ketika otak mendapatkan gambar sampai akhir ketika saya menempatkan tindakan sehingga kita akan membuat

00:16.650 --> 00:22.260
ini Seluruh fungsi dan itu akan menjadi langkah terakhir kita sebelum kita melanjutkan untuk

00:22.260 --> 00:26.710
bagian untuk melatih AI kita dengan kulang convolutional yang mendalam.

00:26.890 --> 00:28.080
Jadi mari kita lakukan ini.

00:28.080 --> 00:34.470
Kita akan mengambil panggilan fungsi yang sebenarnya mirip dengan fungsi init yang merupakan fungsi yang sudah ada

00:34.470 --> 00:38.760
tetapi kali ini kita menggunakannya untuk memanggil beberapa fungsi lainnya.

00:38.790 --> 00:43.170
Yang kami buat sebelumnya karena Anda tahu kami akan menggunakan fungsi maju dari

00:43.290 --> 00:45.490
otak dan fungsi port dari tubuh.

00:45.630 --> 00:50.270
Jadi kami menggunakan fungsi ini sekarang untuk memanggil fungsi-fungsi ini.

00:50.550 --> 00:53.160
Jadi panggilan akan mengambil dua argumen.

00:53.160 --> 00:54.330
Yang pertama adalah diri sendiri.

00:54.330 --> 01:00.220
Tentu saja objek dan argumen kedua yang menurut Anda akan menjadi apa.

01:00.360 --> 01:02.910
Baiklah kita sedang melakukan seluruh propagasi kali ini.

01:02.910 --> 01:08.460
Jadi apa yang ingin kita ambil sebagai input tentu saja gambar input karena tentu saja itulah

01:08.460 --> 01:10.860
titik awal ketika AI bermain game.

01:10.860 --> 01:16.080
Pertama memvisualisasikan gambar-gambar permainan kemudian menyebarkan sinyal di otak dan kemudian

01:16.080 --> 01:17.180
memainkan aksinya.

01:17.190 --> 01:20.130
Oleh karena itu argumen kedua akan menjadi input.

01:20.610 --> 01:24.740
Dan sekarang kita siap untuk membuat seluruh propagasi ini.

01:24.810 --> 01:26.220
Jadi mari kita lakukan ini lagi.

01:26.220 --> 01:31.900
Jadi langkah pertama dimana langkah pertama adalah menerima gambar input dari game.

01:32.190 --> 01:38.010
Dan karena gambar-gambar ini akan memasuki jaringan saraf Nah, Anda dapat membayangkan bahwa kita harus

01:38.010 --> 01:42.840
memformatnya dalam struktur khusus dan struktur ini tentu saja struktur obor.

01:42.840 --> 01:48.420
Jadi hal pertama yang akan terjadi adalah bahwa kita akan mengubah gambar-gambar ini menjadi array

01:48.420 --> 01:55.320
wasit kemudian kita akan mengubahnya menjadi tensor obor dan akhirnya kita akan meletakkan tensor torch di dalam variabel obor

01:55.500 --> 01:58.260
yang akan berisi tensor dan gradien.

01:58.350 --> 02:03.780
Itu untuk grafik dinamis kami untuk menghitung sangat efisien gradien yang nantinya lebih cepat, Kattie hebat

02:03.780 --> 02:04.460
dalam arti.

02:04.620 --> 02:06.200
Jadi itu langkah pertama kami.

02:06.270 --> 02:12.130
Dan setelah kita mendapatkan format gambar yang tepat dengan baik, mereka akan dapat memasuki jaringan saraf

02:12.360 --> 02:16.320
dan kemudian di situlah kita akan melakukan seluruh perambatan sinyal.

02:16.380 --> 02:20.340
Jadi mari kita lakukan ini dulu yang mengubah gambar menjadi format yang tepat.

02:20.430 --> 02:23.050
Jadi gambar kita sangat untuk input.

02:23.220 --> 02:26.780
Sekarang kita akan membuat variabel baru yang saya panggil input.

02:26.820 --> 02:30.470
Jadi itulah input nyata dari jaringan saraf dan input ini.

02:30.510 --> 02:31.760
Di mana itu akan terjadi.

02:31.920 --> 02:34.490
Baiklah, pertama kita perlu mengambil input.

02:34.530 --> 02:36.650
Itu adalah gambar asli kami.

02:36.870 --> 02:42.190
Kemudian seperti yang kami katakan kami ingin mengkonversi gambar-gambar ini menjadi array Nampa.

02:42.330 --> 02:49.260
Jadi untuk melakukan ini kita bisa tidak mengambil yang memiliki shortcut dan kemudian array fungsi.

02:49.500 --> 02:52.850
Jadi kita dimasukkan ke dalam tanda kurung dari array fungsi.

02:52.890 --> 02:53.340
Itu dia.

02:53.340 --> 02:55.940
Sekarang diubah menjadi sesuatu dan oleh array.

02:56.190 --> 03:02.790
Tetapi karena sel-sel array numpad akan mengandung piksel, sebenarnya lebih aman untuk menentukan

03:02.790 --> 03:04.230
tipe float.

03:04.310 --> 03:11.040
Lebih baik memastikan kita memiliki beberapa kendaraan hias saat ini untuk memastikan bahwa kita dapat menggunakan kendaraan hias itu.

03:11.090 --> 03:12.690
Maaf mendengar.

03:12.720 --> 03:15.390
Baiklah jadi sekarang kita masih memiliki wasit.

03:15.540 --> 03:17.330
Tetapi dengan tablet.

03:17.720 --> 03:24.150
Baiklah dan itu juga alasan lain mengapa tensor menurut definisi adalah tipe tunggal.

03:24.270 --> 03:28.060
Jadi kami memilih tipe tunggal untuk menjadi float float 32.

03:28.060 --> 03:28.350
Baiklah.

03:28.350 --> 03:34.440
Sekarang setelah kita meningkatkan non-bio, langkah selanjutnya adalah mengubahnya menjadi sensor kura-kura dan untuk

03:34.440 --> 03:37.990
melakukan ini kita dapat menggunakan misalnya obor

03:38.070 --> 03:45.380
Dan kemudian dari garis bawahi fungsi non-pilot yang akan mengubahnya menjadi sensor obor.

03:45.420 --> 03:46.200
Itu dia.

03:46.210 --> 03:52.320
Dan sekarang langkah terakhir adalah menempatkan sensor obor ini ke dalam variabel obor yang berisi tensor

03:52.320 --> 03:53.230
dan perjanjian.

03:53.400 --> 04:02.010
Dan Anda tahu bagaimana melakukannya tentu saja kami mengambil kelas variabel kami karena sebenarnya semua yang ada di dalam variabel

04:02.010 --> 04:05.530
ini sebenarnya adalah input dari kelas variabel.

04:05.760 --> 04:11.400
Tetapi saya ingin menunjukkannya kepada Anda dengan cara ini karena Anda tahu kami mulai dengan gambar input kami,

04:11.400 --> 04:15.890
kemudian kami mengubahnya menjadi array bernomor kemudian untuk membakar tensor dan kemudian besok.

04:16.170 --> 04:17.220
Dan sekarang kita baik-baik saja.

04:17.220 --> 04:23.370
Mereka diizinkan memasuki jaringan saraf yang pertama adalah mata mata dan kemudian lapisan yang sepenuhnya

04:23.370 --> 04:25.770
terhubung untuk mengarah pada prediksi.

04:26.220 --> 04:30.340
Jadi, berbicara tentang mata, itulah yang akan kita lakukan sekarang.

04:30.480 --> 04:37.280
Kita akan menyebarkan gambar-gambar yang diizinkan ini sekarang ke mata yang melalui tiga

04:37.290 --> 04:38.720
lapisan konvolusional.

04:38.850 --> 04:41.620
Dan untuk melakukan ini, Anda akan melihat bagaimana ini sangat sederhana.

04:41.640 --> 04:46.290
Itu karena kita sudah memiliki otak dalam tubuh kita dari fungsi init.

04:46.320 --> 04:56.190
Kita hanya perlu mengambil otak kita sendiri otak itu dan menerapkan otak ini ke gambar input dan yang akan menyebarkan hal

04:56.190 --> 04:59.830
ke fungsi makanan di sini dari otak.

05:00.430 --> 05:06.190
Itu akan menyebarkan sinyal di dalam otak dan karena fungsi maju otak mengembalikan sinyal

05:06.520 --> 05:13.600
output bahwa neuron dari lapisan output yang mengandung nilai Q Nah input otak ini sendiri akan mengembalikan

05:13.610 --> 05:19.030
sinyal output ini dan oleh karena itu kita akan menempatkan di sini

05:19.090 --> 05:26.120
apakah itu diubah menjadi variabel dan kita akan menyebutnya sangat sederhana mengecoh output ini adalah sinyal output

05:26.120 --> 05:26.690
otak.

05:26.930 --> 05:31.970
Dan sekarang kita memiliki sinyal keluaran otak. Kita harus menyebarkan sinyal keluaran ini ke

05:31.970 --> 05:37.990
tubuh dan untuk melakukan ini kita akan menggunakan fungsi maju kedua dari tubuh dan untuk melakukan ini.

05:38.030 --> 05:46.370
Kita hanya perlu mengambil tubuh kita dan menerapkannya tentu saja keluaran karena fungsi tubuh

05:46.370 --> 05:50.600
Ford mengambil sebagai input sinyal keluaran otak.

05:50.660 --> 05:55.880
Jadi, itulah output yang tepat sekarang dan mengembalikan tindakan.

05:56.000 --> 05:58.080
Dan karena itu mengembalikan tindakan.

05:58.380 --> 06:03.530
Nah di sini kita akan menambahkan tindakan untuk menyebabkan diri yang sangat keluaran.

06:03.920 --> 06:09.380
Baiklah sekarang Anda dapat melihat bahwa dengan sangat sederhana kita menyebarkan sinyal di dalam otak

06:09.380 --> 06:15.410
dan kemudian dari otak ke yang pertama dengan menggunakan fungsi bentuk dari otak yang membawa kita dan

06:15.410 --> 06:19.830
memasukkan gambar input dan kemudian menyebarkannya ke otak mempertahankan nilai-nilai kunci.

06:20.240 --> 06:25.400
Dan kemudian kita menyebarkan sinyal output ini ke tubuh di mana fungsi maju tubuh kita untuk

06:25.520 --> 06:26.900
mendapatkan aksi untuk dimainkan.

06:26.900 --> 06:32.300
Dan sekarang satu-satunya hal yang tersisa yang harus kita lakukan dan itulah baris

06:32.300 --> 06:34.510
terakhir dari kode bagian ini.

06:34.760 --> 06:39.370
Kita harus mengembalikan aksi untuk dimainkan dan itu adalah aksi.

06:39.530 --> 06:45.020
Namun saat ini tindakan harus membakar format dan kita perlu mengubahnya kembali menjadi dengan benar

06:45.260 --> 06:51.660
dan untuk melakukan ini kita akan mengambil struktur data dari tindakan ini dan kemudian menambahkan fungsi non-pilot

06:51.890 --> 06:53.840
dan kemudian kita pergi.

06:53.840 --> 06:56.780
Sekarang kami memiliki tindakan yang kami putar dalam format yang tepat.

06:56.780 --> 06:58.040
Jadi selamat.

06:58.040 --> 07:00.660
Kita sekarang selesai dengan bagian pertama ini 1.

07:00.770 --> 07:03.410
Kami membangun AI dalam tiga langkah.

07:03.410 --> 07:06.860
Pertama kita buat otak, kedua kita buat tubuh.

07:06.860 --> 07:13.430
Dan ketiga kita mengumpulkan otak di dalam tubuh dan kita menyebarkan seluruh sinyal dari mata ke

07:13.430 --> 07:15.130
saat kita memainkan aksinya.

07:15.560 --> 07:17.100
Jadi itu langkah pertama yang dilakukan.

07:17.120 --> 07:22.200
Itu adalah langkah besar tetapi sekarang karena Anda mengerti kami membangun AI AI tetapi itu masih bodoh.

07:22.220 --> 07:24.110
Kita perlu melatihnya untuk menjadi cerdas.

07:24.170 --> 07:29.030
Jadi kita perlu melatihnya untuk melakukan apa yang kita inginkan dan untuk melakukan ini kita akan menggunakan

07:29.030 --> 07:34.100
kata harus melakukan lingkungan yang Anda tahu karena itu belajar dari dunia dengan diperkuat ketika mendapat hadiah yang

07:34.100 --> 07:34.690
baik.

07:34.760 --> 07:40.610
Dan dengan dihukum atau dilemahkan ketika itu mendapatkan kata yang buruk di situlah pembelajaran isyarat akan

07:40.610 --> 07:41.670
ikut bermain.

07:41.690 --> 07:47.510
Dan itulah yang akan kita lakukan di bagian ini untuk melatih mata dengan pembelajaran Q konvolusional yang mendalam.

07:47.510 --> 07:50.270
Saya tidak sabar untuk memulai dan sampai saat itu.