WEBVTT

00:00.330 --> 00:02.320
Halo dan selamat datang di ceritanya.

00:02.460 --> 00:09.240
Baiklah, setelah kita membuat empat konvolusi dan LCN ini, kita sekarang memiliki status yang dikodekan yang akan menjadi

00:09.240 --> 00:14.500
input dari dua jaringan saraf yang akan kita buat untuk aktor dan kritikus.

00:14.790 --> 00:20.730
Dan berbicara tentang mereka, satu-satunya hal yang harus kita lakukan sekarang hanyalah membuat alat dalam koneksi penuh kita.

00:20.730 --> 00:22.880
Satu untuk aktor dan satu untuk kritik.

00:23.190 --> 00:27.260
Tetapi sebelum kita melakukan itu kita perlu mendapatkan sejumlah tindakan yang mungkin.

00:27.290 --> 00:32.520
Jadi saya akan memanggil Anda variabel di sini yang tidak akan menjadi variabel objek.

00:32.520 --> 00:38.970
Jadi saya tidak akan menggunakan diri saya di sini tapi saya akan membuat keluaran yang layak yang akan mewakili

00:38.970 --> 00:41.610
sejumlah tindakan yang mungkin dan untuk mendapatkannya.

00:41.760 --> 00:44.520
Kita bisa mendapatkannya dari ruang aksi.

00:44.520 --> 00:51.330
Jadi kita mengambil ruang tindakan kita yang akan menjadi input dari fungsi ketika kita membuat objek.

00:51.510 --> 00:56.300
Dan kemudian kita tambahkan itu dan untuk mendapatkan jumlah tindakan yang mungkin ini.

00:56.580 --> 01:03.180
Dan sekarang aktor dan kritikus akan mengambil secara terpisah input yang sama yang merupakan output dari seluruh

01:03.180 --> 01:06.290
proses ini di sini dengan konvolusi dan GLSEN.

01:06.500 --> 01:12.900
Jadi itu akan mengambil input yang sama yang merupakan keadaan disandikan tetapi kemudian mereka akan memiliki dua koneksi linier

01:13.110 --> 01:19.000
yang berbeda sehingga kita akhirnya mendapatkan sebenarnya dua jaringan saraf satu untuk dua dan satu untuk kritik.

01:19.020 --> 01:21.030
Jadi mari kita buat dua jaringan saraf yang terpisah ini.

01:21.060 --> 01:27.360
Tapi karena kita sudah melakukan pekerjaan besar dengan pengkodean di sini dengan baik apa yang perlu kita lakukan

01:27.360 --> 01:33.640
hanyalah membuat dua objek satu dalam koneksi penuh untuk aktor dan satu koneksi linear lainnya untuk kritik.

01:33.660 --> 01:35.430
Dan itulah yang akan saya lakukan.

01:35.490 --> 01:42.560
Saya akan membuat dua objek sekarang menjadi objek pertama untuk koneksi linear dari kritik

01:42.570 --> 01:49.210
yang saya sebut kritik dan skor Linnie dan untuk membuat koneksi linear ini.

01:49.380 --> 01:55.020
Anda tahu bagaimana melakukannya, kita hanya perlu mengambil modul mesin dan kemudian kelas linear yang kita punya

01:55.020 --> 01:55.800
dua input.

01:55.880 --> 02:01.800
Baik neuron input yang merupakan output dari semua ini termasuk di sini dengan

02:01.910 --> 02:05.190
konvolusi dan GM yaitu 256 neuron.

02:05.190 --> 02:12.120
Jadi, ketika saya menempatkan dua ratus lima puluh enam di sini dan kemudian kita akan memiliki satu output karena ingat

02:12.210 --> 02:17.940
output dari jaringan saraf untuk kritik adalah nilai fungsi yang diterapkan pada keadaan input ke input

02:18.080 --> 02:20.960
yang dikodekan menyatakan bahwa kita membuat sini.

02:21.180 --> 02:28.680
Jadi jika kita menyebut keadaan input yaitu output dari semua sumur ini, output dari jaringan saraf kritik akan

02:28.680 --> 02:32.530
menjadi VS dan karena itu memiliki satu dimensi.

02:32.550 --> 02:33.710
Itu hanya sebuah nilai.

02:33.870 --> 02:36.320
Dan di sini kita menempatkan satu.

02:36.510 --> 02:43.020
Dan ingat ini adalah apa yang dibagikan di antara para aktor sehingga mereka bisa mendapatkan beberapa informasi umum yang dapat mereka

02:43.020 --> 02:46.590
gunakan untuk memainkan aksi mereka dengan cara yang lebih relevan.

02:46.980 --> 02:50.430
OK jadi itu untuk jaringan saraf kritikus.

02:50.580 --> 02:59.820
Dan sekarang mari kita membuat jaringan baru dari aktor dan oleh karena itu saya di sini aktor otodidak linear dan sama

02:59.850 --> 03:02.830
kita sudah memiliki input Amerika Serikat.

03:02.850 --> 03:08.430
Jadi sekarang kita hanya perlu menambahkan koneksi linier dan oleh karena itu mengatakan

03:08.430 --> 03:15.870
kita mengambil modul kemudian kelas linear dan sekarang mengatakan ini jaringan aktor baru akan mengambil negara yang dikodekan

03:15.870 --> 03:19.840
yang memiliki ukuran 256 jadi 256 di sini.

03:20.070 --> 03:26.010
Tetapi kemudian output akan berbeda karena tentu saja Anda tahu bahwa output dari jaringan

03:26.010 --> 03:30.790
saraf untuk aktor kunci lainnya melibatkan nilai-nilai kunci dari status input.

03:30.860 --> 03:33.620
Yang bisa kami dengar dan pelat aksi.

03:33.810 --> 03:40.980
Jadi sekali lagi jika kita menyebut negara yang disandikan ini yang kami maksud di sini sebagai suatu aksi yang memainkan output

03:40.980 --> 03:44.480
dari jaringan saraf ini sebenarnya akan ada q sebagai a.

03:44.880 --> 03:50.010
Dan karena Anda tahu kami memiliki satu nilai besar untuk setiap tindakan maka dari itu kami tidak memiliki hasil.

03:50.010 --> 03:57.680
Nilai Q dan karenanya output di sini akan menjadi non output karena tidak ada output

03:57.680 --> 03:59.380
sebenarnya jumlah manusia.

03:59.840 --> 04:01.100
Oke, sempurna.

04:01.130 --> 04:05.360
Jadi jika Anda mau, saya bisa menulis untuk Anda output di sini.

04:05.390 --> 04:18.410
Pengkritiknya adalah yang baik dan juga negara yang disandikan dan untuk aktor hasilnya lucu juga.

04:18.410 --> 04:23.750
Jadi itu sangat penting untuk memahami perbedaan ini di sini dan untuk memahami bahwa kami memiliki

04:23.900 --> 04:25.370
dua jaringan berita terpisah.

04:25.370 --> 04:29.370
Satu untuk kritik dan satu untuk aktor Oke sempurna.

04:29.380 --> 04:32.080
Jadi kita hampir selesai dengan fungsi ini.

04:32.170 --> 04:33.920
Sekarang hal yang paling penting dilakukan.

04:34.030 --> 04:39.370
Satu-satunya hal yang tersisa yang harus kita lakukan adalah menginisialisasi semua bobot dari dua jaringan saraf

04:39.790 --> 04:40.830
dan semua bias.

04:40.860 --> 04:45.800
Dan tentu saja untuk melakukan itu kita akan menggunakan dua fungsi yang kita buat sebelumnya

04:45.900 --> 04:48.480
yaitu kolom penginisialisasi dan bobot di dalamnya.

04:48.490 --> 04:49.720
Jadi mari kita lakukan dengan cepat.

04:49.870 --> 04:52.180
Ini akan menjadi sangat mudah dan sangat cepat.

04:52.180 --> 04:56.590
Jadi pertama-tama kita akan menginisialisasi beberapa bobot acak dan untuk melakukan ini kita akan menerapkan fungsi

04:56.590 --> 04:58.420
bobot di dalamnya untuk objek kita.

04:58.420 --> 05:03.150
Jadi di sini kita harus mengambil diri untuk mendapatkan objek dan objek.

05:03.160 --> 05:06.440
Kami menerapkan bobot dalam fungsinya.

05:06.620 --> 05:14.200
Oleh karena itu di dalam kita hanya perlu meletakkan bobot dalam fungsi itu dan kemudian kita dapatkan yang akan menerapkan fungsi ini

05:14.200 --> 05:20.080
pada objek kita dan dengan melakukan ini kita hanya menginisialisasi beberapa bobot acak untuk mendapatkan pembelajaran optimal

05:20.140 --> 05:21.930
bobot di masa depan.

05:22.000 --> 05:27.460
Dan sekarang yang harus kita lakukan adalah membuat normalisasi khusus untuk aktor dan kritikus.

05:27.670 --> 05:33.700
Tapi ingat saya pikir saya mengatakan ini dalam tutorial sebelumnya kita tidak akan menetapkan varian yang sama

05:33.780 --> 05:38.890
untuk X di yakked akrilik Anda akan mendapatkan standar deviasi kecil varians kecil.

05:38.890 --> 05:40.840
Dan para kritikus akan mendapatkan yang besar.

05:40.840 --> 05:41.800
Dan mengapa kita melakukan ini.

05:41.800 --> 05:47.560
Apa tujuan dari memberikan standar deviasi kecil dari bobot untuk aktor dan standar deviasi

05:47.560 --> 05:49.320
yang besar untuk kritik.

05:49.510 --> 05:53.830
Nah itu memungkinkan mengelola untuk menangani eksplorasi vs eksploitasi.

05:53.830 --> 05:58.620
Itulah tujuan melakukan hal ini dengan memberikan sedikit variasi kepada aktor dalam audiensi yang lebih luas

05:58.630 --> 05:59.460
untuk dikritik.

05:59.490 --> 06:04.510
Kami akan memiliki manajemen eksplorasi dan eksploitasi yang baik.

06:04.600 --> 06:07.510
Jadi mari kita lakukan ini, mari kita jaga aktornya dulu.

06:07.510 --> 06:14.170
Jadi kita ambil sendiri atau objek maka kita akan mengambil jaringan saraf aktor kita yaitu aktor

06:14.270 --> 06:20.350
Linnea lalu kita akan mengakses bobot jaringan aktor baru ini dan ingat untuk mengakses data

06:20.350 --> 06:23.360
bobot yang kita butuhkan data itu.

06:23.410 --> 06:24.280
Baiklah.

06:24.280 --> 06:31.000
Jadi dengan ini kita mendapatkan bobot dan sekarang kita akan menggunakan fungsi initialiser sis dinormalisasi kami.

06:31.390 --> 06:36.520
Jadi saya menyalin pasta ini di sini dan kita akan memasukkan argumen.

06:36.520 --> 06:38.810
Deviasi standar yang kita inginkan memiliki bobot ini.

06:39.160 --> 06:42.130
Tetapi pertama-tama ingatlah bahwa fungsi ini membutuhkan dua argumen.

06:42.200 --> 06:45.280
Pertama cara kita ingin menginisialisasi.

06:45.280 --> 06:49.750
Jadi kita hanya perlu mengambilnya lagi dan mendasarkannya di sini.

06:49.870 --> 06:53.010
Dan argumen kedua adalah standar deviasi.

06:53.170 --> 06:54.420
Kami ingin memiliki bobot ini.

06:54.580 --> 07:02.880
Jadi seperti yang kami katakan kami ingin standar deviasi kecil untuk aktor dalam yang kecil itu akan menjadi 0. 01 sempurna.

07:02.890 --> 07:05.880
Jadi di situlah bobot jaringan syaraf aktor.

07:05.900 --> 07:09.610
Sekarang mari kita berhati-hati terhadap bias dari karya aktor baru itu.

07:09.850 --> 07:15.460
Dan oleh karena itu di sini kita akan melakukan hal yang hampir sama dengan menyalin salinan yang di bawah ini.

07:15.520 --> 07:26.470
Ganti bobot dengan pembeli untuk mengakses pembeli dan setelah data, kami hanya akan menambahkan isian dan ingat di dalamnya ketika diletakkan nol

07:26.560 --> 07:31.170
karena kami ingin semua perangkat diinisialisasi dengan nol.

07:31.510 --> 07:37.840
Jadi sebenarnya saya tidak berpikir baris ini diperlukan karena seperti yang Anda ingat pembeli sudah diinisialisasi ke

07:37.840 --> 07:41.400
nol dengan fungsi isian ini dalam fungsi menunggu.

07:41.620 --> 07:47.560
Jadi, Anda tahu kami melakukan ini hanya untuk memastikan bahwa pembeli benar-benar diinisialisasi ke nol.

07:47.560 --> 07:49.490
Tapi saya pikir itu sudah dilakukan di sini.

07:49.690 --> 07:52.720
Tapi toh sekarang kami yakin 100 persen.

07:53.050 --> 07:55.990
Baiklah sekarang kita akan melakukan hal yang sama untuk kritik.

07:56.050 --> 07:59.660
Jadi mari kita menjadi efisien dan mari kita bahas dua baris ini.

08:00.220 --> 08:07.180
Mari kita hadapi mereka di sini dan di sini kita hanya akan mengganti aktor dengan kritik.

08:07.180 --> 08:08.400
Sama disini.

08:08.540 --> 08:13.600
Dan sekarang satu-satunya hal yang harus kita ubah hanyalah standar deviasi yang kita inginkan dari bobot

08:13.600 --> 08:15.680
jaringan saraf untuk dimiliki oleh pengkritik.

08:15.970 --> 08:23.310
Dan seperti yang Anda ingat, kali ini deviasi standar yang besar alih-alih terbuka atau yang kita masukkan satu

08:23.830 --> 08:29.680
sehingga kita pergi kita memiliki deviasi standar kecil untuk bobot pekerjaan baru aktor dan deviasi

08:29.680 --> 08:31.610
standar besar untuk bobot.

08:31.630 --> 08:33.290
Dan kemudian ketika kita sampai pada kritik.

08:33.370 --> 08:37.560
Dan tentu saja itu adalah sesuatu yang kita dapat ganti aktif di sini dengan kredit.

08:37.980 --> 08:40.460
Baiklah sekarang kita menjadi keren.

08:40.510 --> 08:46.300
Jadi sekarang kita memiliki dua hal yang tersisa untuk dilakukan pertama adalah menginisialisasi juga bias tim dan untuk melakukan ini kita mengambil objek kita sendiri karena LACMA

08:46.300 --> 08:53.500
milik objek kita dan kita akan mengatakan atau sebagai T. N. lalu itu dan kemudian

08:53.870 --> 08:57.980
kita akan mendapatkan dua jenis pembeli yang terakhir.

08:58.180 --> 09:04.650
Itu bias dan skor berdasarkan usia dan yang lainnya didasarkan pada usia skor skor.

09:04.660 --> 09:09.880
Itulah dua jenis bias dalam CME dan sama akan diinisialisasi ke nol.

09:09.880 --> 09:18.810
Jadi pertama-tama kita mengakses data dan kemudian kita menggunakan fungsi garis bawah isian untuk mengisi semua pembeli ini

09:18.850 --> 09:21.940
dengan nol menginisialisasi mereka dengan milikmu.

09:21.940 --> 09:22.320
Kanan.

09:22.360 --> 09:31.500
Dan sekarang untuk kelompok pembeli kedua, kami di sini dapat diganti oleh usia demi usia.

09:31.500 --> 09:32.430
Baiklah.

09:32.570 --> 09:39.560
Itulah yang memulai bias dari nol dan sekarang hal terakhir yang perlu kita lakukan adalah menggunakan metode yang

09:39.560 --> 09:43.090
diwarisi dari akhir dan modul itu adalah metode kereta.

09:43.220 --> 09:47.360
Dan pada dasarnya hanya ada metode yang menempatkan modul dalam perawatan.

09:47.540 --> 09:48.760
Jadi apa gunanya itu.

09:48.890 --> 09:55.440
Yah penggunaannya adalah memungkinkan untuk mengaktifkan jika ada putus di ligasi kamar mandi.

09:55.550 --> 10:03.100
Dan untuk menggunakannya, kami hanya menambahkan kereta pikiran sendiri dan menempatkan modul dalam trammeled sempurna.

10:03.170 --> 10:05.650
Jadi kita sudah selesai dengan fungsi init.

10:05.720 --> 10:11.210
Kami memiliki konvolusi kami, kami memiliki CME. Kami memiliki dua jaringan saraf terpisah untuk kritik

10:11.210 --> 10:15.400
dan aktor dan semua bobot dan bias diinisialisasi dengan baik.

10:15.620 --> 10:16.940
Jadi itu semua baik.

10:16.940 --> 10:21.860
Kami siap untuk melanjutkan ke langkah berikutnya yaitu membuat fungsi maju yang tentu

10:21.890 --> 10:27.230
saja akan maju menyebarkan sinyal dari awal dengan gambar input asli di seluruh otak sampai

10:27.230 --> 10:28.640
kami mendapatkan output.

10:29.000 --> 10:30.770
Jadi mari kita lakukan di tutorial selanjutnya.

10:30.800 --> 10:32.330
Dan sampai saat itu nikmati AI.