WEBVTT

00:00.450 --> 00:05.400
Halo dan selamat datang di jalur ini ke Torro sekarang kita akan membuat

00:05.400 --> 00:11.040
fungsi maju yang akan meneruskan menyebarkan sinyal melalui semua otak dari awal dengan gambar input hingga

00:11.130 --> 00:16.860
output yang akan berisi nilai-nilai kunci untuk aktor dan de-value yaitu nilai yang diambil oleh fungsi

00:17.040 --> 00:17.950
untuk kritik.

00:18.240 --> 00:23.820
Jadi itu akan sangat mirip dengan apa yang kami lakukan untuk Dume tetapi kali ini sesuatu akan berubah.

00:23.880 --> 00:25.550
Mengubah akan mengubah itu.

00:25.560 --> 00:27.510
Sekarang kita punya ilustrasi di otak.

00:27.510 --> 00:32.470
Jadi kita semua harus melakukan sesuatu yang lebih untuk menyebarkan sinyal dan berhati-hati dengan itu.

00:32.850 --> 00:38.280
Dan hal lain yang kurang penting tetapi perubahan yang dibandingkan dengan sebelumnya adalah

00:38.280 --> 00:44.220
bahwa kita tidak akan menggunakan fungsi aktivasi nyata seperti yang Anda tahu fungsi aktivasi

00:44.220 --> 00:48.880
nonlinear tetapi kita akan menggunakan toilet yang agak canggih fungsi.

00:48.980 --> 00:51.390
Anda akan melihat bahwa di masa lalu kita berbicara tentang mentasi.

00:51.780 --> 00:55.970
Jadi mari kita lakukan ini, mari kita buat fungsi ini kita mulai dengan kematian.

00:56.040 --> 00:59.190
Ini sebenarnya fungsi terakhir dari kelas yang dieksekusi ini.

00:59.280 --> 01:06.900
Jadi kita akan menyebutnya maju seperti Einstein dan fungsi keempat ini akan mengambil sendiri objek karena

01:06.900 --> 01:09.930
kita akan menggunakan objek dan input.

01:10.170 --> 01:13.520
Sangat penting untuk memahami apa yang akan menjadi input ini.

01:13.590 --> 01:19.170
Ini tidak hanya akan menjadi gambar input input ini juga akan berisi node tersembunyi dan

01:19.170 --> 01:20.980
node sel yang sama.

01:21.090 --> 01:25.120
Jadi itu sebabnya saya ingin menyoroti bahwa beberapa hal akan berubah sekarang.

01:25.180 --> 01:30.820
Pada dasarnya kami mempertimbangkan fungsi penerusan Internet dan sel node dari daftar.

01:31.200 --> 01:38.900
Dan berbicara tentang mereka sekarang apa yang akan kita lakukan adalah memisahkan kedua masukan dari argumen ini dalam mengedepankan fungsi

01:38.900 --> 01:41.540
dan bagaimana kita dapat memisahkan mereka.

01:41.700 --> 01:46.160
Yah kita bisa mengingat Voivode baru yang akan menjadi input gambar.

01:46.230 --> 01:55.620
Jadi itulah gambar input yang dirancang dan kami memisahkannya dengan menjatuhkan H x dan C X yang merupakan kuil

01:55.620 --> 01:59.090
negara tersembunyi dan negara sel di Coliseum.

01:59.370 --> 02:04.470
Jadi H x negara bagian lain dan C X adalah negara bagian Selatan.

02:04.540 --> 02:09.580
Baiklah dan itu akan sama dengan input yang menjadi argumen di sini.

02:09.580 --> 02:14.950
Jadi sekarang kita membuat pemisahan itu dan oleh karena itu kita dapat mulai menyebarkan

02:15.220 --> 02:21.400
sinyal ke seluruh otak dan untuk itu kita akan mendapatkan lapisan yang berbeda berturut-turut dari yang

02:21.700 --> 02:28.690
pertama ke yang terakhir dengan menggunakan koneksi kita yang merupakan konvolusi dari koneksi LACMA dan koneksi linier di

02:29.020 --> 02:30.300
sini koneksi penuh.

02:30.490 --> 02:31.400
Jadi mari kita lakukan ini.

02:31.450 --> 02:33.620
Sekarang akan sama seperti sebelumnya.

02:33.750 --> 02:40.420
Kita akan mendapatkan lapisan pertama kita yang akan kita panggil X dan mendapatkan lapisan pertama ini kita perlu

02:40.510 --> 02:46.240
menyebarkan sinyal dari input ke lapisan pertama ini dan karena itu kita perlu menggunakan konvolusi pertama

02:46.240 --> 02:51.770
karena ini adalah konvolusi pertama yang menyebarkan sinyal dari gambar input ke lapisan pertama.

02:52.030 --> 02:58.450
Jadi yang akan kita lakukan sekarang adalah menyalin ini karena ini adalah lilitan pertama yang kami miliki di

02:58.450 --> 03:06.100
sini dan kami menerapkan lilitan pertama ini ke gambar input kami yang sekarang merupakan input yang tepat dan yang kami dapatkan

03:06.100 --> 03:09.560
yang menyebarkan sinyal dari gambar input ke lapisan pertama.

03:09.820 --> 03:16.390
Tapi sekarang ingat kita harus menggunakan fungsi aktivasi nonlinear untuk memecah linearitas agar dapat mempelajari hubungan

03:16.390 --> 03:23.170
non-linear di dalam gambar dan untuk melakukan ini kita akan menggunakan seperti yang kita katakan fungsi

03:23.500 --> 03:28.050
aktivasi yang akan lihat sekarang dan itu dengan sentuhan macet.

03:28.180 --> 03:30.110
Tapi sebelum itu mari kita dapatkan.

03:30.130 --> 03:36.430
Jadi untuk mendapatkannya rasanya benar-benar kita mengambil modul fungsional yang memiliki jalan pintas dan

03:36.490 --> 03:45.790
kemudian itu dan kemudian loop dan kemudian kita meletakkan semua ini dalam tanda kurung karena kita ingin mengaktifkan neuron secara nonlinier.

03:45.880 --> 03:51.160
Lapisan pertama ini yang kami dapatkan dengan menerapkan konvolusi pertama pada input.

03:51.160 --> 03:55.310
Jadi sekarang mari kita pergi ke obor PI Doug untuk memahami apa itu.

03:55.360 --> 03:56.110
Ini dia.

03:56.200 --> 04:00.320
Jadi Anda bisa mengaksesnya dengan obor yang macet atau garis miring.

04:00.340 --> 04:06.940
Dan kemudian HG dan L dan kemudian Anda harus menemukan aktivasi non-linear dan kemudian fungsi aktivasi nonlinier Anda

04:06.940 --> 04:08.080
akan temukan.

04:08.170 --> 04:14.040
Ya benar itu klasik ketika kita tahu itu hanya maksimal nol dan X Anda memiliki grafik dalam pikiran.

04:14.260 --> 04:17.160
Maka Anda memiliki enam yang ini.

04:17.160 --> 04:19.350
Jadi sedikit lebih canggih.

04:19.570 --> 04:21.190
Dan kemudian kita pergi, kita melihat.

04:21.550 --> 04:26.470
Dan seperti yang Anda lihat biru adalah redo plus elemen tambahan.

04:26.620 --> 04:29.280
Jadi rasanya lebih canggih kok.

04:29.340 --> 04:34.180
Dan itulah yang kami gunakan untuk mengaktifkan neuron dan lapisan yang berbeda secara nonlinier.

04:34.180 --> 04:39.420
Dan omong-omong fungsi aktivasi baru ini disebut eksponensial di unit mereka.

04:39.490 --> 04:40.250
Jadi begitulah.

04:40.270 --> 04:44.230
Kami menerapkan elu pada lapisan konvolusional pertama.

04:44.470 --> 04:46.300
Dan sekarang segalanya akan mudah.

04:46.370 --> 04:52.270
Kita akan melanjutkan ke propagasi berikutnya untuk sinyal yang dari lapisan konvolusional pertama ke

04:52.270 --> 04:59.440
lapisan konvolusional kedua yang akan kita sebut X karena pada dasarnya kita hanya menambahkan X sekarang x

04:59.470 --> 05:02.190
adalah konvolusional pertama di sana.

05:02.290 --> 05:07.990
Dan dengan menyebarkan sinyal dari lapisan konvolusional pertama ke X berikutnya akan menjadi lapisan

05:07.990 --> 05:09.190
convolutional berikutnya.

05:09.520 --> 05:15.130
Jadi untuk menyebarkan sinyal dari lapisan konvolusional pertama ke yang kedua kita tidak bisa

05:15.220 --> 05:20.490
begitu saja menyalin ini dan menempelkannya di sini dan mengganti satu per dua.

05:20.510 --> 05:27.340
Dan sekarang tentu saja konvolusi kedua tidak diterapkan pada gambar input tetapi pada X yang merupakan lapisan konvolusional

05:27.340 --> 05:29.530
pertama yang ada di sini.

05:29.830 --> 05:30.790
Baiklah, sempurna.

05:30.790 --> 05:32.800
Sekarang kita mendapatkan convolutional kedua kita di sana.

05:33.010 --> 05:38.230
Dan sekarang mari kita menyebarkan sinyal lagi dari konvolusional kedua ke yang ketiga.

05:38.230 --> 05:46.000
Dan karena itu kita dapat langsung menyalin ini dan menempelkannya di sini dan mengganti dua dengan tiga.

05:46.000 --> 05:46.840
Itu dia.

05:46.990 --> 05:47.900
Dan yang terakhir.

05:47.920 --> 05:53.770
Sekarang untuk menyebarkan sinyal dari konvolusional ketiga di sana ke yang keempat dan yang terakhir kita

05:53.770 --> 05:58.770
tinggal menyalin ini lagi di sini dan ganti tiga dengan datang empat.

05:58.840 --> 05:59.790
Itu dia.

06:00.220 --> 06:01.870
Jadi mari kita rekap.

06:01.870 --> 06:03.310
Kami mulai dengan masukan kami.

06:03.460 --> 06:07.170
Kami menerapkan konvolusi pertama untuk mendapatkan konvolusi pertama di sana.

06:07.360 --> 06:12.130
Kemudian kita menerapkan konvolusi kedua ke lapisan konvolusi pertama untuk mendapatkan lapisan konvolusional

06:12.130 --> 06:12.850
kedua.

06:12.970 --> 06:17.830
Kemudian kita menerapkan konvolusi ketiga ini ke konvolusional kedua di sana untuk mendapatkan lapisan konvolusional

06:17.830 --> 06:18.510
ketiga.

06:18.550 --> 06:24.650
Dan akhirnya kami menerapkan konvolusi keempat ke konvolusional ketiga di sana untuk mendapatkan konvolusi keempat di

06:24.650 --> 06:25.180
sana.

06:25.510 --> 06:29.900
Dan itulah bagaimana sinyal disebarkan ke seluruh mata.

06:30.130 --> 06:35.620
Jadi begitulah kita sekarang memiliki sinyal output setelah empat konvolusi dan sekarang kita tahu apa

06:35.620 --> 06:40.790
yang harus dilakukan kita perlu memperluas seluruh sinyal output ini dalam vektor satu dimensi.

06:40.900 --> 06:42.640
Itu langkah mendatar.

06:42.880 --> 06:45.440
Jadi kita akan memperbarui x lagi x.

06:45.490 --> 06:49.010
Sekarang akan menjadi vektor satu dimensi yang rata ini.

06:49.230 --> 06:57.070
Dan untuk melakukan ini itu sama kita perlu mengambil X yang sejauh ini adalah lapisan konvolusional keempat X tetapi kemudian

06:57.520 --> 07:05.660
kita menggunakan fungsi view dan pertama-tama kita menempatkan minus satu untuk mengatakan bahwa kita ingin satu vektor dimensi dan kemudian sebagai

07:05.660 --> 07:11.810
argumen kedua kita perlu untuk menempatkan jumlah elemen dalam vektor dan itu ingat tiga dua

07:11.880 --> 07:13.560
kali tiga kali tiga.

07:13.670 --> 07:20.270
Dan karena itu kita dapat menempatkan di sini 32 kali tiga kali tiga.

07:20.270 --> 07:20.720
Itu dia.

07:20.720 --> 07:24.570
Sekarang kita memiliki vektor rata dan langkah mendatarnya selesai.

07:24.680 --> 07:25.580
Sempurna.

07:25.580 --> 07:28.030
Sekarang mari kita urus bagian LCN.

07:28.280 --> 07:33.030
Jadi seperti yang Anda pahami, LSD mengambil input vektor yang diratakan.

07:33.200 --> 07:37.190
Ini vektor satu dimensi dari tiga dua kali tiga kali tiga elemen.

07:37.190 --> 07:40.310
Jadi sudah siap dan disiapkan untuk ICN.

07:40.320 --> 07:49.070
Tim sekarang siap untuk mengambil vektor Flaten ini sebagai input dan oleh karena itu kita dapat mengambil LACMA dan input

07:49.190 --> 07:52.010
kita sebagai argumen pertama X siap.

07:52.010 --> 07:55.960
FLATOW Dan vektor x ray di sini yang baru saja kita kembangkan.

07:56.270 --> 08:00.810
Tetapi juga dan di sanalah masalahnya muncul.

08:00.890 --> 08:04.540
Kita harus meletakkan H x dan z x.

08:04.550 --> 08:10.820
Dan kita dapat menggunakan ha-Setan lihat X di sini karena kita membuat pemisahan dari argumen input

08:11.060 --> 08:12.980
asli dari fungsi forward.

08:12.980 --> 08:20.460
Jadi LACMA X vektor output platens setelah empat konvolusi dan semua yang tersembunyi dalam catatan sel.

08:20.480 --> 08:21.390
Jadi begitulah.

08:21.440 --> 08:27.530
Maka kita tidak boleh lupa diri karena LSD adalah variabel atau fungsi sehingga variabel yang

08:27.530 --> 08:35.210
melekat pada objek itu sendiri dan CM dan ini benar-benar akan kembali ke output total dua output yang akan

08:35.210 --> 08:37.850
menjadi node output dan output suara.

08:37.880 --> 08:42.250
Jadi itu sebenarnya topikal dan karena itu kami dapat memperbarui H.

08:42.260 --> 08:48.890
X y dan z x node sel karena itulah output dari NCM ini di sini.

08:50.030 --> 08:50.500
Besar.

08:50.510 --> 08:52.750
Jadi kita hampir selesai sekarang.

08:52.790 --> 08:58.850
Sekarang setelah kita memiliki output ilustrasi, kita perlu mendapatkan output yang berguna karena sebenarnya

08:58.850 --> 09:05.570
hanya note yang tersembunyi yang berguna dan oleh karena itu kita akan mendapatkannya pada saat itu X

09:05.570 --> 09:12.490
lagi dan X sekarang akan sama dengan atax elemen pertama dari sampel output AS dan X sama dengan.

09:12.680 --> 09:14.270
Dan kita hampir selesai.

09:14.270 --> 09:18.590
Ingatlah bahwa kita memiliki dua otak, satu otak untuk aktor di satu ruangan untuk kritik.

09:18.860 --> 09:24.380
Dan oleh karena itu kita harus mengeluarkan sinyal untuk mengembalikan sinyal keluaran aktor dan sinyal

09:24.380 --> 09:25.480
keluaran kritik.

09:25.580 --> 09:30.730
Dan karena itu sekarang apa yang akan kita lakukan adalah mengembalikan kedua sinyal keluaran ini dan bagaimana kita dapat melakukannya.

09:30.830 --> 09:32.010
Ya itu sangat mudah.

09:32.030 --> 09:38.690
Kita hanya perlu mengambil koneksi linier kita tetapi secara terpisah itu adalah koneksi linier kritik

09:38.770 --> 09:40.740
dan koneksi penuh aktor.

09:41.180 --> 09:47.870
Dan kami menerapkan masing-masing koneksi ini ke output X yang merupakan output berguna dari LACMA dan hanya

09:47.870 --> 09:50.470
itu yang akan menjadi sinyal output.

09:50.480 --> 09:50.990
Jadi begitulah.

09:50.990 --> 09:51.840
Ayo lakukan.

09:51.900 --> 09:59.660
Pertama-tama kita mengambil diri atau objek kemudian kita mendapatkan koneksi linier dari kritik yang merupakan kritik dan colinear ini

09:59.690 --> 10:08.090
yang kita terapkan pada X sinyal keluaran CM dan kemudian sama kita mengambil diri lagi lalu itu dan kemudian kita

10:08.090 --> 10:15.290
mengambil koneksi linear aktor yang merupakan aktor dan kolinearnya adalah yang sama dengan yang kita terapkan

10:15.290 --> 10:16.200
pada x.

10:16.310 --> 10:19.580
Kita mulai jadi itulah hal utama yang kita butuhkan.

10:19.710 --> 10:26.040
Tapi kemudian kita juga akan mengembalikan bagian atas Ajax ke node dan melihat X untuk menjual node karena

10:26.040 --> 10:29.490
kita akan menggunakannya nanti dan tampilan retro dari LCN.

10:29.520 --> 10:30.430
Baiklah, sempurna.

10:30.480 --> 10:32.960
Jadi sekarang kita sudah selesai dengan otak.

10:32.970 --> 10:38.040
Atau haruskah saya mengatakan otaknya karena kami sebenarnya membuat dua otak satu untuk aktor dan satu kritikus.

10:38.250 --> 10:41.990
Jadi selamat untuk yang kedelapan dengan otak.

10:42.180 --> 10:47.940
Saya harap itu tidak terlalu sulit untuk digabungkan di CNN dan di Anniston tetapi setidaknya kabar baiknya adalah

10:47.940 --> 10:51.190
bahwa kita benar-benar bekerja dengan model terbaik dan paling kuat.

10:51.300 --> 10:53.010
Jadi begitulah.

10:53.010 --> 10:55.950
Kami sebenarnya sudah selesai dengan model keluarga pertama ini itu.

10:56.010 --> 10:56.810
Y.

10:56.880 --> 11:02.040
Jadi dalam dua toile berikutnya kami akan mengurus optimizer karena kami akan membuat

11:02.190 --> 11:03.300
optimizer terpisah.

11:03.300 --> 11:08.850
Kami tidak akan memotong setiap baris kode karena banyak yang berasal dari makalah penelitian dan

11:08.850 --> 11:10.520
ini sebenarnya cukup spesifik.

11:10.530 --> 11:16.470
Dan jika kita masuk ke detail mendalam tentang apa yang terjadi dengan optimizer ini, ini mungkin

11:16.470 --> 11:22.410
agak terlalu berlebihan untuk apa yang akan terjadi selanjutnya karena kita masih memiliki fungsi kereta untuk

11:22.410 --> 11:26.890
dibuat yang akan menjadi fungsi besar dan yang berisi algoritma Lihat.

11:27.030 --> 11:29.240
Jadi percayalah, Anda ingin menyimpan energi untuk itu.

11:29.310 --> 11:32.300
Dan karena itu kita tidak akan menghabiskan terlalu banyak waktu untuk ini.

11:32.490 --> 11:37.830
Tapi saya masih akan memperluas kode dan Anda akan memahami seluruh ide di balik optimalisasi ini.

11:38.190 --> 11:44.740
Jadi selamat lagi untuk membuat kelas kegiatan ini dan sampai jumpa di Statoil 290 optimizer berikutnya.

11:44.760 --> 11:46.140
Sampai kemudian nikmati aku.