WEBVTT

00:00.530 --> 00:02.950
Halo dan selamat datang di tutorial Python ini.

00:02.990 --> 00:08.520
Jadi sekarang langkah selanjutnya adalah membuat fungsi neuron hitungan yang akan memberikan apa yang kita inginkan.

00:08.540 --> 00:14.130
Itulah jumlah neuron dalam vektor besar ini setelah konvolusi diterapkan.

00:14.300 --> 00:19.640
Itulah satu-satunya informasi yang hilang yang kami butuhkan saat ini dan kami akan mendapatkannya dengan fungsinya.

00:19.700 --> 00:23.930
Jadi mari kita buat fungsi ini yang kita sebut sebagai hitungan.

00:24.280 --> 00:27.570
Dan neuron-neuron inti itu sangat sederhana.

00:27.830 --> 00:32.220
Dan apa fungsi hitungan neuron ini akan mengambil sebagai argumen.

00:32.510 --> 00:39.450
Yah itu akan mengambil objek sendiri tetapi kemudian akan mengambil sesuatu yang lain karena jumlah

00:39.450 --> 00:44.540
neuron output di lapisan rata sebenarnya hanya tergantung pada satu hal.

00:44.660 --> 00:50.840
Itu tergantung pada dominasi gambar input asli yang masuk di awal jaringan

00:50.840 --> 00:51.930
saraf.

00:52.160 --> 00:58.370
Dan satu-satunya argumen yang kita butuhkan saat ini sebenarnya waktu menyebutkan waktu gambar input.

00:58.370 --> 01:03.410
Oleh karena itu mari kita beri nama untuk argumen ini yang mewakili berlian dan gambar input.

01:03.520 --> 01:06.790
Dan kita akan menyebutnya gambar.

01:07.220 --> 01:07.690
Baiklah.

01:07.850 --> 01:14.720
Dan saya dapat memberitahu Anda sekarang bahwa dimensi sebenarnya dari gambar input yang berasal dari Dume akan

01:14.720 --> 01:16.850
menjadi 80 kali 80.

01:16.850 --> 01:23.330
Kita akan mengurangi ukuran gambar asli menjadi 80 dengan 80 dan itu akan menjadi format

01:23.390 --> 01:26.270
gambar yang masuk ke jaringan saraf.

01:26.270 --> 01:32.300
Jadi Gambar mereka sebenarnya akan menjadi satu 80 80 dan yang sesuai dengan kenyataan bahwa kami bekerja dengan

01:32.300 --> 01:33.750
gambar hitam dan putih.

01:33.830 --> 01:41.040
Itu hanya dengan satu saluran sehingga gambar mereka akan dikorelasikan dengan total satu delapan puluh dan 80.

01:41.280 --> 01:41.560
Baiklah.

01:41.560 --> 01:43.590
Jadi itulah satu-satunya argumen yang kita butuhkan.

01:43.660 --> 01:45.670
Dan sekarang mari kita memindai neuron.

01:45.850 --> 01:47.280
Jadi bagaimana Anda akan melakukannya.

01:47.500 --> 01:51.110
Yah pertama-tama kita sebenarnya tidak memiliki gambar input apa pun sekarang.

01:51.250 --> 01:54.070
Kami tidak memiliki gambar malapetaka yang dapat kami impor.

01:54.070 --> 01:55.330
Kami akan melakukannya nanti.

01:55.540 --> 02:01.240
Jadi hal pertama yang harus kita lakukan adalah membuat gambar palsu tapi itu sudah dilakukan intron 80 lebih dari 80.

02:01.240 --> 02:06.160
Kita akan membuat gambar palsu dengan piksel palsu dan yang akhirnya akan memberi kita

02:06.160 --> 02:12.280
jumlah yang kita inginkan karena angka itu hanya tergantung pada dimensi dan bukan pada piksel yang ada di

02:12.280 --> 02:13.320
dalam gambar.

02:13.330 --> 02:15.640
Jadi ini hanya membuat gambar palsu untuk memulai.

02:15.730 --> 02:18.520
Dan kemudian kita akan menghitung jumlah neuron yang kita inginkan.

02:18.520 --> 02:23.860
Jadi trik untuk membuat gambar palsu adalah baik kita akan menyebutnya x.

02:23.890 --> 02:30.700
Pertama-tama dan kemudian kami akan menggunakan obor Rand itu karena Anda tahu kami akan menempatkan beberapa piksel

02:30.700 --> 02:37.200
acak dalam gambar ini yang kami gunakan fungsi acak ini dari torche yang merupakan fungsi rand.

02:37.250 --> 02:42.740
Kemudian di dalam kita akan input karena Anda dapat melihat kutukan gambar.

02:42.850 --> 02:44.400
Itu adalah satu 80 80.

02:44.560 --> 02:50.500
Tetapi karena kita akan menempatkan gambar ini ke dalam jaringan saraf dan seperti yang Anda ingat, jaringan saraf

02:50.500 --> 02:55.170
hanya dapat menerima kumpulan status masukan yang ada di sini kumpulan gambar input.

02:55.370 --> 03:00.600
Kita akan membuat berlian palsu di mana kita bisa langsung menjalankan fungsi ini.

03:00.670 --> 03:05.720
Kami sebenarnya baru saja memulai dengan yang akan sesuai dengan

03:05.730 --> 03:11.070
batch dan kemudian kita bisa memasukan semuanya sesuai dengan dominasi gambar input.

03:11.110 --> 03:16.980
Dan seperti yang Anda pahami, nominasi-nominasi ini terkandung dalam gambar ini, argumen mereka yang

03:16.980 --> 03:19.330
mewakili tabel 1 80 80.

03:19.420 --> 03:23.290
Jadi kita hanya perlu menambahkan gambarnya.

03:23.620 --> 03:29.410
Tetapi untuk melewati elemen-elemen tabel karena Anda tahu sekarang Gambar mereka adalah ganda sebagai

03:29.410 --> 03:31.940
daftar argumen dari suatu fungsi.

03:32.020 --> 03:39.460
Kita perlu menambahkan di sini sebelum gambar mereka ada sebelum Apple menyimpan toko akan memungkinkan untuk melewati elemen

03:39.550 --> 03:44.100
yang dicitrakan padanya ke Apple sebagai daftar argumen untuk fungsi.

03:44.170 --> 03:49.600
Dan seperti yang Anda lihat, itulah yang ditentukan di sini dengan toko dan berliannya.

03:49.930 --> 03:56.640
Baiklah, itu akan membuat gambar piksel palsu yang tidak ada hubungannya dengan gambar.

03:56.800 --> 04:01.720
Tetapi sekali lagi kita masih bisa mendapatkan jumlah neuron terakhir

04:01.720 --> 04:11.080
dan sekarang hal terakhir yang perlu kita ingat adalah mengubah vektor input ini menjadi variabel obor karena ini akan masuk

04:11.380 --> 04:13.060
ke jaringan saraf.

04:13.060 --> 04:13.380
Baiklah.

04:13.390 --> 04:20.650
Jadi ini sekarang merupakan gambar input piksel acak yang baru saja dikonversi menjadi layak dan yang sekarang akan

04:20.650 --> 04:22.440
masuk ke jaringan saraf.

04:22.570 --> 04:28.330
Dan lebih khusus lagi lapisan konvolusional dari jaringan saraf karena karena kita

04:28.330 --> 04:34.100
hanya perlu jumlah neuron setelah konvolusi diterapkan, kita akan naik ke konvolusi 3.

04:34.210 --> 04:36.440
Jadi sampai ke lapisan konvolusional ketiga.

04:36.580 --> 04:39.630
Dan kita tidak akan masuk ke dua koneksi penuh di sini.

04:39.850 --> 04:45.490
Dan itu karena jumlah neuron yang kita inginkan adalah antara konvolusi 3 dan f. c 1.

04:45.520 --> 04:52.120
Baiklah jadi sekarang kita memiliki satu input gambar dengan menyebutkan benar Nah saatnya untuk menyebarkan gambar ini

04:52.180 --> 04:58.330
ke jaringan saraf untuk mencapai lapisan perataan maka kita akan mendapatkan neuron di lapisan rata dan

04:58.330 --> 05:03.850
kita hanya akan mendapatkan informasi yang kami inginkan adalah jumlah neuron dalam lapisan yang

05:03.850 --> 05:04.750
rata ini.

05:04.990 --> 05:08.950
Jadi sekarang yang harus kita lakukan adalah apa yang kita lakukan di fungsi maju.

05:08.950 --> 05:14.560
Kita perlu menyebarkan sinyal ke jaringan saraf tetapi hanya di lapisan convolutional sampai kita

05:14.560 --> 05:16.120
mencapai lapisan flooding.

05:16.330 --> 05:17.360
Jadi mari kita lakukan ini.

05:17.360 --> 05:25.660
Kita akan memperbarui x sekarang x adalah gambar input dan dengan X kedua di sini X akan menjadi

05:25.660 --> 05:27.050
lapisan convolutional pertama.

05:27.310 --> 05:32.930
Dan sekarang yang harus kita lakukan adalah proses tiga langkah langkah pertama kita menerapkan dekonvolusi ke

05:32.950 --> 05:33.790
gambar input.

05:33.850 --> 05:40.960
Kemudian langkah kedua kita menerapkan pemangkasan campuran ke gambar berbelit-belit dan memasukkan

05:40.960 --> 05:48.160
bahwa kita mengaktifkan neuron dalam gambar berbelit-belit berdenyut ini dan x akan menjadi

05:48.160 --> 05:50.590
konvolusional pertama ini.

05:51.010 --> 05:56.840
Jadi mari kita lakukan langkah pertama ini menerapkan konvolusi konvolusi pertama ke gambar input.

05:57.040 --> 06:07.540
Jadi apa yang kita lakukan adalah mengambil konvolusi satu diri dengan obrolan Lucian yang kita lanjutkan, kita terapkan pada gambar input

06:07.550 --> 06:11.360
kami yang sejauh ini diwakili oleh x.

06:11.500 --> 06:14.290
Jadi itulah yang pertama yang dilakukan sekarang.

06:14.320 --> 06:22.630
Langkah kedua kita akan menerapkan spooling ke gambar berbelit-belit kami dikembalikan oleh konvolusi ketika X dan dua klimaks

06:22.640 --> 06:26.880
menarik Yah kita akan mengambil fungsi dari modul fungsional.

06:26.920 --> 06:34.610
Jadi kita mengambil jalan pintas dari itu dan kemudian kita akan menggunakan fungsi Max pool ke D.

06:34.810 --> 06:42.340
Itulah yang kami letakkan konvolusi diri satu X dalam tanda kurung dari tarikan maks ke karena kami memainkan tarikan

06:42.360 --> 06:45.220
berikutnya ke dalam gambar yang berbelit-belit.

06:45.750 --> 06:53.140
Tetapi fungsi selanjutnya ini membutuhkan argumen tambahan yang mana pertama-tama adalah ukuran kernel.

06:53.190 --> 06:59.190
Jadi sekali lagi itu ukuran jendela yang menggeser gambar Anda dan itu akan mengambil maksimum piksel

06:59.190 --> 07:00.710
di setiap slide.

07:00.830 --> 07:06.750
Sehingga masih akan mendeteksi fitur-fitur tersebut karena fitur-fitur tersebut terkait dengan nilai piksel yang tinggi

07:06.840 --> 07:07.750
dalam array.

07:07.890 --> 07:09.580
Seperti yang Anda katakan kuliah intuisi.

07:09.780 --> 07:14.020
Jadi input manusia yang pertama kali didokumentasikan untuk input adalah ukuran kernel ini.

07:14.100 --> 07:15.560
Dan kita akan mengambil tiga.

07:15.660 --> 07:17.650
Itu pilihan umum untuk ukuran kernel.

07:17.940 --> 07:25.200
Dan kemudian kita perlu meletakkan langkah yang Anda tahu dengan berapa banyak piksel yang akan meluncur dalam gambar.

07:25.200 --> 07:27.560
Dan kita akan mengambil langkah dua.

07:27.610 --> 07:29.400
Sekali lagi itu adalah pilihan umum.

07:29.820 --> 07:30.670
Jadi begitulah.

07:30.690 --> 07:32.530
Sekarang langkah kedua selesai.

07:32.620 --> 07:38.910
Dan sekarang mari kita lanjutkan ke langkah ketiga yaitu untuk mengaktifkan semua neuron di kolam ini dan gambar yang

07:38.910 --> 07:39.580
berbelit-belit.

07:39.610 --> 07:46.090
Dan ini lapisan konvolusi pertama dan untuk melakukan ini lagi kita akan menerapkan fungsi untuk semua ini.

07:46.170 --> 07:51.960
Jadi di sini dan mengambil lagi karena kita akan mengambil fungsi lain yang seperti yang Anda

07:52.050 --> 07:55.170
duga akan menjadi fungsi aktivasi tetapi yang mana.

07:55.230 --> 08:01.410
Seperti biasa itu akan diperbaiki fungsi aktivasi dan mungkin Anda ingat nama untuk yang

08:01.620 --> 08:02.330
sebenarnya.

08:02.790 --> 08:03.410
Itu dia.

08:03.450 --> 08:04.290
Itu dia.

08:04.290 --> 08:12.540
Jadi kami benar-benar menerapkan gambar berbelit-belit yang dikumpulkan ini.

08:12.540 --> 08:12.940
Baiklah.

08:12.990 --> 08:14.270
Dan itu saja.

08:14.370 --> 08:15.320
Tiga langkah dilakukan.

08:15.330 --> 08:16.370
Itu sangat cepat.

08:16.500 --> 08:23.460
Jadi ingat cara kita harus melihat ini, pertama kita menerapkan konvolusi ke gambar input kita, lalu

08:23.460 --> 08:28.830
kita menerapkan Max menarik ke gambar berbelit-belit yang diperoleh dengan konvolusi.

08:28.950 --> 08:35.730
Dan kemudian kita mengaktifkan neuron dalam semua lapisan konvolusional ini dengan fungsi aktivasi

08:35.730 --> 08:43.960
penyearah yang begitu sempurna, kita mendapatkan lapisan konvolusional pertama kita yang menarik klimaks dan di mana

08:44.050 --> 08:46.200
neuron sekarang diaktifkan.

08:46.260 --> 08:51.640
Dan pada dasarnya yang dilakukannya adalah menyebarkan sinyal dari lapisan konvolusional pertama ke

08:51.640 --> 08:52.500
yang berikutnya.

08:52.630 --> 08:56.580
Dan berbicara tentang yang berikutnya itulah yang akan kita tangani saat ini.

08:56.570 --> 09:01.660
Kita akan melakukan hal yang sama seperti yang baru saja kita lakukan pada konvolusional pertama

09:01.660 --> 09:08.170
di sana ke lapisan konvolusional kedua untuk menyebarkan kembali sinyal lebih jauh ke dalam jaringan saraf dengan mengaktifkan neuron

09:08.170 --> 09:09.660
pada lapisan konvolusional kedua.

09:09.850 --> 09:12.910
Tetapi sebelum melakukan ini kita perlu mendapatkan lapisan konvolusional ini.

09:13.120 --> 09:18.330
Jadi kita akan menerapkan konvolusi ke X yang sekarang merupakan lapisan konvolusional pertama.

09:18.460 --> 09:24.070
Yah kita akan menerapkan konvolusi ke 2 x untuk mendapatkan lapisan konvolusional kedua setelah itu akan

09:24.070 --> 09:25.120
Max menariknya.

09:25.240 --> 09:27.860
Dan akhirnya mengaktifkan Sirat.

09:27.970 --> 09:29.070
Jadi mari kita lakukan ini.

09:29.170 --> 09:35.350
Sebenarnya sangat mudah kita hanya menyalinnya dan menempelkannya di bawah.

09:35.350 --> 09:39.240
Sekarang tentu saja kita perlu mengganti konvolusi satu dengan konvolusi juga.

09:39.520 --> 09:40.460
Dan kita mulai.

09:40.480 --> 09:43.650
Itu sebenarnya sudah siap dilihat dengan sangat mudah.

09:43.900 --> 09:50.200
Dan sekarang dengan garis ini kita menyebarkan sinyal dari konvolusional kedua di sana ke yang berikutnya yang

09:50.260 --> 09:52.580
akan menjadi konvolusional ketiga di sana.

09:52.720 --> 09:57.220
Dan untuk mendapatkan konvolusional ketiga ini perlu menerapkannya lagi.

09:57.220 --> 10:04.630
Jadi saya menyalin ini paste di bawah ini dan mengganti konvolusi juga dengan konvolusi 3 dan itu dilakukan

10:04.870 --> 10:06.340
bukan begitu praktis.

10:06.340 --> 10:11.490
Kami menyebarkan sinyal dalam tiga huruf konvolusional dalam senter.

10:11.500 --> 10:13.100
Berkat struktur yang luar biasa ini.

10:14.020 --> 10:15.340
Baiklah, begitu sempurna.

10:15.340 --> 10:21.250
Sekarang sinyal kami disebarkan ke lapisan konvolusional ketiga dan sesudahnya.

10:21.360 --> 10:24.780
Dan berbicara tentang setelah itu menuntun kita ke apa yang kita cari.

10:24.820 --> 10:28.510
Yang kami minati adalah perataan di sana.

10:28.510 --> 10:33.620
Baiklah sekarang kita memiliki konvolusional ketiga di sana, itulah X terakhir di sini.

10:33.790 --> 10:36.120
Sudah waktunya untuk mengeluarkan kita.

10:36.490 --> 10:37.990
Dan itulah yang akan kita lakukan.

10:37.990 --> 10:44.200
Sekarang kita akan meratakan semua piksel dari lapisan konvolusional ketiga ini yaitu kita akan

10:44.290 --> 10:48.430
mengambil semua piksel semua saluran dari lapisan konvolusional ketiga.

10:48.640 --> 10:51.920
Kita akan menempatkan mereka satu per satu dalam vektor besar.

10:52.150 --> 10:56.920
Dan tentu saja vektor besar ini akan menjadi tidak lain dari lapisan perataan dan pada

10:56.920 --> 11:02.000
saat yang sama kita akan menggunakan trik untuk mendapatkan jumlah neuron dalam perataan ini di sana.

11:02.070 --> 11:03.790
Itu yang kami cari.

11:03.790 --> 11:09.370
Itu adalah jumlah neuron yang hilang dan oleh karena itu mari kita langsung mengembalikan apa yang kita inginkan

11:09.370 --> 11:15.130
dan dalam pengembalian ini kita akan meratakan lapisan konvolusional ketiga dan mendapatkan yang sama dan jumlah neuron dalam lapisan

11:15.130 --> 11:16.330
yang mendatar ini.

11:16.630 --> 11:20.150
Jadi kita akan mengambil X. yang convolutional ketiga kami di sana.

11:20.320 --> 11:25.150
Kita akan mengambil semua saluran konvolusional ketiga di sana dan kita akan

11:25.150 --> 11:32.160
menggunakan fungsi yang merupakan fungsi ukuran untuk meratakan semua piksel semua saluran dalam satu vektor besar yang sama.

11:32.230 --> 11:35.930
Dan trik yang Anda dapat menemukannya di layang-layang menonton jerih payah.

11:36.130 --> 11:42.400
Yah pertama-tama kita ambil data X karena X adalah struktur khusus lho Voivode obor Jadi dia punya

11:42.400 --> 11:44.250
struktur yang cukup kompleks.

11:44.320 --> 11:51.920
Tetapi pertama-tama kita perlu mengaksesnya dengan data di sini kemudian kita perlu melihat apa yang ada di dalamnya.

11:52.090 --> 11:57.700
Jadi kita menggunakan fungsi view ini dan sekarang kita perlu mengakses apa yang kita

11:57.700 --> 12:01.980
cari dan itu bahkan dengan argumen 1 dan minus 1.

12:02.230 --> 12:04.390
Anda harus memahami apa yang ada di dalam struktur.

12:04.510 --> 12:10.060
Tapi Anda bisa mengerti bahwa ini adalah bagaimana kita akan mendapatkan jumlah neuron ini dan

12:10.150 --> 12:15.560
kemudian untuk menyelesaikan kita perlu menambahkan ukuran dalam tanda kurung dan input dalam 1.

12:15.880 --> 12:21.610
Jadi pada dasarnya apa yang kami lakukan di sini adalah apa yang kami lakukan adalah mengambil semua piksel dari semua saluran

12:21.610 --> 12:27.180
dan kami menempatkannya satu demi satu dalam vektor besar ini yang akan menjadi input dari jaringan yang sepenuhnya terhubung.

12:27.190 --> 12:29.250
Itu pada dasarnya apa ukurannya.

12:29.410 --> 12:34.060
Dan dengan ini kita bisa mendapatkan jumlah yang baru yang kita cari.

12:34.060 --> 12:36.460
Baiklah sekarang kita mendapatkan apa yang kita inginkan.

12:36.490 --> 12:44.350
Dan akhirnya kita dapat mengganti neuron angka di sini dengan apa yang dikembalikan oleh fungsi ini

12:44.530 --> 12:47.400
ketika diterapkan pada format gambar.

12:47.440 --> 12:50.140
Itu satu per 80 oleh 80.

12:50.170 --> 13:00.040
Jadi yang harus kita lakukan sekarang adalah mengganti neuron bilangan dengan mengambil fungsi neuron

13:00.250 --> 13:09.040
hitung yang kita terapkan pada format gambar yang totalnya 80 dan 80.

13:09.460 --> 13:10.400
Dan kita mulai.

13:10.510 --> 13:17.140
Dan tentu saja kita tidak lupa diri karena Count neuron sebenarnya adalah metode tes CNN.

13:17.170 --> 13:18.490
Jadi kita perlu menambahkan.

13:18.700 --> 13:21.190
Dan sekarang peringatan itu seharusnya hilang.

13:21.190 --> 13:22.540
Dan kita mulai.

13:22.540 --> 13:23.890
Sekarang semuanya baik-baik saja.

13:23.980 --> 13:29.930
Kami mendapatkan arsitektur jaringan saraf dengan tidak ada yang hilang dan kami memiliki fungsi balasan ini jika

13:30.140 --> 13:35.290
Anda tahu Anda ingin mencoba beberapa arsitektur lain dan Anda tidak ingin menghitung jumlah neuron

13:35.290 --> 13:36.210
secara manual.

13:36.340 --> 13:39.940
Anda cukup menggunakan fungsi ini, Anda memainkannya dengan format gambar Anda.

13:40.180 --> 13:42.130
Dan ini akan memberi Anda langsung apa yang Anda inginkan.

13:42.130 --> 13:45.810
Itu adalah jumlah neuron di lapisan flooding tanpa harus melakukan apa pun.

13:45.820 --> 13:49.450
Dan di mana pun arsitekturnya itu penting.

13:49.480 --> 13:57.040
Dan sekarang kita sudah selesai dengan langkah penting pertama dari otak yang kita buat ini dan kita punya satu langkah

13:57.040 --> 13:57.720
terakhir.

13:57.790 --> 14:02.500
Itu adalah satu fungsi terakhir yang akan menjadi fungsi maju utama.

14:02.590 --> 14:07.730
Jadi kita akan menyebarkan sinyal dari awal otak yang dari

14:07.730 --> 14:12.160
mata ke lapisan output yang setelah koneksi kedua.

14:12.460 --> 14:15.850
Jadi kita akan melakukan itu dalam dua toile berikutnya dan sampai saat itu AI kita.