WEBVTT

00:00.360 --> 00:06.480
Halo dan selamat datang kembali ke kursus pembelajaran mendalam, ini adalah tutorial tambahan untuk berbicara tentang

00:06.480 --> 00:08.670
fungsi entropi lunak dan lintas.

00:08.670 --> 00:15.320
Tidak perlu 100 persen bagi Anda untuk melalui semua bagian yang telah kami lalui di bagian utama dari

00:15.330 --> 00:21.510
bagian ini di mana kita berbicara tentang jaringan saraf convolutional tetapi pada saat yang sama saya

00:21.510 --> 00:26.580
pikir itu akan menjadi tambahan yang bagus untuk tas pengetahuan dan keahlian Anda.

00:26.580 --> 00:30.840
Jadi mari kita lanjutkan dan menggali fungsi-fungsi ini.

00:30.840 --> 00:37.530
Jadi untuk memulai dengan apa yang kita miliki di sini adalah kesimpulan dari jaringan saraf yang kita bangun

00:37.530 --> 00:44.210
di bagian utama dari bagian dan kemudian pada akhirnya muncul beberapa probabilitas untuk nol koma sembilan puluh

00:44.220 --> 00:48.000
lima untuk anjing 0. 05 lima atau 5 persen untuk kucing.

00:48.060 --> 00:53.250
Mengingat foto di sebelah kiri sebagai input Ini setelah kereta telah dilakukan

00:53.260 --> 00:57.210
ini sebenarnya sedang berjalan dan itu mengklasifikasikan gambar tertentu.

00:57.360 --> 01:00.850
Jadi pertanyaannya di sini adalah bagaimana dua nilai ini bisa bertambah menjadi satu.

01:00.900 --> 01:06.750
Karena sejauh yang kami tahu dari semua yang saya pelajari tentang jaringan saraf tiruan tidak ada

01:06.750 --> 01:11.600
yang mengatakan bahwa kedua neuron terakhir ini saling terhubung satu sama lain.

01:11.730 --> 01:16.590
Jadi bagaimana mereka tahu apa nilai dari pegangan masing-masing dari mereka tahu apa nilai

01:16.590 --> 01:17.310
yang lain.

01:17.400 --> 01:20.140
Dan bagaimana mereka tahu menambahkan nilai mereka hingga satu.

01:20.340 --> 01:22.060
Yah jawabannya adalah mereka tidak mau.

01:22.260 --> 01:28.500
Dalam versi klasik jaringan saraf tiruan kami dan satu-satunya cara yang mereka lakukan adalah karena kami memperkenalkan

01:28.710 --> 01:33.960
fungsi khusus yang disebut fungsi soft max untuk membantu kami keluar dari situasi tersebut.

01:33.960 --> 01:40.890
Jadi biasanya yang akan terjadi adalah anjing dan neuron kucing memiliki nilai nyata apa pun sehingga tidak harus

01:41.490 --> 01:44.940
seperti itu, mereka tidak harus menambahkan satu pun.

01:45.180 --> 01:51.900
Tapi kemudian kita akan menerapkan fungsi soft max yang ditulis di sana di bagian atas dan yang akan membawa

01:51.900 --> 01:58.430
nilai-nilai ini antara 0 dan 1 dan itu akan membuat mereka menambahkan hingga 1 dan 3 PPTA.

01:59.250 --> 02:04.320
Fungsi soft max atau fungsi eksponensial yang dinormalisasi adalah generalisasi dari fungsi logistik

02:04.350 --> 02:11.640
yang mengutip squash tanda kutip memiliki vektor dimensi k dari nilai riil arbitrer ke vektor k dimensi dari nilai nyata

02:11.640 --> 02:15.320
dalam kisaran nol hingga satu yang menambahkan hingga 1.

02:15.330 --> 02:17.620
Jadi pada dasarnya itu tepat seperti yang kita inginkan.

02:17.670 --> 02:22.700
Ini membawa nilai-nilai ini menjadi antara 0 dan 1 dan memastikan bahwa mereka menambahkan hingga 1.

02:22.960 --> 02:27.780
Dan cara kerjanya adalah bahwa cara ini dimungkinkan adalah karena di bagian bawah kami di sini

02:27.780 --> 02:29.970
Anda dapat melihat bahwa ada penjumlahan.

02:29.970 --> 02:38.100
Jadi itu mengambil eksponen dan menempatkannya dalam kekuatan Zed dan menambahkannya sehingga ada dua di semua kelas

02:38.100 --> 02:38.830
Anda.

02:38.850 --> 02:39.990
Semua nilai ini.

02:39.990 --> 02:44.400
Dan di situlah normalisasi Anda terjadi di sana.

02:44.400 --> 02:51.300
Jadi begitulah fungsi Saucebox bekerja dan masuk akal untuk memperkenalkan fungsi soft berikutnya ke

02:51.600 --> 02:59.490
dalam jaringan saraf convolutional karena betapa anehnya jika Anda memiliki kelas yang memungkinkan untuk anjing dan

02:59.490 --> 03:05.140
kucing dan untuk kelas anjing Anda memiliki kemungkinan 80 persen .

03:05.160 --> 03:08.660
Dan untuk cakar kucing Anda memiliki hak 45 persen bagus.

03:08.670 --> 03:14.430
Itu tidak masuk akal seperti itu dan oleh karena itu jauh lebih baik ketika Anda memperkenalkan fungsi lembut

03:14.430 --> 03:19.760
berikutnya dan itulah yang Anda akan temukan terjadi sebagian besar waktu dalam jaringan convolutional dan neural.

03:19.770 --> 03:26.010
Sekarang hal lain adalah bahwa fungsi soft max datang bergandengan tangan dengan sesuatu yang disebut fungsi entropi Cross dan

03:26.100 --> 03:29.040
itu adalah hal yang sangat berguna bagi kita.

03:29.050 --> 03:30.610
Jadi mari kita lihat rumusnya.

03:30.660 --> 03:33.090
Seperti inilah fungsi lintas entri.

03:33.090 --> 03:38.910
Kita sebenarnya akan menggunakan perhitungan yang berbeda akan menggunakan representasi abad ini tetapi hasilnya

03:39.060 --> 03:40.670
pada dasarnya sama.

03:40.670 --> 03:42.300
Ini hanya lebih mudah untuk dihitung.

03:42.570 --> 03:49.220
Dan yang saya tahu ini mungkin terdengar sangat tidak berhubungan dengan apa pun sekarang hanya dengan rumus di layar Anda tetapi

03:49.850 --> 03:54.300
akan ada beberapa bacaan tambahan yang direkomendasikan pada akhir bagian ini jadi jangan khawatir

03:54.600 --> 03:56.380
jika Anda tidak mengambil matematika

03:56.380 --> 03:58.350
Seperti bahkan jika kita belum menjelaskan matematika saat ini.

03:58.350 --> 04:03.630
Tetapi intinya di sini adalah bahwa apa yang melintasi entropi jauh melintasi fungsi entropi.

04:03.630 --> 04:11.870
Ingat bagaimana kita sebelumnya dalam jaringan saraf tiruan kita memiliki fungsi yang disebut fungsi rata-rata panah kuadrat

04:11.880 --> 04:17.760
yang kita gunakan sebagai fungsi biaya untuk menilai kinerja alami kita.

04:17.760 --> 04:23.750
Dan tujuan kami adalah meminimalkan MSE untuk mengoptimalkan kinerja jaringan kami.

04:23.940 --> 04:31.830
Nah itu tadi fungsi biaya kami di sana dan di jaringan saraf convolutional kita masih bisa menggunakan MSE tetapi

04:31.830 --> 04:38.070
pilihan yang lebih baik di jaringan saraf convolutional setelah Anda menerapkan fungsi soft max ternyata

04:38.070 --> 04:39.840
menjadi fungsi lintas entropi.

04:39.840 --> 04:46.080
Dan dalam jaringan saraf convolutional ketika Anda menerapkan fungsi lintas entri bukan biaya disebut fungsi biaya

04:46.080 --> 04:49.450
lagi disebut fungsi terakhir dan mereka sangat mirip.

04:49.470 --> 04:55.520
Mereka hanya sedikit perbedaan terminologis dan suka sedikit berbeda dan tentang apa yang mereka maksudkan.

04:55.530 --> 04:58.430
Tetapi untuk semua tujuan itu hal yang hampir sama.

04:58.450 --> 05:07.530
Dan yang terjadi adalah fungsi terakhir adalah lagi sesuatu yang ingin kita perkecil untuk memaksimalkan

05:07.530 --> 05:09.670
kinerja jaringan kita.

05:09.690 --> 05:15.260
Jadi mari kita lihat contoh cepat tentang bagaimana cara fungsi ini dapat diterapkan.

05:15.260 --> 05:19.260
Jadi katakanlah kita memasukkan gambar seekor anjing ke dalam jaringan kita.

05:19.650 --> 05:26.160
Nilai prediksi untuk anjing adalah 0. 9 dan ini sedang melakukan pelatihan sehingga kita tahu bahwa kita tahu label

05:26.160 --> 05:27.330
itu adalah seekor anjing.

05:27.330 --> 05:34.140
Jadi nilai prediksi 0. 9 nilai harga untuk kucing adalah 0. 1 maka di sini kita memiliki label sehingga

05:34.140 --> 05:37.810
kita tahu itu anjing karena ini melatih 0 1 untuk anjing atau kucing.

05:37.980 --> 05:47.600
Jadi dalam hal ini Anda harus menggunakan Anda harus memasukkan angka-angka ini ke dalam rumus Anda untuk cross entropy.

05:47.810 --> 05:53.340
Jadi bagaimana Anda melakukannya adalah nilai-nilai di sebelah kiri pergi ke isyarat verbal.

05:53.420 --> 05:58.940
Yang ada di bawah logaritma di sebelah kanan dan nilai-nilai dari kanan akan masuk ke

05:58.940 --> 06:04.340
P dan jadi penting untuk mengingat mana yang masuk karena jika Anda salah, Anda tidak

06:04.340 --> 06:09.620
ingin mengambil logaritma semua saya dari nilai nol dan atau pergi dari 1.

06:09.620 --> 06:11.660
Jadi, Anda hanya ingin mencolokkannya.

06:11.720 --> 06:14.520
Pastikan Anda menancapkannya ke tempat yang benar.

06:14.840 --> 06:17.030
Dan pada dasarnya Anda menambahkannya.

06:17.030 --> 06:22.370
Jadi begitulah cara entri silang bekerja dan kita akan melihat sebenarnya sekarang kita akan melihat contoh

06:22.370 --> 06:28.130
langkah demi langkah spesifik untuk menerapkan fungsi ini dalam kehidupan nyata dan jenis penyakit akan membuat lebih

06:28.130 --> 06:32.360
masuk akal apa itu entropi Cross dan akan kurang seperti itu.

06:32.360 --> 06:39.290
Tujuan saya dalam kerja keras ini adalah untuk membuat Anda lebih nyaman dari abad lintas karena itu bisa

06:39.320 --> 06:43.840
terdengar sangat berbelit-belit dan tidak ada kata pun yang dimaksudkan bisa.

06:43.850 --> 06:50.870
Seperti jaringan saraf convolutional, ini bisa terdengar sangat rumit dan menakutkan tetapi sebenarnya tidak.

06:50.870 --> 06:51.650
Itulah intinya.

06:51.650 --> 06:54.090
Jadi mari kita lanjutkan dan menerapkannya supaya kita tahu bahwa itu tidak menakutkan.

06:54.080 --> 06:56.350
Jadi, inilah semuanya.

06:56.360 --> 07:01.790
Dan ini juga akan menjelaskan mengapa kita melakukan ini mengapa kita mencari fungsi penyebab yang berbeda.

07:01.790 --> 07:06.650
Jadi jaringan saraf satu jaringan saraf katakanlah kita memiliki dua jaringan saraf dan

07:06.650 --> 07:11.960
kemudian kita melewati gambar seekor anjing dan kita tahu bahwa ini adalah anjing dan bukan kucing.

07:12.200 --> 07:18.620
Dan kemudian kita memiliki gambar lain kucing kita kali ini binatang dan itu kucing bukan anjing dan di sini kita

07:19.040 --> 07:22.490
punya kita melihat lubang yang sebenarnya adalah anjing bukan kucing.

07:22.490 --> 07:24.280
Jika Anda melihat dari dekat.

07:24.320 --> 07:28.440
Jadi kami ingin melihat apa yang akan diprediksi oleh jaringan saraf kami dalam kasus pertama.

07:28.460 --> 07:36.110
Jaringan saraf 1 anjing 90 persen 10 persen kucing benar tidak ada nomor jaringan sampai 60 persen anjing 40

07:36.110 --> 07:38.230
persen kucing masih benar buruk.

07:38.270 --> 07:40.030
Tapi benar.

07:40.280 --> 07:46.040
Pilihan kedua jaringan syaraf pertama 10 persen kucing anjing 90 persen kucing.

07:46.040 --> 07:47.300
Benar.

07:47.300 --> 07:53.560
Anda tahu jumlah itu menjadi 30 persen anjing, 70 persen kucing lebih buruk tetapi masih benar.

07:53.570 --> 08:01.460
Dan akhirnya jaringan saraf di dalam gambar jaringan lama tahun memenangkan 40 persen anjing 60 persen kucing nomor

08:01.870 --> 08:08.270
jaringan saraf salah untuk 10 persen anjing dan 90 persen kucing salah dan buruk.

08:08.270 --> 08:15.380
Jadi kuncinya di sini adalah bahwa meskipun kedua orang bersih salah dalam yang terakhir melalui ketiga

08:15.620 --> 08:18.870
gambar jaringan saraf satu mengungguli jaringan saraf.

08:18.890 --> 08:27.010
Jadi, bahkan dalam kasus terakhir itu sangat ia memberi anjing seperti peluang 40 persen sebagai lawan dari jaringan saraf untuk hanya memberi

08:27.030 --> 08:32.330
anjing peluang 10 persen atau jaringan saraf yang lebih baik daripada papan neural bila

08:33.200 --> 08:35.310
dibandingkan dengan jaringan saraf 2.

08:35.520 --> 08:41.780
Dan sekarang kita akan melihat fungsi yang dapat mengukur kinerja yang telah kita bicarakan

08:41.780 --> 08:42.800
tentang peringkat.

08:43.040 --> 08:48.090
Jadi mari kita letakkan ini di tabel sehingga ada jaringan saraf 1 Anda memiliki nomor yang salah.

08:48.350 --> 08:49.430
Jadi itulah nomor gambarnya.

08:49.550 --> 08:51.140
Dan kemudian untuk gambar yang Anda miliki.

08:51.140 --> 08:54.010
Apa yang diprediksi 90 persen simpanse dan kucing anjing.

08:54.110 --> 09:00.550
Jadi ada topi Marable's dan kemudian Anda memiliki nilai sebenarnya sehingga kucing yang benar salah.

09:00.560 --> 09:07.720
Hal yang sama untuk gambar nomor dua dan hal yang sama untuk minimal tiga dan sama untuk nomor jaringan saraf dua.

09:07.750 --> 09:11.060
Jadi Dog 60 persen tetap 40 persen di gambar pertama.

09:11.060 --> 09:13.800
Itu yang diprediksi croton adalah anjing, bukan kucing.

09:13.820 --> 09:14.820
Dan seterusnya.

09:15.200 --> 09:18.050
Dan sekarang mari kita lihat kesalahan apa yang sebenarnya bisa kita dapatkan.

09:18.050 --> 09:24.940
Jadi kesalahan apa yang bisa kita hitung untuk memperkirakan kinerja dan memantau kinerja jaringan kita.

09:24.950 --> 09:28.480
Jadi satu jenis kesalahan disebut kesalahan klasifikasi.

09:28.640 --> 09:33.990
Dan itu pada dasarnya hanya menanyakan apakah Anda melakukannya dengan benar atau tidak.

09:34.010 --> 09:36.940
Terlepas dari probabilitasnya, APAKAH KAMU MENDAPATKANNYA KANAN.

09:36.950 --> 09:37.970
Atau apakah Anda melakukannya dengan benar.

09:37.970 --> 09:44.790
Jadi dalam kedua kasus untuk kedua jaringan saraf masing-masing mereka mendapat satu.

09:44.810 --> 09:46.330
Jadi ini salah Anda.

09:46.340 --> 09:48.460
Jadi mereka salah satu dari tiga kesalahan.

09:48.470 --> 09:54.960
Jadi 33 persen tingkat kesalahan untuk jaringan Anda 1 dan 30 persen tingkat kesalahan untuk jaringan saraf.

09:55.100 --> 09:59.750
Sebagai dasar dari sudut pandang ini, kedua jaringan saraf bekerja pada tingkat yang sama tetapi kita tahu itu tidak

09:59.750 --> 10:00.250
benar.

10:00.260 --> 10:04.400
Kita tahu bahwa jaringan saraf Ikhwan mengungguli jaringan saraf.

10:05.120 --> 10:10.850
Itu sebabnya kesalahan klasifikasi bukan ukuran yang baik terutama untuk keperluan propagasi balik berarti kuadrat kesalahan yang berbeda

10:11.810 --> 10:17.960
dan dengan cara saya melakukan perhitungan ini di Excel saya hanya tidak ingin membuat Anda bosan dengan mereka tetapi

10:17.960 --> 10:22.010
Anda dapat Tony hanya duduk lakukan di atas kertas atau di Excel.

10:22.010 --> 10:28.760
Ini adalah perhitungan yang sangat mudah pada dasarnya hanya mengambil jumlah kesalahan

10:28.760 --> 10:35.010
kuadrat dan kemudian hanya mengambil rata-rata pengamatan Anda dan itu saja.

10:35.060 --> 10:43.320
Jadi untuk jaringan saraf satu mendapatkan 25 persen untuk jaringan saraf 2 Anda mendapatkan tingkat kesalahan 71 persen sehingga Anda

10:43.330 --> 10:45.930
dapat melihat ini lebih akurat.

10:45.940 --> 10:50.380
Ia memberi tahu kami bahwa hampir satu memiliki tingkat kesalahan yang jauh lebih rendah daripada jaringan Anda sendiri.

10:51.150 --> 10:52.970
Dan kemudian lintas entropi lagi.

10:52.990 --> 10:57.250
Kami telah melihat rumus yang Anda juga dapat hitung ini sebenarnya lebih mudah untuk dihitung daripada rata-rata daerah

10:57.250 --> 11:05.350
kuadrat Cross di seluruh entropi memberi Anda 38 persen untuk jaringan saraf 1 dan 1. 0 6 untuk jaringan saraf 2.

11:05.500 --> 11:08.180
Jadi Anda bisa lihat hasilnya agak berbeda.

11:08.350 --> 11:16.510
Ketika Anda melihat mereka seperti itu ketika Anda melihat Anda tahu area rok mini dan cross entropy dan

11:16.510 --> 11:26.350
pertanyaan mengapa Anda menggunakan cross entropy over berarti kesalahan kuadrat bukan hanya tentang jenis seperti angka yang mereka katakan tetapi semua perhitungan

11:26.350 --> 11:32.030
hanya untuk menunjukkan kepada Anda bahwa ini semua bisa dilakukan, Anda hanya

11:32.050 --> 11:34.680
dapat melakukannya di atas kertas.

11:34.780 --> 11:37.890
Ini bukan matematika yang sangat intens.

11:37.890 --> 11:41.130
Ini adalah hal-hal sederhana yang cukup sederhana.

11:41.200 --> 11:47.680
Tetapi pertanyaan mengapa Anda menggunakan sarana menyebabkan entropi berarti ada pertanyaan yang sangat bagus untuk

11:47.680 --> 11:48.250
ditanyakan.

11:48.250 --> 11:58.530
Saya senang Anda bertanya bahwa jawabannya adalah seperti ada beberapa keuntungan dari cross entropy daripada mean squared

11:58.540 --> 12:01.430
error yang tidak jelas.

12:01.450 --> 12:07.160
Jadi saya akan menyebutkan beberapa tetapi selain itu saya akan memberi tahu Anda di mana Anda bisa tahu lebih banyak.

12:07.160 --> 12:18.550
Jadi salah satunya adalah bahwa jika Anda misalnya Anda pada awal propagasi belakang Anda nilai output Anda sangat sangat

12:18.550 --> 12:22.260
sangat sangat kecil sangat kecil.

12:22.360 --> 12:25.680
Jadi itu jauh lebih kecil dari nilai aktual yang Anda inginkan.

12:25.750 --> 12:32.920
Kemudian di awal, gradien di dunia Anda yang hebat dan layak akan sangat sangat rendah dan Anda tidak

12:32.920 --> 12:33.840
akan cukup.

12:33.850 --> 12:40.630
Sangat sulit bagi jaringan saraf untuk benar-benar mulai melakukan sesuatu dan mulai bergerak di sekitar dan mulai menyesuaikan bobot-bobot

12:40.630 --> 12:45.010
itu dan mulai Movistar yang sebenarnya bergerak ke arah yang benar.

12:45.130 --> 12:50.920
Sedangkan ketika Anda menggunakan sesuatu seperti entropi silang karena punya logaritma di dalamnya

12:51.400 --> 12:57.310
itu sebenarnya membantu jaringan menilai bahkan area kecil seperti itu dan melakukan sesuatu tentangnya.

12:57.310 --> 12:58.520
Begini cara berpikirnya.

12:58.520 --> 13:03.260
Jadi katakanlah sekali lagi ini sangat dalam dan dalam pendekatan yang sangat intuitif.

13:03.410 --> 13:08.830
Akan ada tautan ke matematika dan Anda dapat menurunkan hal-hal ini melalui matematika secara lebih terperinci

13:08.830 --> 13:11.260
tetapi dengan pendekatan yang sangat intuitif.

13:11.260 --> 13:16.030
Katakanlah Anda menyukai hasil yang Anda inginkan.

13:16.030 --> 13:22.810
Is adalah satu dan saat ini Anda berada pada sepersejuta dari satu.

13:22.870 --> 13:23.140
Kanan.

13:23.170 --> 13:30.790
$ 0. 00 atau adakah satu dan kemudian Anda meningkatkan waktu berikutnya Anda meningkatkan hasil

13:30.790 --> 13:32.680
Anda dari satu juta ke seperseribu.

13:32.860 --> 13:39.330
Dan dalam hal jika Anda menghitung kesalahan kuadrat Anda hanya mengurangi satu dari yang lain.

13:39.610 --> 13:44.980
Atau pada dasarnya dalam setiap kasus Anda Kalka di kotak dan Anda akan melihat bahwa kesalahan kuadrat ketika Anda

13:44.980 --> 13:48.210
membandingkan satu kasus dengan yang lain itu tidak banyak berubah.

13:48.220 --> 13:51.940
Anda tidak meningkatkan jaringan sebanyak itu ketika Anda melihat rata-rata di sana.

13:52.120 --> 13:58.750
Tetapi jika Anda melihat entropi silang karena Anda mengambil logaritma dan kemudian Anda membandingkannya dengan

13:58.750 --> 14:01.090
membagi satu ke yang lain.

14:01.390 --> 14:09.390
Anda akan melihat bahwa Anda telah benar-benar meningkatkan jaringan Anda secara signifikan sehingga melonjak dari satu juta menjadi 1000 dalam

14:09.460 --> 14:12.810
istilah kesalahan kuadrat berarti akan sangat rendah.

14:12.820 --> 14:15.710
Itu tidak penting dan tidak.

14:15.790 --> 14:22.270
Ini tidak akan memandu proses peningkatan gradien Anda atau propagasi punggung Anda ke arah yang benar.

14:22.340 --> 14:28.180
Semua itu akan dipandu ke arah yang benar tetapi itu akan menjadi seperti panduan yang sangat

14:28.540 --> 14:34.960
lambat itu tidak akan memiliki kekuatan yang cukup sedangkan jika Anda melakukan recross entropy lintas entropi akan mengerti

14:34.960 --> 14:42.220
bahwa meskipun ini adalah penyesuaian yang sangat kecil yang hanya Anda ketahui membuat perubahan kecil dalam hal absolut dalam hal relatif

14:42.220 --> 14:43.770
itu adalah peningkatan besar.

14:43.870 --> 14:46.110
Dan kita pasti menuju ke arah yang benar.

14:46.110 --> 14:54.820
Mari kita teruskan cara itu sehingga entropi silang akan membantu jaringan saraf Anda sampai ke keadaan optimal ke cara optimal

14:54.820 --> 15:01.090
adalah cara yang lebih baik bagi jaringan saraf untuk mendapatkannya ke keadaan optimal.

15:01.090 --> 15:08.260
Tetapi perlu diingat bahwa ini hanya berfungsi ketika melintasi entropi hanya metode yang disukai hanya untuk klasifikasi.

15:08.260 --> 15:14.200
Jadi jika Anda berbicara tentang hal-hal seperti regresi seperti yang kami miliki di jaringan saraf tiruan maka Anda

15:14.230 --> 15:20.770
lebih suka pergi dengan saya dan kesalahan kuadrat sedangkan cross entropy lebih baik untuk klasifikasi dan sekali lagi itu

15:20.770 --> 15:26.200
berkaitan dengan fakta bahwa kami menggunakan soft fungsi selanjutnya jadi itu semacam penjelasan intuitif tentang

15:26.200 --> 15:31.690
tempat yang bagus untuk belajar lebih banyak tentang itu jika Anda benar-benar tertarik pada Anda tahu

15:31.690 --> 15:34.740
mengapa kita menggunakan cross versus mean square error.

15:35.200 --> 15:43.160
Google video oleh Geoffrey Hinton disebut fungsi soft max output dan dia menjelaskannya dengan sangat baik dan Anda

15:43.160 --> 15:48.760
tahu menjadi bapak baptis yang dalam yang bisa menjelaskannya dengan lebih baik.

15:48.890 --> 15:51.680
Ngomong-ngomong, video apa pun oleh Geoffrey Hinton berwarna emas.

15:51.680 --> 15:55.590
Dia hanya punya bakat besar untuk menjelaskan banyak hal.

15:55.610 --> 16:01.310
Jadi itu bagus, bagus versus salib dan saya harap itu memberi Anda semacam pemahaman intuitif tentang apa yang terjadi

16:01.310 --> 16:02.110
di sini.

16:02.120 --> 16:08.030
Tetapi yang lebih penting bahwa Anda tidak menunda dengan istilah entropi silang karena judul akan menyebutkannya dalam cerita praktis

16:08.030 --> 16:11.280
dan saya ingin memastikan bahwa Anda siap untuk itu.

16:11.280 --> 16:15.740
Dan itu hanyalah cara lain untuk menghitung fungsi terakhir Anda.

16:15.740 --> 16:21.830
Dan cara lain untuk mengoptimalkan jaringan Anda yang secara khusus dirancang untuk masalah

16:21.860 --> 16:28.180
klasifikasi dan karenanya jaringan saraf convolutional dan datang bergandengan tangan dengan fungsi max lembut.

16:28.280 --> 16:35.480
Jadi bacaan tambahan jika Anda ingin pengenalan ringan ke lintas entropi jika Anda tertarik pada konsentrasi sedikit

16:35.480 --> 16:37.170
lebih tentu saja.

16:37.250 --> 16:43.370
Artikel yang bagus untuk dibaca disebut sebagai pengantar yang ramah untuk kehilangan lintas entropi oleh Rob

16:44.180 --> 16:45.280
DePietro 2016.

16:45.350 --> 16:46.860
Inilah tautan di bawah ini.

16:47.150 --> 16:54.350
Sangat sangat bagus, sangat lembut dan tidak ada matematika super rumit.

16:54.440 --> 16:59.660
Analogi yang baik Contoh yang baik menggunakan analogi mobil dan Anda melihat mobil dan berbicara

16:59.660 --> 17:04.910
tentang informasi dan bit dan pembatasan dan Anda tahu bagaimana Anda memecahkan kode Unico ini sehingga

17:04.910 --> 17:10.730
artikel bagus untuk dilihat dan kami akan memberi Anda ikhtisar yang baik dari entri silang seperti dari sudut

17:10.820 --> 17:11.680
pandang pengantar.

17:11.900 --> 17:18.590
Jika Anda ingin menggali ke dalam matematika berat seperti apa yang Anda lihat di sini maka periksa

17:18.680 --> 17:25.180
artikel oleh atau blog dengan cara menerapkan jaringan saraf Intermezzo juga sehingga dalam hal penggunaan

17:25.220 --> 17:27.410
seperti hal perantara seperti a.

17:27.550 --> 17:28.910
Intermittency dalam.

17:28.990 --> 17:35.690
Anda tahu seperti ketika Anda pergi ke teater dan Anda memiliki seperti jeda antara bagian pertama dan bagian

17:35.690 --> 17:36.290
kedua.

17:36.350 --> 17:40.820
Jadi karena dia seperti melalui semua langkah ini dan kemudian dia suka dan kemudian dia bilang aku

17:40.820 --> 17:42.210
harus menjelaskan ini dulu.

17:42.470 --> 17:44.080
Dan ya jadi itu sebabnya ini disebut intermezzo.

17:44.090 --> 17:51.620
Tidak ada alasan lain sejauh saya memahami artikel oleh Peter Rolands 2016 juga jadi keduanya cukup

17:51.620 --> 17:52.470
baru.

17:52.580 --> 18:00.150
Dan Anda tahu, periksa ini jika Anda ingin menggali matematika di balik entropi Kross di balik soft Max dan

18:00.150 --> 18:02.600
cross entropy dalam artikel ini sebenarnya.

18:02.930 --> 18:03.790
Jadi begitulah.

18:03.860 --> 18:07.360
Hanya itu yang ada pada keduanya.

18:07.370 --> 18:12.780
Semoga saya bisa menambahkan beberapa kejelasan tambahan dan semoga sukses dengan itu.

18:12.830 --> 18:16.970
Ini akan menyenangkan dan menikmati tutorial praktis.

18:16.970 --> 18:18.070
Sampai ketemu lain kali.

18:18.080 --> 18:19.700
Sampai kemudian menikmati belajar.
