WEBVTT

00:00.360 --> 00:06.480
Merhaba ve derin öğrenme dersine hoş geldiniz, bu, yumuşak ve çapraz entropi işlevleri hakkında

00:06.480 --> 00:08.670
konuşmak için ek bir öğreticidir.

00:08.670 --> 00:15.320
Konvansiyonel sinir ağlarından söz ettiğimiz bu bölümün ana bölümünde geçtiğimiz tüm bölümleri

00:15.330 --> 00:21.510
tamamlamak için yüzde 100 gerekli değildir ancak aynı zamanda bunun olacağını

00:21.510 --> 00:26.580
düşündüm. bilgi ve becerinin çantasına iyi bir ek.

00:26.580 --> 00:30.840
Öyleyse devam edin ve bu işlevleri araştıralım.

00:30.840 --> 00:37.530
olduğumuz şeyle başlamak, bölümün ana bölümünde yaptığımız bir sinir ağı sonucudur ve sonunda,

00:37.530 --> 00:44.210
bir köpek için doksan beş sıfır noktası için bazı olasılıkları ortaya çıkarır.

00:44.220 --> 00:48.000
Bu noktada, burada sahip 05 bir kedi için yüzde beş ya da yüzde 5.

00:48.060 --> 00:53.250
Soldaki bir fotoğrafın bir girdi olduğu göz önüne alındığında Bu, trenin yürütülmesinden

00:53.260 --> 00:57.210
sonra, aslında bu çalışıyor ve belirli bir görüntüyü sınıflandırıyor.

00:57.360 --> 01:00.850
Ve burada soru şu ki bu iki değer bir araya nasıl gelmektedir.

01:00.900 --> 01:06.750
Çünkü yapay sinir ağları hakkında öğrendiğim her şeyi bildiğim kadarıyla, bu

01:06.750 --> 01:11.600
iki son nöronun birbirine bağlı olduğunu söyleyecek bir şey yoktur.

01:11.730 --> 01:16.590
Peki, her birinin diğerinin değerinin ne olduğunu bildiklerinin değerinin ne olduğunu

01:16.590 --> 01:17.310
nasıl bilebilirlerdi.

01:17.400 --> 01:20.140
Ve değerlerini birine kadar nasıl ekleyeceklerini biliyor olurlardı.

01:20.340 --> 01:22.060
İyi cevap onlar olmaz olmasıdır.

01:22.260 --> 01:28.500
Yapay sinir ağının klasik versiyonunda ve yaptıklarının tek yolu, durumdan kurtulmamıza yardımcı

01:28.710 --> 01:33.960
olması için soft max fonksiyonu adı verilen özel bir fonksiyon tanıttığımızdan.

01:33.960 --> 01:40.890
Normalde köpek ve kedi nöronları herhangi bir tür gerçek değere sahip olmalıydı; öyle olması

01:41.490 --> 01:44.940
gerekmez, bir taneye kadar eklemek zorunda kalmazlar.

01:45.180 --> 01:51.900
Fakat oradaki en üstte yazılı olan ve bu değerlerin 0 ile 1 arasında olmasını

01:51.900 --> 01:58.430
sağlayacak olan yumuşak maksimum fonksiyonunu uygulayacağız ve 1 ile 3 PPTA'ya kadar toplamalarını sağlayacağız.

01:59.250 --> 02:04.320
Yumuşak maksimum fonksiyonu veya normalize edilmiş üstel fonksiyon, lojistik fonksiyonun genelleştirilmesidir,

02:04.350 --> 02:11.640
çünkü quote unquote squash, keyfi gerçek değerlerin k boyut vektörüne sahiptir ve sıfıra 1'e kadar

02:11.640 --> 02:15.320
bir aralıktaki gerçek değerlerin k boyut vektörüne eklenir.

02:15.330 --> 02:17.620
Yani temelde tam olarak ne istediğini yapar.

02:17.670 --> 02:22.700
Bu değerlerin 0 ile 1 arasında olmasını sağlar ve 1'e kadar eklediğinden emin olun.

02:22.960 --> 02:27.780
Ve işler yol bu mümkün olduğu şekilde olmasıdır çünkü biz burada

02:27.780 --> 02:29.970
altta bir toplamı olduğunu görebilirsiniz.

02:29.970 --> 02:38.100
üslüyü alır ve Zed'in gücüne koyar ve onu bir araya getirerek, sınıflarınızın tamamında bir iki vardır.

02:38.100 --> 02:38.830
Böylece,

02:38.850 --> 02:39.990
Bütün bu değerler.

02:39.990 --> 02:44.400
Ve orada normalleşmeniz burada gerçekleşiyor.

02:44.400 --> 02:51.300
Sos kutusu işlevi böyle işe yarıyor ve yumuşak bir sonraki işlevi konvolüsyonel sinir ağlarına

02:51.600 --> 02:59.490
dahil etmek mantıklı geliyor, çünkü bir köpek ve bir kedi olası bir sınıfına sahip olsaydınız ne

02:59.490 --> 03:05.140
kadar garip olurdu ve köpek sınıfında yüzde 80 olasılığınız vardı .

03:05.160 --> 03:08.660
Ve kedi pençeleri için yüzde 45'lerin iyi bir seviyedeydiniz.

03:08.670 --> 03:14.430
iyi oluyor ve çoğu durumda konvolüsyonel ve sinirsel ağlarda bu işi görüyor olacaksınız.

03:14.430 --> 03:19.760
Böyle mantıklı değil ve bu nedenle yumuşak bir sonraki işlevi tanıttığınızda daha

03:19.770 --> 03:26.010
Şimdi başka bir şey, yumuşak maksimum fonksiyonu Cross-entropi fonksiyonu olarak adlandırılan bir şeyle birlikte ele alınması

03:26.100 --> 03:29.040
ve bizim için çok kullanışlı bir şey olması.

03:29.050 --> 03:30.610
Şimdi formüle bakalım.

03:30.660 --> 03:33.090
Çapraz giriş işlevi bunun gibi görünür.

03:33.090 --> 03:38.910
Aslında yüzyılın bu gösterimini kullanacak farklı bir hesaplama kullanıyor olacağız, ancak

03:39.060 --> 03:40.670
sonuçlar aslında aynı.

03:40.670 --> 03:42.300
Bu hesaplamak daha kolaydır.

03:42.570 --> 03:49.220
Ve şunu biliyorum, şu an ekranda formülleri olan şeylerle pek ilgisi olmayan bir ses

03:49.850 --> 03:54.300
çıkarabilir, ancak bu bölümün sonunda ek okunması önerilir, bu

03:54.600 --> 03:56.380
yüzden matematiği kaldırmazsanız endişelenmeyin.

03:56.380 --> 03:58.350
Şu anda matematiğini açıklamamış olsak bile.

03:58.350 --> 04:03.630
Ancak buradaki nokta, entropi karşısında, entropi fonksiyonu boyunca iyi olanın olmasıdır.

04:03.630 --> 04:11.870
Yapay sinir ağlarında daha önce doğal performansımızı değerlendirmek için maliyet fonksiyonu olarak kullandığımız ortalama

04:11.880 --> 04:17.760
kare ok işlevi olarak adlandırdığımız bir fonksiyona sahip olduğumuzu hatırlayın.

04:17.760 --> 04:23.750
Amacımız ağ performansımızı optimize etmek için MSE'yi en aza indirmekti.

04:23.940 --> 04:31.830
Elimizdeki maliyet fonksiyonu o zaman orada ve konvolüsyonel sinir ağlarında MSE'yi kullanabiliriz ancak yumuşak maks

04:31.830 --> 04:38.070
fonksiyonu uyguladıktan sonra konvolüsyonel sinir ağlarında daha iyi bir seçenek, çapraz entropi

04:38.070 --> 04:39.840
fonksiyonu haline geldi.

04:39.840 --> 04:46.080
Ve konvolüsyonel sinir ağlarında, çarpraz girdi işlevlerini uyguladığınızda maliyet fonksiyonuna artık adı olmayan fonksiyona

04:46.080 --> 04:49.450
son fonksiyon denir ve bunlar çok benzerdir.

04:49.470 --> 04:55.520
Bunlar sadece küçük bir terminolojik farklılıklar ve biraz farklı ve ne demek istedikleri gibi.

04:55.530 --> 04:58.430
Ama her neyse, hemen hemen aynı şey.

04:58.450 --> 05:07.530
ağımızın performansını en üst düzeye çıkarmak için en aza indirgemek istediğimiz şey yine oluyor.

05:07.530 --> 05:09.670
Ve son işlevi,

05:09.690 --> 05:15.260
Bu nedenle, bu işlevin nasıl uygulanabileceğine ilişkin hızlı bir örneğe göz atalım.

05:15.260 --> 05:19.260
Yani ağıza bir köpek imgesi koyduğumuzu düşünelim.

05:19.650 --> 05:26.160
Köpek için öngörülen değer 0'dır. 9 ve bu eğitim yapıyor, böylece bir köpek olan

05:26.160 --> 05:27.330
etiketi bildiğimizi biliyoruz.

05:27.330 --> 05:34.140
Tahmini değeri 0. 9 kedi için prigged değeri 0'dır. 1 sonra burada etikete sahibiz, bu yüzden bir

05:34.140 --> 05:37.810
köpek biliyoruz çünkü bu köpekler için veya kedi için 0 1 eğitiyor.

05:37.980 --> 05:47.600
Ve bu durumda bu durumda, bu sayıları çapraz entropi için formülünüze bağlamanız gerekir.

05:47.810 --> 05:53.340
Bunu nasıl yaptın, soldaki değerleri sözlü ipucuna gidecek.

05:53.420 --> 05:58.940
Sağ taraftaki logaritma ve sağdan gelen değerler P'ye gidecek ve hangisinin

05:58.940 --> 06:04.340
oraya gittiğini hatırlamak önemlidir, çünkü onları yanlış alırsanız, bir logaritma

06:04.340 --> 06:09.620
almak istemiyorsunuz. tümü sıfır değerden ve / veya 1'den gidiyorum.

06:09.620 --> 06:11.660
Yani sadece onları takmak istiyorsun.

06:11.720 --> 06:14.520
Onları doğru yerlere taktığınızdan emin olun.

06:14.840 --> 06:17.030
Ve sonra siz bunu temel olarak eklediniz.

06:17.030 --> 06:22.370
entropinin ne olduğunu daha iyi anlamamıza tür sağlıyorsunuz. Daha az öyle olacak.

06:22.370 --> 06:28.130
Çapraz girdi nasıl işliyor ve biz şu an bakalım, şimdi bu işlevi gerçek hayatta

06:28.130 --> 06:32.360
uygulayan belirli bir adım adım bir adıma bakacağız ve Çapraz

06:32.360 --> 06:39.290
Amacım bu işe yaramam yüzyılın daha rahat olmasını sağlamak çünkü çok kıvrımlı

06:39.320 --> 06:43.840
sesler çıkarabiliyor ve hiç ses çıkarma ihtimali yok.

06:43.850 --> 06:50.870
Dönüşümsel sinir ağları gibi çok karmaşık ve korkutucu gelebilir ama değil.

06:50.870 --> 06:51.650
İşte nokta buydu.

06:51.650 --> 06:54.090
Öyleyse devam edelim ve uygulayalım, böylece korkunç olmadığını biliyoruz.

06:54.080 --> 06:56.350
Yani burada hepsi senin.

06:56.360 --> 07:01.790
Ayrıca bu, neden neden farklı neden işlevlerine baktığımızı açıklayacaktır.

07:01.790 --> 07:06.650
Bu yüzden sinir ağı bir sinir ağı, iki sinir ağımız olduğunu ve sonra

07:06.650 --> 07:11.960
bir köpeğin bir imgesini geçtiğimizi ve bunun bir kedi olmadığını bir köpek olduğunu bildiğimizi varsayalım.

07:12.200 --> 07:18.620
Ve sonra başka bir görüntü var bizim kedi bu kez bir hayvan ve bir kedi değil bir köpek ve burada

07:19.040 --> 07:22.490
biz aslında bir köpek bir kedi değil bir delik arıyoruz.

07:22.490 --> 07:24.280
Çok yakından bakarsan.

07:24.320 --> 07:28.440
Dolayısıyla, ilk olguda sinir ağlarımızın neler öngördüğünü görmek istiyoruz.

07:28.460 --> 07:36.110
köpek yüzde 10 kedi doğru ağ numarası yok 60 yüzde köpek yüzde 40 hala kedi kötü doğru.

07:36.110 --> 07:38.230
Sinir ağı 1 yüzde 90

07:38.270 --> 07:40.030
Ama doğru.

07:40.280 --> 07:46.040
İkinci seçenek ilk sinir ağı yüzde 10 kedi köpek yüzde 90 kedi.

07:46.040 --> 07:47.300
Doğru.

07:47.300 --> 07:53.560
Bu rakamın yüzde 30'u köpeklerin% 70'i daha kötü olduğunu biliyorsunuz, ancak yine de doğru.

07:53.570 --> 08:01.460
Ve sonra nihayet sinir ağı içinde görüntü yıl eski ağı kazandı yüzde 40 köpek yüzde 60 kedi

08:01.870 --> 08:08.270
yanlış sinir ağı sayısı yüzde 10 köpek ve yüzde 90 kedi yanlış ve kötü.

08:08.270 --> 08:15.380
sonuncusu üç imge boyunca sinir ağının sinir ağından daha iyi performans gösterdiğini yanlış anlamış olsa da.

08:15.620 --> 08:18.870
Burada kilit nokta, her iki net insan da

08:18.890 --> 08:27.010
Son durumda bile, köpek için sinir ağına karşı yüzde 40 şans gibi köpek vermiş olsaydı bile,

08:27.030 --> 08:32.330
köpeğe sinir ağı 2 ile kıyaslandığında bir tanesi yalnızca% 10 şans

08:33.200 --> 08:35.310
veya sinir ağı kazandırdı.

08:35.520 --> 08:41.780
Ve şimdi biz derecelendirmeden bahsettiğimiz performansı ölçebildikleri işlevlere

08:41.780 --> 08:42.800
bakacağız.

08:43.040 --> 08:48.090
Bu yüzden bunları bir masaya koyalım, böylece yanlış numaraya sahip sinir ağı var.

08:48.350 --> 08:49.430
Bu resim numarası.

08:49.550 --> 08:51.140
Ve sonra görüntü biriniz için.

08:51.140 --> 08:54.010
Yüzde 90 köpek şempanzesi ve kedi tahmininde ne var.

08:54.110 --> 09:00.550
Marable'ın şapkası var ve gerçek değerin var, bu yüzden köpek doğru kedi yanlış.

09:00.560 --> 09:07.460
İki numaralı resim için aynı şey ve aynı şey en az üç ve aynı numaralı sinir ağı için

09:07.460 --> 09:07.720
aynıdır.

09:07.750 --> 09:11.060
Bu yüzden Köpek yüzde 60'ı ilk imajda yüzde 40'ı tuttu.

09:11.060 --> 09:13.800
Croton'ların kedi olmadığını kehanetle tahmin ettikleri şey de budur.

09:13.820 --> 09:14.820
Ve bunun gibi.

09:15.200 --> 09:18.050
Ve şimdi, şimdi hangi hataları alabileceğimizi görelim.

09:18.050 --> 09:24.940
Performansını tahmin etmek ve ağlarımızın performansını izlemek için hangi hataları hesaplayabiliriz?

09:24.950 --> 09:28.480
Bu yüzden bir hata türü sınıflandırma hatası olarak adlandırılır.

09:28.640 --> 09:33.990
Ve bu temel olarak sadece onu doğru mu yapmadın mı istiyor mu diye soruyor.

09:34.010 --> 09:36.940
Olasılıklara bakılmaksızın, hemen SAĞLAYINIZ.

09:36.950 --> 09:37.970
Yoksa doğru anladınız mı.

09:37.970 --> 09:44.790
Her iki sinir ağında da her iki durumda da bir sinir ağı var.

09:44.810 --> 09:46.330
İşte böyle yanlış yaptın.

09:46.340 --> 09:48.460
Böylece üçünden bir tanesi yanlış çıktı.

09:48.470 --> 09:54.960
Ağınız için yüzde 33 hata oranı ve sinir ağı için yüzde 30 hata oranı.

09:55.100 --> 09:59.750
Bu açıdan bir temel olarak, her iki sinir ağı da aynı seviyede performans gösteriyor ancak bunun doğru

09:59.750 --> 10:00.250
olmadığını biliyoruz.

10:00.260 --> 10:04.400
Sinir ağı Ikhwan'ın sinir ağı performansını aştığını biliyoruz.

10:05.120 --> 10:10.850
Bu nedenle, bir sınıflandırma hatası, özellikle geri yayılım ortalama karekök hata amaçları için iyi

10:11.810 --> 10:17.960
bir ölçü değildir ve Excel'de bu hesaplamaları yapma şeklinize göre sadece onlarla birlikte olmak istemiyordum

10:17.960 --> 10:22.010
ama Tony sadece oturup bunları bir kağıtta veya Excel'de yapın.

10:22.010 --> 10:28.760
Bunlar basit hesaplamalardır, sadece temel olarak kareli hataların toplamını alır ve

10:28.760 --> 10:35.010
ardından gözlemlerin ortalamasını alırlar ve bu da hemen hemen aynıdır.

10:35.060 --> 10:43.320
Sinir ağı için sinir ağı 2 için yüzde 25, sinir ağında ise yüzde 71 hata oranı elde edersiniz,

10:43.330 --> 10:45.930
bu nedenle bunu daha doğru görürsünüz.

10:45.940 --> 10:50.380
Bize neredeyse birinin kendi ağınızdan daha düşük bir hata oranına sahip olduğunu söylüyor.

10:51.150 --> 10:52.970
Ve sonra tekrar entropiyi çaprazla.

10:52.990 --> 10:57.250
Bunu hesaplayabildiğiniz formülü gördük. Bunun anlamı, ortalama karesel hatadan hesaplamak daha kolaydır. Entropi karşısında

10:57.250 --> 11:04.780
çapraz alan, sinir ağları 1 ve 1 için yüzde 38'lik bir oran sağlar. ağı 2 için 0 6.

11:04.780 --> 11:05.350
Sinir

11:05.500 --> 11:08.180
Sonuçların biraz farklı olduğunu görebilirsiniz.

11:08.350 --> 11:16.510
Minik oyuk alanını ve çapraz entropiyi bildiğinize baktığınızda onlara böyle bakarsanız ve çapraz

11:16.510 --> 11:26.350
entropiyi neden kareli hata anlamına gelirken kullanırsınız sorusu yalnızca söyledikleri sayılara benzemekle birlikte, hepsi bu hesaplamalar

11:26.350 --> 11:32.030
sadece hepsinin hepsinin yapabileceğini size göstermek içindir, sadece bir

11:32.050 --> 11:34.680
kağıt üzerinde yapabileceğiniz gibi yapamazsınız.

11:34.780 --> 11:37.890
Çok yoğun matematik değildir.

11:37.890 --> 11:41.130
Bunlar oldukça basit basit şeylerdir.

11:41.200 --> 11:47.680
Ancak, neden ortalamalara neden entropi kullanırsınız sorusu demek çok güzel bir soru sormanız

11:47.680 --> 11:48.250
demektir.

11:48.250 --> 11:58.530
Bunun cevabının çapraz entropinin, ortalama karesel hata üzerinde bariz olmayan birçok avantajı

11:58.540 --> 12:01.430
olduğunu sormuştunuz diye sevindim.

12:01.450 --> 12:07.160
Bu yüzden bir çiftten bahsedeceğim, ancak o zaman size daha fazlasını nerede bulabileceğinizi size bildiririm.

12:07.160 --> 12:18.550
Dolayısıyla bunlardan biri, örneğin arka yayılımınızın başlangıcında, çıktı değerinizin çok çok çok

12:18.550 --> 12:22.260
küçük, çok küçücük olmasıdır.

12:22.360 --> 12:25.680
Dolayısıyla, istediğiniz gerçek değerden çok daha küçüktür.

12:25.750 --> 12:32.920
O zaman başlangıcında, harika ve terbiyeli dünyadaki degrade çok düşük olacak ve

12:32.920 --> 12:33.840
yeterli olmayacak.

12:33.850 --> 12:40.630
Sinir ağı aslında bir şeyler yapmaya ve hareket etmeye başlamanın ve bu ağırlıkları ayarlamaya başlamasının

12:40.630 --> 12:45.010
ve Movistar'ın doğru yönde hareket etmeye başlaması çok zor.

12:45.130 --> 12:50.920
Çapraz entropi gibi bir şeyi kullandığınızda, bu logaritmayı içerdiğinden aslında ağın böyle

12:51.400 --> 12:57.310
küçük bir alanı bile değerlendirmesine ve bununla ilgili bir şeyler yapmasına yardımcı olur.

12:57.310 --> 12:58.520
İşte bunu düşünmek için.

12:58.520 --> 13:03.260
Diyelim ki yine de bunun içinde çok sezgisel bir yaklaşım var.

13:03.410 --> 13:08.830
Matematiğe bir bağlantı olacak ve bunları daha ayrıntılı olarak matematik yoluyla türetebileceksiniz

13:08.830 --> 13:11.260
ancak çok sezgisel bir yaklaşım.

13:11.260 --> 13:16.030
İstediğiniz sonucunu beğenelim diyelim.

13:16.030 --> 13:22.810
Bu bir ve şu anda milyonda birinin birinde.

13:22.870 --> 13:23.140
Sağ.

13:23.170 --> 13:30.790
0 $. 00 var mı yoksa bir tane var mı ve sonra bir sonraki döneme göre

13:30.790 --> 13:32.680
bir milyonda bin'den binlere kadar iyileştiğini düşünüyorsun.

13:32.860 --> 13:39.330
Ve karesel hatayı hesaplarsan, sadece birini diğerinden çıkarırsın.

13:39.610 --> 13:44.980
Veya temelde her durumda bir kare içinde Kalka'yorsunuz ve bir kasa karşılaştığınızda

13:44.980 --> 13:48.210
karekök hatalarının diğerine kıyasla çok fazla değişmediğini göreceksiniz.

13:48.220 --> 13:51.940
Ortalık kareye baktığınız zaman ağınızı pek geliştirmediniz.

13:52.120 --> 13:58.750
Ancak eğer bir logaritma aldığınız için çapraz entropiye bakıyorsanız ve bunu bir

13:58.750 --> 14:01.090
diğerine bölmekle karşılaştırıyorsunuz demektir.

14:01.390 --> 14:09.390
Ağınızı önemli derecede iyileştirdiğinizi göreceksiniz, böylece ortalama kareli hata terimlerinde bir milyon ile

14:09.460 --> 14:12.810
1000 arasında atlama çok düşük olacaktı.

14:12.820 --> 14:15.710
Önemsiz olacak ve olmayacak.

14:15.790 --> 14:22.270
Gradyan artırma işleminizi veya geri yayılımınızı doğru yönde yönlendirmez.

14:22.340 --> 14:28.180
Hepsi doğru yönde yönlendirilecek ancak çok yavaş bir rehber olacak, ancak

14:28.540 --> 14:34.960
yeterli güce sahip değil. Entropi üzerinde çapraz entropi yaparsanız, bunları bildiğiniz çok

14:34.960 --> 14:42.220
küçük ayarlamalar olsa bile anlarsınız göreceli olarak mutlak terimle ufak bir değişiklik büyük

14:42.220 --> 14:43.770
bir gelişmedir.

14:43.870 --> 14:46.110
Ve kesinlikle doğru yönde ilerliyoruz.

14:46.110 --> 14:54.820
Bu yoldan devam edelim, böylece çapraz entropi, sinir ağınızın doğru duruma gelmesine yardımcı olacak ve

14:54.820 --> 15:01.090
sinir ağı optimal bir hale getirmek için daha iyi bir yoldur.

15:01.090 --> 15:08.260
Fakat unutmayın ki, bunun sadece entropi karşısında sınıflandırma için yalnızca tercih edilen yöntem olduğu durumlarda çalışır.

15:08.260 --> 15:14.200
Yapay sinir ağlarında sahip olduğumuz gerileme gibi şeylerden söz ediyorsanız, çapraz entropi sınıflandırma için daha

15:14.230 --> 15:20.770
iyi ise de yine de yanımıza kare koymayı tercih ediyorsunuz ve yine de yumuşak kullandığımız gerçeği ile

15:20.770 --> 15:26.200
ilgisi var. bir sonraki fonksiyona bakalım, bu, bu konuda biraz daha fazla bilgi edinmek

15:26.200 --> 15:31.690
için iyi bir yer olduğunun sezgisel bir açıklaması olduğu için, neden gerçekten sizinle ilgileniyorsanız,

15:31.690 --> 15:34.740
neden çapraz kareler ortalaması karesi hatası kullandığımızı biliyoruz.

15:35.200 --> 15:43.160
Google, Geoffrey Hinton'un yaptığı bir video, yumuşak maksimum çıkış fonksiyonunu çağırdı ve bunu çok iyi açıkladı

15:43.160 --> 15:48.760
ve zaten daha iyi açıklayan kim olduğunu öğrenmenin vaftiz babası olduğunu biliyorsunuz.

15:48.890 --> 15:51.680
Ve bu arada, Geoffrey Hinton'un herhangi bir videosu altın renktedir.

15:51.680 --> 15:55.590
Her şeyi zaten açıklamak için büyük bir yeteneği var.

15:55.610 --> 16:01.310
Bu, çapraz karşısında o yumuşak hoş ve umarım size neyin olup bittiğini sezgisel bir

16:01.310 --> 16:02.110
anlayışa benzemektedir.

16:02.120 --> 16:08.030
Ancak daha da önemlisi, başlık çapraz entropi ile işe koyulmadığınızı çünkü başlık pratik hikayelerden

16:08.030 --> 16:11.280
bahsedecek ve bunun için hazırlandığınızdan emin olmak istedim.

16:11.280 --> 16:15.740
Ve bu son işlevi hesaplamanın başka bir yoludur.

16:15.740 --> 16:21.830
maksimum işleviyle el ele gelen ağınızı en iyi duruma getirmenin başka bir yolu.

16:21.860 --> 16:28.180
Ve sınıflandırma problemlerine ve dolayısıyla konvolüyonel sinir ağlarına özel olarak uyarlanmış ve yumuşak

16:28.280 --> 16:35.480
Bu yüzden ek okumalar, entropiye çapraz ışık girmek istiyorsanız ilgileniyorsanız tabii

16:35.480 --> 16:37.170
biraz daha yoğunlaşın.

16:37.250 --> 16:43.370
Kontrol etmek için iyi bir makale, Rob DePietro 2016'nın entropi kaybını çaprazlamak için samimi bir

16:44.180 --> 16:45.280
giriş olarak adlandırılır.

16:45.350 --> 16:46.860
İşte bağlantı aşağıda.

16:47.150 --> 16:54.350
Çok çok hoş çok yumuşak ve hiçbir şey süper karmaşık bir matematik değildir.

16:54.440 --> 16:59.660
biliyorum ve biz size giriş açısından benzer bir çapraz girişin iyi bir genel görünüşü.

16:59.660 --> 17:04.910
İyi benzetmeler araba benzetimleri kullanarak iyi örnekler ve araba ve bilgi ve bitler ve

17:04.910 --> 17:10.730
kısıtlamalar hakkında konuşmalar bakmak ve nasıl bir bakmak için iyi bir makale bu bütün Unico

17:10.820 --> 17:11.680
bu çözecektir

17:11.900 --> 17:18.590
Eğer gördüğünüz gibi yoğun matematiğe girmek isterseniz, Intermezzo'nun kullanımı açısından çok sinir ağı

17:18.680 --> 17:25.180
Intermedizo'nun nasıl uygulanacağı ile ilgili bir makaleyi ya da bir blogu inceleyin. Ara

17:25.220 --> 17:27.410
gibi bir şey var gibi.

17:27.550 --> 17:28.910
İçinde kesiklik var.

17:28.990 --> 17:35.690
tiyatroya gittiğinizde ilk parçayla ikinci bölüm arasında bir mola vermek gibi bir şey biliyorsunuzdur.

17:35.690 --> 17:36.290
Bir

17:36.350 --> 17:40.820
Bu yüzden bütün bu adımları atmaktan hoşlanıyor ve sonra seviyor ve sonra bunu

17:40.820 --> 17:42.210
önce açıklamam gerektiğini söylüyor.

17:42.470 --> 17:44.080
Ve evet, bu yüzden intermezzo deniyor.

17:44.090 --> 17:51.620
Peter Rolands 2016'nın makalelerini de anladığım kadarıyla başka bir gerekçe yok ki her ikisi de

17:51.620 --> 17:52.470
oldukça yeni.

17:52.580 --> 18:00.150
Ve aslında, bu makaledeki yumuşak Max ve çapraz entropinin arkasındaki Kross entropisinin ardındaki matematiğe

18:00.150 --> 18:02.600
girmek isterseniz bunu kontrol edin.

18:02.930 --> 18:03.790
İşte gidiyoruz.

18:03.860 --> 18:07.360
Bu ikisinin hepsi bu kadar.

18:07.370 --> 18:12.780
Umarım bazı netlik ve şans getiririm.

18:12.830 --> 18:16.970
Eğlenceli olacak ve pratik derslerden keyif alacaksınız.

18:16.970 --> 18:18.070
Bir dahaki sefere görüşürüz.

18:18.080 --> 18:19.700
O zamana kadar öğrenmenin tadını çıkarın.
