WEBVTT

00:00.640 --> 00:02.940
Merhaba ve derin öğrenme kursuna hoş geldiniz.

00:02.970 --> 00:09.120
Bugün, birimlerinizde düzeltilen bir ipucu hakkında konuşuyoruz ve bu

00:09.120 --> 00:12.180
konvansiyon adımımıza ek bir adım.

00:12.180 --> 00:16.140
Yani ayrı bir adım değil, temelde bir adım küçük bir adım.

00:16.290 --> 00:18.230
Ve burada neler oluyor.

00:18.240 --> 00:24.090
Elimizde girdi imajımız var, burada tartıştığımız konvolüsyon var ve bunun

00:24.090 --> 00:26.080
üzerine biz de uygulayacağız.

00:26.400 --> 00:27.190
Bunun için bekle.

00:27.240 --> 00:36.720
En sevdiğimiz doğrultucu fonksiyonu ve yapay sinir ağları üzerindeki önceki bölümdeki doğrultucu

00:36.750 --> 00:47.400
fonksiyonunu biliyorsunuz ve bu nedenle bazen yazarlarımız veya eğitmenlerimiz konvolüsyon ve doğrudan ateşi örneklerimizde

00:47.430 --> 00:54.030
iki ayrı adım olarak ayırıyorlar; Sonra redresör ikinci evrim

00:54.030 --> 00:57.060
için büyük bir adım.

00:57.270 --> 01:03.750
Doğrultucuyu uygulamanızın nedeni, imajımızdaki veya ağımızdaki ve ticari sinir ağımızdaki

01:03.780 --> 01:13.410
doğrusal olmayanlığı artırmak istediğiniz için ve o yangın bu filtre gibi davranırsa veya o fonksiyona

01:13.440 --> 01:19.200
erişip arızalanırsanız ağımızdaki doğrusal olmayanlığı artırmamızın sebebi, özellikle birbirine

01:19.440 --> 01:25.950
yakın nesneleri veya arka planı farklı nesneleri algılarsanız ve görüntü

01:26.010 --> 01:32.790
doğrusal olmayan öğelerden oluştuğunu düşünürseniz, görüntülerin kendilerini son derece doğrusal olmamasından

01:33.180 --> 01:38.050
kaynaklanır. ve bitişik pikseller arasındaki geçiş genellikle doğrusal olmayacaktır.

01:38.040 --> 01:41.280
Biliyorsun, çünkü sınırları farklı renkler farklı.

01:41.460 --> 01:46.020
Resimlerinizde farklı öğeler var ve aynı zamanda, bildiğiniz konvolüsyon

01:46.020 --> 01:52.410
gibi bir matematiksel işlemi uygularken ve özellik haritalarımızı oluşturmak için bu özellik

01:52.710 --> 01:59.710
algılamasını çalıştırdığımızda lineer bir şey oluşturabileceğimizi ve bu nedenle parçalanmamız gerektiğini de hikaye.

01:59.970 --> 02:05.960
Öyleyse burada bir görüntüye ve orijinal görüntüye bir göz atalım.

02:05.970 --> 02:13.220
Şimdi bu görüntüye bir özellik algılama detektörü uyguladığımızda böyle bir şey elde ederiz.

02:13.290 --> 02:16.230
Böylece burada siyahın negatif beyazın da pozitif değer olduğunu görebilirsiniz.

02:16.230 --> 02:22.980
Bir özelliği detektörü uyguladığınızda, sadece sıfırlar ve olanlar olmaksızın çok sayıda farklı değerlere sahip olan ve daha önce

02:22.980 --> 02:28.890
gördüğümüz gibi uyguladığınız uygun bir görüntüye benzeyen bir görüntü uyguladığınızda, Teksas kendi içinde olumsuz değerlere sahip

02:29.070 --> 02:30.920
olabilir, bazen negatif değerler alırsınız.

02:31.080 --> 02:34.670
Ve işte siyah olanlar negatif beyaz olanlar pozitiftir.

02:34.800 --> 02:45.240
Doğrusal doğrusal bir birim işlevi ne yapar, sıfıra düşen sıfırın altındaki her şeydeki tüm siyah

02:45.240 --> 02:46.490
hakları kaldırır.

02:46.560 --> 02:49.160
Ve bundan ötürü bu doğruya dönüşüyor.

02:49.290 --> 02:57.990
Dolayısıyla, lineerliği parçalama açısından fayda tam olarak ne olduğunu görmek oldukça

02:58.050 --> 02:58.910
zor.

02:59.400 --> 03:01.050
Açıklamaya çalışacağım.

03:01.080 --> 03:07.740
Bu görüntü üzerinde bir örnek göstermeye çalışacağım, ancak günün sonunda bu çok matematiksel bir kavram ve

03:07.740 --> 03:12.480
neler olup bittiğini gerçekten açıklamak için çok sayıdaki matematiğe geçmek zorunda kalacak.

03:12.480 --> 03:13.800
Ama bir göz atalım deneyelim.

03:13.800 --> 03:16.800
Yani mesela buna bakalım.

03:16.860 --> 03:17.580
Buradaki bina.

03:17.580 --> 03:18.070
Sağ.

03:18.090 --> 03:20.150
Yani bu kendi başına bir bina.

03:20.730 --> 03:22.400
Sonra bu gölgeyi görebilirsiniz.

03:22.440 --> 03:29.010
Bu siyah kısım bu gölge burada, beyazın yansımasını görüyor ve daha sonra gri görünüyor ve daha

03:29.010 --> 03:33.160
koyu hale geliyor ve daha sonra daha koyu hale geliyor.

03:33.240 --> 03:35.860
Bu yüzden ve onu çıkardığımızda o kara noktayı çıkarıyoruz.

03:35.860 --> 03:38.220
Doğrusallık açısından doğru düşünün.

03:38.250 --> 03:43.700
Dolayısıyla, beyazdan griye gittiğinde bir sonraki adım siyah olur gibi görünüyor.

03:43.740 --> 03:50.970
Hemen sonraki siyah, parlaktan karanlığa lineer bir ilerleme olduğu için bu tür

03:50.970 --> 03:53.490
bir lineer duruma benziyor.

03:53.490 --> 03:56.560
Siyahı çıkardığınızda doğrusallığı parçalarsınız.

03:56.670 --> 03:57.800
Başka bir tane deneyelim.

03:58.050 --> 03:59.110
Bir göz atalım buraya.

03:59.220 --> 04:01.980
Ve aynı zamanda hala aynı bina haklı.

04:01.980 --> 04:08.320
Senin ya da senininken değil, iki banyoyu birbirine karıştırdığın gibi

04:08.550 --> 04:09.810
değil, ikincil.

04:09.810 --> 04:11.940
Temel nokta doğrusallığı parçalamaktır.

04:12.210 --> 04:13.590
O halde burada aynı şeyleri bir göz atalım.

04:13.590 --> 04:19.480
Yani beyaz gri siyah gri beyaz görüyorsunuz.

04:19.590 --> 04:22.520
Ve onu parçaladığınızda, artık doğru olanın yok.

04:22.530 --> 04:29.600
Sadece bir ani değişikliğe uğrayan kademeli ilerlemenin ilerleyişine sahip değilsin.

04:29.730 --> 04:33.540
Ve bu, görüntünüze doğrusal olmayanlık getirmeye yardımcı olur.

04:33.540 --> 04:42.540
Bu yüzden, teknik değil, parmakların açıklaması üzerinde çok hoşunuza giden çok kaba bir açıklama var, ancak umarım bu,

04:42.690 --> 04:47.370
burada bahsettiğimiz konuyu biraz daha iyi anlamanıza yardımcı olur.

04:47.370 --> 04:54.870
Böylece yine burada, beyaz griyi daha koyu, daha koyu, koyu ve koyu renkten daha parlak koyultaya göre daha iyi bir

04:54.980 --> 04:55.680
örnek görebilirsiniz.

04:55.680 --> 05:04.460
Dolayısıyla bu bölüm, yine böldüğünden daha incedir, bu yüzden bu çok kaba bir açıklama.

05:04.480 --> 05:08.570
Kesinlikle mükemmel değil, en azından neler olup bittiğine dair bir fikir verir.

05:08.800 --> 05:14.120
Ancak, daha fazla bilgi edinmek isterseniz, her zaman olduğu gibi iyi bir kağıt da vardır, hep bir kağıt vardır.

05:14.200 --> 05:20.370
Bu, Kaliforniya Üniversitesi'nden CCJ kolordu tarafından yapılır ve matematiksel bir modeli olan

05:20.380 --> 05:22.980
konvolüsyon sinir ağlarını anlama denir.

05:23.200 --> 05:28.840
Ve temel olarak onlar sorulara cevaplar ve ilkine bakmanız yeterlidir.

05:28.840 --> 05:33.820
Ve soru şu ki, tüm ara katmanların filtre çıktısında doğrusal olmayan

05:33.820 --> 05:36.130
bir aktivasyon fonksiyonu gerekli değildir.

05:36.220 --> 05:44.280
Dolayısıyla bu tür hem sezgiler açısından hem de çoğunlukla matematik açısından biraz daha ayrıntılı olarak açıklıyor.

05:44.320 --> 05:47.970
Bu, bu konuyla ilgili daha fazla bilgi edinebileceğiniz ilginç bir kağıt.

05:48.100 --> 05:53.360
Ve gerçekten burada kazmak ve bazı güzel şeyler burada keşfetmek istiyorsanız.

05:53.360 --> 05:55.690
Ardından, ilginizi çekebilecek başka bir kağıt daha var.

05:55.690 --> 06:01.720
Doğrultucuya görüntü ve sınıflandırma üzerindeki insan seviye düzeyindeki performansı aşan derine

06:01.720 --> 06:02.830
derleme deniyor.

06:02.920 --> 06:09.190
Ve burada yazar saçları ve Microsoft Research'ten başkalarını tarıyor.

06:09.400 --> 06:17.630
Farklı tipte düzeltilmiş yağsız ünite fonksiyonu öneriyorlar.

06:17.650 --> 06:21.830
Sağ tarafta gördüğünüz parametrik düzeltilmiş fonksiyonu öneriyorlar.

06:22.030 --> 06:26.740
Ayrıca, performanstan ödün vermeden daha iyi sonuçlar verdiğini savunuyorlar.

06:26.740 --> 06:30.200
Bu konuyla biraz daha ilgilenmek için çok ilginç.

06:30.490 --> 06:32.020
Ve bugün hepsi içindir.

06:32.280 --> 06:38.380
Gerçekten katman oldukça basit, sadece doğrultucu işlevini ayarlamak için, sizi bir dahaki sefere görmeyi

06:38.380 --> 06:39.230
sabırsızlıkla bekliyoruz.

06:39.250 --> 06:40.770
O zamana kadar öğrenmenin tadını çıkarın.
