WEBVTT

00:00.630 --> 00:04.800
Merhaba ve bugün derin öğrenme kursuna hoş geldiniz diyelim, bugün Max havuzdan

00:04.800 --> 00:07.380
bahsediyoruz ve önümüzde çok heyecan verici kayaklar var.

00:07.500 --> 00:10.930
Ve öğreticinin sonundaki özel bir sürpriz bile.

00:11.010 --> 00:12.440
Öyleyse başlayalım.

00:12.450 --> 00:15.860
Birincisi, ne toplanıyor ve neden ona ihtiyacımız var.

00:16.050 --> 00:19.650
Bu soruyu cevaplamak için bu görüntülerin üzerindeki bu görüntülere bir göz atalım.

00:19.650 --> 00:20.780
Bir çita var.

00:20.790 --> 00:23.680
Aslında ilk imgede aynı çita olduğunu.

00:23.680 --> 00:29.640
Bu görüntü düzgün bir şekilde konumlandırılmış ve ikinci görüntü üzerinde size doğru bakıyor.

00:29.640 --> 00:30.660
Biraz döndürüldü.

00:30.660 --> 00:32.710
Ve üçüncü görüntü biraz ezildi.

00:32.790 --> 00:40.020
Ve işte buradaki şey, sinir ağının bu görüntülerin her birinde çiteyi

00:40.020 --> 00:41.450
tanımasını istiyoruz.

00:41.460 --> 00:43.230
Aslında bu sadece bir çita.

00:43.230 --> 00:45.070
Ya farklı atıcılarımız varsa.

00:45.090 --> 00:46.120
İşte bir çita.

00:46.180 --> 00:47.250
O bir çita.

00:47.400 --> 00:53.130
İşte onun Ashira'nın Ishida çetesinin başka bir çitidir ve o bir çita ve

00:53.130 --> 01:01.110
biz sinir ağının tüm bu püskürtücülerden paçavralar olduğunu fark etmesini istiyoruz ve her biri farklı yönde görünüyorsa hepsinin

01:01.110 --> 01:06.300
farklı kısımlarında olduğunu nasıl yapabilirim? görüntüleri, yüzlerinin farklı olduğu görüntülerin bir yerine

01:06.300 --> 01:10.080
yerleştirilir. Biri sağ tarafta, sol köşede biri veya

01:10.080 --> 01:10.700
ortada.

01:11.010 --> 01:14.280
Hepsi biraz farklıdır ve doku biraz farklıdır.

01:14.280 --> 01:16.200
Aydınlatma biraz farklıdır.

01:16.200 --> 01:21.600
Bir sürü küçük fark vardır ve bu nedenle eğer sinir

01:21.810 --> 01:29.700
ağı tam olarak belli bir özelliğe bakarsa, örneğin çitenin ayırt edici bir özelliği, gözlerindeki veya

01:29.700 --> 01:35.310
gözlerden uzanan gözyaşlarıdır Gözyaşlarına benzeyen Gölge gölgeleri Gözlerinden aşağıya inen desen

01:35.310 --> 01:40.890
burun kenarında ve Cheetah'ın ayırıcı bir özelliği olan gözyaşlarına benziyor.

01:40.890 --> 01:48.660
Ancak eğer belirli çitalarından öğrendiği bu özelliği tam bir konumda, kesin bir şekil veya

01:48.660 --> 01:53.370
formda veya dokudan arıyorsanız, diğer atıcıları asla bulamazlar.

01:53.460 --> 02:01.410
konvolümantasyonumuzla fakiriz, ancak özelliklerin özelliklerden biraz daha yakın olması veya özellikleri biraz daha

02:01.440 --> 02:10.170
farklı olması halinde özellikler biraz farklılaşırsa özen göstermek zorunda değildir birbirine göreceli olarak.

02:10.520 --> 02:16.460
Dolayısıyla, sinir ağımızın mekansal değişmezlik adı verilen ve özelliklerin tekrar

02:16.800 --> 02:23.400
nerede olduğunun önemi kalmayan bir özelliğe sahip olduğundan emin olmalıyız, çünkü

02:23.400 --> 02:29.940
resmin hangi kısmında kaşınırız ki biz onu almış bulunuyoruz haritamızla birlikte

02:29.940 --> 02:30.210
&nbsp;

02:30.210 --> 02:37.230
Dolayısıyla, özellik biraz bozulmuşsa, sinir ağımız bu özelliği hala bulabilmek için bir

02:37.410 --> 02:39.930
miktar esnekliğe sahip olmalıdır.

02:40.050 --> 02:42.690
Ve havuzun amacı buydu.

02:42.690 --> 02:45.140
Dolayısıyla, havuzun nasıl çalıştığı hakkında bir göz atalım.

02:45.180 --> 02:51.090
İşte özellik haritamız, zaten konvolüsyonumuzu tamamladık ve o kısmı tamamladık ve şimdi konvolüyon

02:51.090 --> 02:52.680
ile orada çalışıyoruz.

02:52.680 --> 02:53.880
Şimdi havuz uygulamaya devam edeceğiz.

02:53.880 --> 02:54.690
Peki nasıl işliyor

02:54.690 --> 02:56.420
Geri havuz uygulamak için başvuracağız.

02:56.670 --> 03:01.640
Birkaç farklı türde oynamaya uygunluk vardır, bunlar havuzun bir araya getirilmesi ve hikayenin

03:01.710 --> 03:03.440
sonuna doğru yorumlanmaları anlamına gelir.

03:03.540 --> 03:11.040
ve o kutuya maksimum değeri buluyorsunuz ve yalnızca o değeri kaydediyorsunuz ve diğer üçünü de göz ardı ettiniz.

03:11.040 --> 03:15.020
Fakat şu an sadece Max havuz kullanıyoruz, böylece iki piksel

03:15.030 --> 03:21.900
iki piksel alıyoruz ve yine iki piksel olmak zorunda değilsiniz, herhangi bir kutu boyutunu seçebilir ve yine

03:21.900 --> 03:26.310
bunun üzerine yorum yapacaktır. Tauriel ve onu sol üst köşeye koydunuz

03:26.310 --> 03:30.600
Dolayısıyla kutunuzda, sadece üçünü dikkate almadığınız dört değeriniz var, bu durumda yalnızca bir

03:30.600 --> 03:31.830
tanesini göz ardı etmiyorsunuz.

03:31.830 --> 03:36.210
Ardından, kutunuzu bir adım daha sağa doğru, bir adım daha seçtiğinizde hareket ettirirsiniz.

03:36.210 --> 03:41.850
Yani burada iki adım atıyoruz ve seçtiğiniz birinin adımını söyleyebildiğiniz gibi normalde çektiğiniz şey

03:41.850 --> 03:42.880
de bu.

03:42.990 --> 03:47.940
Çakışan kutular var, isterseniz üçümüzden hoşlanacağınız herhangi bir grev çeşidini seçebilirsiniz, ancak burada iki

03:48.770 --> 03:52.440
kişilik bir adım belirliyoruz ve yaygın olarak kullanılan şey budur.

03:52.470 --> 03:57.660
Sonra tekrar ederseniz, kaydettiğiniz işlemi tekrarlarsanız, burada geçerseniz ve önemsiyorsanız,

03:57.660 --> 04:00.080
yaptığınız şeyi yapmaya devam edin.

04:00.090 --> 04:05.690
Hâlâ burada maksimum 0 kayıt yapıyorsunuz burada maksimum 4'tür.

04:05.700 --> 04:11.380
Burada maksimumlar 1 0 1 veya 2 ve sonra 1'dir.

04:11.400 --> 04:13.970
Gördüğün gibi, bir kaç şey oldu.

04:13.980 --> 04:18.890
Her şeyden önce özelliklerini doğru bir şekilde korumayı başardık.

04:19.080 --> 04:23.730
Gösterdikleri azami rakamlar, çünkü Lehre'nin nasıl sonuç verdiğini biliyoruz.

04:23.730 --> 04:28.650
Özellik haritanızdaki maksimum veya büyük sayıların, bir özelliğe en yakın

04:28.650 --> 04:31.480
benzerliği bulduğunuz yeri temsil ettiklerini biliyoruz.

04:31.650 --> 04:38.250
Ancak bu özellikleri bir araya getirdiğimizde, öncelikle,

04:38.250 --> 04:46.110
aradıklarımızın önemli olmadığı özellik olmayan yüzde 75'ten kurtulduk, çünkü

04:46.220 --> 04:49.410
dörtte üçümüz piksel .

04:49.710 --> 04:51.510
Yani sadece yüzde 25 alıyoruz.

04:51.510 --> 05:00.260
ya da sahip olduğumuz değerlerin maksimumunu piksellerden aldığımız için herhangi bir bozulma var.

05:00.770 --> 05:04.160
Ve sonra da, çünkü biz

05:04.160 --> 05:12.810
Mesela, göz kamaştıran gözlerdeki göz yaşları bir resimde solda bir miktar var ya da

05:12.830 --> 05:16.550
biraz sola, diğeri de biraz döndürüldü.

05:16.580 --> 05:22.100
Ve nasıl olması gerektiği ya da bizden birisini üs olarak kabul edersek ve bir tane daha bitler sola

05:22.100 --> 05:23.800
dönersek nasıl olur da böyle oluruz.

05:24.060 --> 05:26.570
Çekilen özellik aynı olacak.

05:26.570 --> 05:32.900
Dolayısıyla cheater'ın gözyaşlarından bahsedecek olursak, o zaman bu dört olduğunu söyleyelim ve burada

05:32.900 --> 05:36.050
biraz döndürülmüş olsaydı, burada burada olduğunu görebilirsiniz.

05:36.050 --> 05:38.270
Mesela dördü buraya geldi.

05:38.390 --> 05:44.180
Sonra, havuzlamayı yaptığımızda aynı havuz özellik haritasını alacağız ve bunun

05:44.180 --> 05:46.270
arkasındaki prensip bu.

05:46.430 --> 05:52.340
Tekrar sezgisel bir açıklama yapan yine çok kaba bir açıklama,

05:52.340 --> 06:00.290
ancak özelliklerin korunabilmesi ve ayrıca olası mekânsal veya dokusal veya diğer çarpıklıkları hesaba katabildiğimizin

06:00.290 --> 06:02.330
toplanması noktasında budur.

06:02.420 --> 06:07.370
Ve hepsine ek olarak boyutu küçültüyoruz, böylece başka bir yararı var.

06:07.370 --> 06:13.520
ki bu da işlem açısından bize yardımcı olacak çok büyük.

06:13.520 --> 06:19.700
Dolayısıyla, alansal değişmezleri tanıttığımız özellikleri koruyoruz, boyutunu yüzde 75 oranında azaltıyoruz,

06:19.870 --> 06:25.970
Ayrıca, havuzlamanın bir başka yararı, parametrelerin sayısını azalttığımızdan% 75 oranında tekrar

06:26.690 --> 06:31.370
azaltmamız veya sinir ağının son Lar'lerimize gidecek parametrelerin

06:31.370 --> 06:35.270
sayısını azaltmamız ve dolayısıyla aşırı uyumu önlüyoruz.

06:35.300 --> 06:42.580
Bilgiyi kaldırdığımızı havuzlamanın çok önemli bir yararıdır ve bu iyi bir şeydir.

06:42.590 --> 06:50.660
çünkü bu şekilde modelimiz bu bilgilere fazla yetişemeyecektir çünkü özellikle bu bilgiler iyi değildir ve en başta

06:50.690 --> 06:54.500
hatırladığımız gibi insan olarak insan için bile olsa

06:54.950 --> 07:00.650
bizleri görmek önemlidir gözlerimize gelen diğer tüm gürültüye değil tam olarak özelliklere.

07:00.650 --> 07:02.520
Bu iyi bir şey

07:02.780 --> 07:09.070
Sinir ağları için de aynı şey, gereğinden fazla uyumu önlemeyle yardımcı

07:09.080 --> 07:12.470
olduğumuz gereksiz önemli oluşumu dikkate almadan.

07:12.500 --> 07:14.590
Dolayısıyla, havuzlama konusu bu.

07:14.600 --> 07:21.500
Ve burada soru, elbette WiMax'ın neden çok sayıda farklı havuz biriktirme ve genişlemiş

07:21.710 --> 07:26.780
genişliği iki ile iki piksel arasında değişen çok şey var.

07:26.780 --> 07:33.980
bu notta sizi Bonn Üniversitesi'nden Dominic Scherrer'in nesne tanıma için konvolüyonal mimaride

07:33.980 --> 07:40.250
havuzlama operasyonlarının değerlendirilmesi denilen bu güzel araştırma kağıdına tanıtmak isterim.

07:40.250 --> 07:41.100
Ve

07:41.180 --> 07:47.540
Bu kağıt hakkında bir bağlantı var ve güzellik çok basit çok basit olmasıdır Yani

07:47.550 --> 07:51.530
vermek istediğiniz şeyden önce hiç bir araştırma makalesi okumadıysanız.

07:51.530 --> 07:54.440
Bu, çok kısa bir sürede başlamak için harika bir yer.

07:54.440 --> 07:55.400
Sadece 10 sayfa.

07:55.400 --> 07:56.810
Okunması çok kolay.

07:57.080 --> 08:03.170
Üstelik ekstra fayda, konvolüsyon ve havuzlamayı ele aldığımıza göre, bu

08:03.170 --> 08:07.040
makalede bahsettikleri her şeye rahatça sahip olacaksınız.

08:07.100 --> 08:11.880
Bu aslında güçlendirmenin harika bir yoludur ve ayrıca bu kağıdı kontrol etmenizi tavsiye ederim.

08:11.930 --> 08:18.050
Okumak için 20 dakikanızı ayıracağım ve biraz esrarengiz ya da yabancılaşmış gibi hissediyorsa, ilgili iş

08:18.050 --> 08:19.880
olarak adlandırılan 2. bölümü atlayabilirsiniz.

08:19.880 --> 08:21.230
Sadece o kısmı okumayın.

08:21.290 --> 08:23.950
Doğrudan bölüm 1'den bölüm 3'e gidin.

08:24.020 --> 08:29.600
Ve bu makalede bilmeniz gereken bir şey, alt örnekleme olarak adlandırılan bir kavramdan

08:30.360 --> 08:33.230
bahsediyorlar, bu temelde ortalama havuz oluyor.

08:33.230 --> 08:36.260
Bu yüzden nasıl olduğumuzu hatırlayın.

08:36.280 --> 08:37.400
Maksimum miktarı alıyoruz.

08:37.400 --> 08:43.250
Yani maksimum değer alan kare hesaplamamızda Ortalama havuzlama denilen bir kavram var ya da bazıları

08:43.250 --> 08:48.590
ortalama havuzlamaya kadar bu değerlerin sadece bir kısmını çektiğinizde ya da bunların hepsinden ortalama

08:48.650 --> 08:53.890
değeri aldığınız ve alt örneklemenin alınması, bir genellemeye benzemek gibi. erkeklerin bir araya toplanması.

08:53.900 --> 09:00.840
Bu, bu değerlerin ortalamasının alınmasına yönelik daha genel bir yaklaşım türüdür.

09:00.860 --> 09:05.480
Ve kağıtta biraz daha okuyabilirsiniz, aksi takdirde bir kağıt okurken bunu ortalama

09:05.480 --> 09:06.620
havuz olarak düşünebilirsiniz.

09:06.920 --> 09:11.180
bu konuyla ilgili ek bilgi edinebilirsiniz ve şimdi nereden geldiğimizi özetleyelim.

09:11.210 --> 09:12.310
İşte bu yüzden

09:12.320 --> 09:14.440
Dolayısıyla giriş imajımız var.

09:14.870 --> 09:18.960
Sonra konvolüsyon operasyonunu uyguladık ve sonuç aldık.

09:19.070 --> 09:24.230
Ve şimdi alacağımız özellik haritalarının her birine Pullinger uyguladık.

09:24.260 --> 09:30.590
Dolayısıyla, iki aşamalı evrim ve havuzlaşma yaptık ve artık heyecan verici bir şey çok

09:30.590 --> 09:32.160
eğlenceli bir şeyler yapacağız.

09:32.220 --> 09:40.340
yapacağız, bu yüzden Adam Harley tarafından oluşturulan ve Ryerson Üniversitesi bilgisayar bilimleri bölümünde hazırlanan bir

09:40.340 --> 09:48.140
araçtan aldığım bir ekran görüntüsü ve şimdi Carnegie Mellon'da olan, sayfasını yaparken düşünüyorum.

09:48.320 --> 09:49.750
Bu işi deney

09:50.060 --> 09:53.150
Ve harika bir araç, o halde bir göz atalım.

09:53.270 --> 09:55.780
Böylece onu aslında Google aracılığıyla bulabileceğinizi görebilirsiniz.

09:55.780 --> 09:57.500
Rolünü bilmelisin.

09:57.500 --> 10:03.790
Sanki Google üzerinden bulmak zor çünkü burada sadece bu yıl olduğu gibi bir metin yok.

10:03.930 --> 10:08.350
Reierson dosyasının başlangıcını ve bu şeyleri göreceğim.

10:08.510 --> 10:14.820
Ve temelde bu yaptığımız şey ama görselleştirmek Yani burada bir numara çizmeniz

10:14.820 --> 10:21.330
gerekiyor yani dört numaralı çizelgeye geçelim ve bu araç sayı dörtünü buraya koyacak.

10:21.340 --> 10:22.960
İşte senin imge.

10:22.960 --> 10:26.620
İlk adımımızda bu konvolüsyon basamağıdır.

10:26.800 --> 10:27.100
Sağ.

10:27.100 --> 10:30.390
Ve bu havuzlama aşamasıdır ve bu arada havuzlama da aşağı örnekleme olarak adlandırılmaktadır.

10:30.390 --> 10:33.770
Yani çekme ve aşağı örnekleme aynı şeylerdir.

10:33.930 --> 10:39.190
Böylece, konvolüsyon uygulandığını, daha sonra havuzlamanın uygulandığını ve bunun nasıl çalıştığını görebilirsiniz.

10:39.190 --> 10:44.290
Ne tür döndürmeler uyguladığını veya ne gibi görünen filtreleri uyguladığını

10:44.290 --> 10:45.020
görebilirsiniz.

10:45.130 --> 10:47.630
Hangi özellikler aranıyor?

10:47.830 --> 10:53.340
Ve daha sonra havuzlama uygulanır, böylece boyutu azaltıyor ve burada bunun önemli olduğunu görebilirsiniz.

10:53.380 --> 11:01.090
Dolayısıyla bu görüntünün konvolüsyonlu görüntüsü olduğunu ve bu görüntünün çekilen görüntü olduğunu görebilir ve yine aynı özelliklerin

11:01.090 --> 11:05.830
daha az bilgi olduğunu, aynı özelliklerin doğru özelliklerini koruduğunu görebilirsiniz.

11:05.830 --> 11:08.110
Önemli olan budur.

11:08.350 --> 11:14.170
Dahası, eğer her dörtün biraz biraz yan tarafa döndürülmüş gibi davranıp yumuşatılmadığını biliyorsanız, yine

11:14.170 --> 11:16.960
de benzer havuz Lares'i almaya devam edebileceksiniz.

11:17.050 --> 11:19.810
Ve sonra bundan sonra henüz konuşmadığımız daha fazla mektup var.

11:19.810 --> 11:26.840
O halde, burada bulunmayacak başka bir konvolüyonlu konvolüsyon bir ini var.

11:27.130 --> 11:30.730
Ve sonra başka bir zavallı sığ yanıyor, ancak temelde aynı işlemi tekrar ediyor.

11:31.000 --> 11:34.880
Ve bundan sonra kursta daha çok konuşacağız.

11:34.910 --> 11:37.610
Tam bağlı Lares'leri var.

11:38.080 --> 11:39.880
Ancak bununla kesinlikle uğraşabilirsiniz.

11:39.880 --> 11:47.890
Dolayısıyla 7'yi çizecek olursam beğendiğinizi sildim, tahmin edersiniz ki bunun bir 7 olduğu

11:47.890 --> 11:49.410
tahmin ediliyor.

11:49.570 --> 11:52.850
Ve ikincisi ikinci ihtimalin üç olduğunu tahmin ediyor.

11:53.050 --> 11:56.440
Böylece bazı zorlayıcı şeyler çizebilir ve onları alıp alamayacağını görebilirsiniz.

11:56.440 --> 12:02.680
Diyelim ki, 0'a benzeyen bir şey çizseydim bitmiş 0 değilse, almayı bırakın, almadım

12:02.770 --> 12:03.730
bu sefer.

12:03.730 --> 12:06.190
Resme 9 kat daha benziyor.

12:06.190 --> 12:08.550
Ya ben hoşlansam böyle bitirirsem ne olur.

12:08.560 --> 12:14.430
Şimdi 0 ya da 9 olduğunu düşünüyor ve orada 0'ın aydınlatıcı olduğunu görebilirsiniz.

12:14.460 --> 12:16.600
Ancak şüphe için bu bölümden bahsedeceğiz.

12:16.720 --> 12:20.030
Bir tane daha 8 gibi diyelim mi?

12:20.260 --> 12:23.780
Bence bu şimdi 8 alabilmemiz oldukça zor.

12:23.800 --> 12:29.590
Böylece, 8'e girdiğini görebilir ve bundan sonra durağanların tanınabilir olmasını durdurur, böylece

12:29.590 --> 12:31.570
insanlar bize mantıklı gelir.

12:31.570 --> 12:32.150
Sağ.

12:32.170 --> 12:34.390
Çalıştığı bu özellikler.

12:34.570 --> 12:38.710
Fakat aynı zamanda 8 yaşında olduğunu doğru bir şekilde tanır.

12:39.100 --> 12:42.540
Kesinlikle yüzünüzü surat çizerek eğlendirin.

12:42.550 --> 12:43.460
O zaman ne olacak.

12:44.310 --> 12:50.070
Aracın açıkça sadece 0'dan 9'a kadar olan basamaklar üzerinde eğitilmiş olması nedeniyle bu araç için bu

12:50.070 --> 12:50.950
üçlüğe benziyor.

12:51.120 --> 12:58.530
Öyleyse orada olan bir şeyi tanımak zorundasınız ve daha önce hiç muhallebi elması ya da başka

12:58.530 --> 13:05.700
bir şey gibi görmediğiniz bir tür meyve gibi bir şey gördüğünüzde üçte birinin hayatta olduğu

13:06.120 --> 13:12.570
gibi tanıdığını ve bunun onun Armut, çünkü aslında burada ne bulacağınızı bilmeden önce hiç

13:12.570 --> 13:18.210
görmediniz, böylece aslında suratlı yüzler üzerinde eğitim almadı ve bu yüzden ağaç

13:18.210 --> 13:20.480
olarak bir ağaç olduğunu düşünüyor.

13:20.490 --> 13:25.770
bir piksel pikselinin üzerine fare koyduğunuzda, bununla oynamak sizin için faydalı olacaktır.

13:26.130 --> 13:29.430
Dolayısıyla, çok güçlü ve güçlü bir araçtır; göstereceğiniz

13:29.430 --> 13:36.930
Özellik dedektörünün o pikseli nereden alacağını size gösterir, böylece o piksellerin nereden geldiğini

13:36.930 --> 13:43.170
görebilir ve böylece filtrenin resimden nasıl geçtiğini, tam olarak nasıl ve

13:43.170 --> 13:47.910
nereden bahsettiğimizi ve tabii ki burada nasıl bir

13:47.910 --> 13:58.140
şey olduğunu görebilirsiniz. çekmeyi çekmenin bittiğini ikiden ikiye bölen küçük bir kare ile yaptığını ve günümüzdeki öğreticide tartıştığımız

13:58.200 --> 14:03.730
gibi ikisinin de bir adım olduğunu görebildiğini görebildiğini görebilirsiniz.

14:03.960 --> 14:09.240
Dolayısıyla oyun oynamaya veya onunla oyun oynamaya gidin ve umarım bugünkü oturumdan hoşlanırsınız.

14:09.240 --> 14:10.610
Bir dahaki sefere seni görmek isterim.

14:10.620 --> 14:12.470
Ve o zamana kadar derin öğrenmenin keyfini çıkarın.
