WEBVTT

00:00.680 --> 00:05.570
Merhaba ve eğitici eğitime devam etmek için bugün eğitici eğitime devam

00:05.600 --> 00:06.600
etmekten hoşlanıyoruz.

00:06.890 --> 00:13.610
Daha önce öğrendiğimiz şey, bir sinir ağı için gerçekleşmesi gereken şeyleri öğrenmek için

00:13.610 --> 00:21.140
geri yayılım olması ve bu hatanın farkı veya y şapkası ve Y arasındaki karekötik

00:21.170 --> 00:28.300
toplamların toplamı sinir ağı ve ağırlıkları üzerinden geri iletildiğinde ortaya çıkmıştı. buna göre ayarlanır.

00:28.520 --> 00:34.220
Bu yüzden onu gördük ve bugün bu ağırlıkların nasıl ayarlandığını tam olarak öğreneceğiz.

00:34.400 --> 00:35.930
O halde bir göz atalım.

00:36.080 --> 00:44.030
noktada bazı giriş değerlerimiz var, o zaman bir etkinleştirme fonksiyonunu beklemek zorundayız uygulanır.

00:44.030 --> 00:52.280
Bu bir sinirsel çalışmanın basit bir versiyonudur algılayıcısı Trauner tek bir harfli ileri beslemeli

00:52.280 --> 00:57.000
sinir ağıdır ve burada görebildiğimiz, işlemin tümü bu

00:56.990 --> 01:01.850
Biz şapkayı alıyoruz ve daha sonra maliyet fonksiyonunu hesapladığımız gerçek değere kıyasla.

01:01.850 --> 01:05.420
Maliyet fonksiyonunu nasıl en aza indirebiliriz?

01:05.420 --> 01:07.370
Bunun hakkında ne yapabiliriz.

01:07.370 --> 01:14.750
yaptığımız şeyin, örneğin bin ağırlığı diyelim denemek için kaba kuvvet yaklaşımım olduğunu. ve biz bunları

01:14.750 --> 01:20.990
maliyet fonksiyonu için böyle bir şey alacağını denemek isteriz ve bu, Y ekseni

01:21.080 --> 01:26.240
üzerinde çapraz fonksiyonel yatay eksende yatay eksen üzerinde bir çizelgedir.

01:26.810 --> 01:32.900
Bunu yapmanın bir yaklaşımı, mümkün olan her ağırlığı alıp onlara baktığımızda ve hangisinin

01:32.900 --> 01:34.770
en iyi görüneceğini ve

01:34.860 --> 01:39.200
Ve formülleri görebildiğin için E eksi Y kare yaptı.

01:39.230 --> 01:42.470
Maliyet işlevinin böyle bir şeye benzeyeceği şey budur.

01:42.670 --> 01:47.830
Ve temel olarak, en iyisini burada bulmuş olacaksın.

01:47.950 --> 01:50.980
Yani çok basit çok sezgisel yaklaşım.

01:50.980 --> 01:53.200
Neden bu kaba kuvvet yöntemini yapmıyorsun?

01:53.200 --> 02:01.630
parametre veya ağırlık girişi için binlerce farklı maliyet deneyelim ve hangisinin en iyi çalıştığını görün.

02:01.690 --> 02:03.030
Binlerce farklı

02:03.030 --> 02:04.230
Bu şekilde en iyisini bulacaksınız.

02:04.420 --> 02:10.270
Peki bunu optimize etmek için yalnızca bir yolunuz varsa, ancak ağırlık sayısını

02:10.480 --> 02:16.630
artırdıkça ağınızdaki Synopsys sayısını artırırsanız boyutsallık laneti ile karşı karşıya kalmanız gerekir.

02:16.630 --> 02:19.370
Ve öyleyse boyutsallığın nedeni nedir?

02:19.450 --> 02:24.510
Bunu açıklamak veya açıklamak için en iyi yol, pratik bir örneğe bakmaktır.

02:24.640 --> 02:30.610
Bu nedenle, nasal şebekelerin aslında bir mülk değerlemesi için bir sinir

02:30.610 --> 02:37.120
ağı kurduğumuz veya çalıştırdığımızda nasıl bir işe yaradığından bahsederken yaşadığımız bu örneği hatırlayın.

02:37.120 --> 02:43.030
Bu yüzden, ağırlıkları hangisinin ne olduğunu bilmeden önce eğitilmeden önce eğitilmediğinde zaten

02:43.030 --> 02:45.290
iyi eğitildiğinde nasıl göründü.

02:45.550 --> 02:47.640
Gerçek sinir ağı buna benzer.

02:47.730 --> 02:54.860
Doğru, çünkü tüm bu farklı olası sonuçlara sahibiz ve yine de ağırlıkları

02:55.280 --> 03:01.190
eğitmek zorundayız ve burada toplam 25 ağırlığa sahibiz. Başlangıçta beş,

03:01.310 --> 03:03.430
toplamda 25 ağırlık var.

03:03.680 --> 03:09.060
Ve nasıl 25 yolu zorla kaba kuvvet edebileceğimizi görelim.

03:09.070 --> 03:12.610
Burası çok basit bir sinir ağı.

03:12.620 --> 03:20.630
Çok basit bir tanesi vuruldu ve bu boyuttaki bir sinir ağı yoluyla yolumuza nasıl

03:20.630 --> 03:21.320
zorlayabiliriz.

03:21.320 --> 03:24.370
Bazı basit matematiksel hesaplamalar var.

03:24.410 --> 03:25.890
25 ağırlığımız var.

03:25.910 --> 03:30.410
Bu, yani her ağırlığa göre çözeceğimiz bin kombinasyonumuz varsa toplam

03:30.410 --> 03:37.790
kombinasyon sayısı 1000'e, 25 farklı veya bin veya 10'a kadar değişerek beş farklı kombinasyonun ayrıştırılacağı anlamına gelir.

03:37.790 --> 03:48.260
Şimdi, Sun'ın Haziran 2016 itibariyle dünyanın Fosse süper bilgisayarını nasıl aydınlatacağını, bu soruna nasıl

03:48.260 --> 03:49.700
yaklaşacağını görelim.

03:49.700 --> 03:52.390
Doğru, bu yüzden Sunway kimin kucaklaştığını bağla.

03:52.680 --> 04:00.980
Görünüşe göre, bu bir süper bilgisayar için tamamen büyük bir bina ve Fosses süper bilgisayarı

04:01.310 --> 04:04.940
olduğu için Guinness Dünya Rekoru'na benziyor.

04:05.210 --> 04:12.620
Şimdilik dünyanın en hızlı süper bilgisayarı ve bazı yollar kravat ışıkları

04:12.620 --> 04:15.420
93 flop hızla çalışabiliyor.

04:15.510 --> 04:19.900
Flop, saniyede yüzen işlem anlamına gelir.

04:19.970 --> 04:23.310
Böylece, güç yağına doksan üç eder.

04:23.340 --> 04:28.010
Saniyede 15 kayan operasyonun on katına.

04:28.100 --> 04:32.340
Karşılaştırma bu kadar hızlı.

04:32.450 --> 04:38.210
Ortalama bilgisayarlar şimdi birkaç gigaflops üzerinde oynamayı severler vb.

04:38.210 --> 04:41.320
Bu yüzden bu aralıklardan hoşlanıyor.

04:41.450 --> 04:44.290
TEI Sunway tipi ışıktan daha az.

04:44.390 --> 04:47.950
Birdenbire, teknolojinin ön saflarında yer alan bir yalan var.

04:48.360 --> 04:57.920
Ve varsayalım ki, kendi ağınızdaki dört birleşimi tek bir diskette test edebilir ve mümkün olmayan tek bir

04:58.010 --> 05:04.220
kayan işlemi kendi başına tek bir ağırlığı test etmek için birden

05:04.220 --> 05:09.470
fazla yüzen operasyona ihtiyacınız olduğu için pratik değildir varsayalım biraz.

05:09.480 --> 05:11.270
Ama yine de başlayalım başlayalım.

05:11.270 --> 05:17.990
Diyelim ki, onu bir kayan operasyonda bir kayan operasyon başına bir test yapabileceklerini yapabilecek ideal

05:18.290 --> 05:19.900
bir dünyada yapabilirsiniz.

05:20.120 --> 05:23.970
Doddridge hala beşten fazlasına eğilimi gerektirir demektir.

05:24.080 --> 05:33.080
Bu testlerin hepsini ağ üzerinden kaba kuvvet uygulamak için doksan üç kez on ila yaklaşık 15 saniye

05:33.080 --> 05:34.120
arasında bölün.

05:34.130 --> 05:39.860
Yani bir veya yaklaşık olarak 58 saniyelik güç eğilimi gösterir ve

05:39.860 --> 05:42.120
bu 50 yıllık güce eğilimlidir.

05:42.170 --> 05:49.910
Bu, evrenin varolduğu uzun bir sayıdır ve kesinlikle bu

05:49.910 --> 05:59.150
sayı çok büyük değildir, sadece bizim için optimizasyonumuzda hiç çalışmamaktadır.

05:59.150 --> 06:00.020
İşte gidiyoruz.

06:00.140 --> 06:01.220
Bu hayır hayır.

06:01.220 --> 06:05.450
Dünyanın en hızlı süper bilgisayarında bile Sunway kuyruk lambası.

06:05.450 --> 06:10.140
Dolayısıyla, optimum ağırlığı nasıl bulacağımız konusunda farklı bir yaklaşım düşünmeliyiz.

06:10.310 --> 06:15.890
Bu arada, sinir ağlarımız bu gibi bir şeye benziyorsa ya da o

06:15.890 --> 06:22.740
zamandan daha büyükse, evet onun hiç gerçekleşmeyeceği çok basit bir şekilde sinir ağımız çok basitti.

06:22.760 --> 06:28.490
Dolayısıyla, metodun gradiyent inişi olarak adlandırılacağı ve bunu zaten duymuş olabilirsiniz.

06:28.580 --> 06:30.770
Değilse, şimdi ne olduğunu öğreneceğiz.

06:30.840 --> 06:41.780
Maliyet fonksiyonumuz var ve şimdi, en iyi seçeneği bulmak için nasıl daha hızlı bir yol

06:41.840 --> 06:43.190
bulabileceğimizi görüyoruz.

06:43.190 --> 06:45.920
Öyleyse, bir yere başlayacağınıza bir yere başlayalım diyelim.

06:45.920 --> 06:47.390
O halde oraya başlayalım.

06:47.390 --> 06:56.990
bu noktadan sonra ne yapacağımızı o noktada maliyet fonksiyonunun açısına bakacağız. Dolayısıyla, temelde gradyan

06:56.990 --> 07:00.800
denilen şeyi farklılaştıracağımız için gidiyoruz.

07:00.800 --> 07:02.090
Üst soldaki

07:02.150 --> 07:04.190
Matematik denklemlerine bakmayacağız.

07:04.250 --> 07:09.370
Bir sonraki dersin sonunda ek okuma ile ilgili bazı ipuçları vereceğiz.

07:09.740 --> 07:17.150
Ancak temel olarak, yalnızca belirli bir noktadaki eğimin ne olduğunu ayırt etmeniz ve eğimin olumlu veya

07:17.150 --> 07:19.330
olumsuz olup olmadığını öğrenmeniz gerekir.

07:19.450 --> 07:25.640
Eğer eğim bu durumda olduğu gibi negatif ise, yokuş aşağı doğru gidiyorsanız sağa sola

07:25.640 --> 07:27.350
yokuş aşağı gidiyorsanız demektir.

07:27.350 --> 07:29.780
Ve buradan oraya gitmek zorunda olduğun anlamına geliyor.

07:29.780 --> 07:31.510
Temelde yokuş aşağı gitmek gerekir.

07:31.670 --> 07:33.070
Ve biz de bunu yapacağız.

07:33.090 --> 07:35.510
Boom sağa bir adım atıyor.

07:35.510 --> 07:37.450
Top tekrar aşağıya iner.

07:37.460 --> 07:38.300
Aynı şey.

07:38.390 --> 07:44.120
Eğimi hesaplarsınız ve eğim pozitiftir; yazarın yokuş yukarı solu yokuş aşağı gelir ve

07:44.120 --> 07:46.560
sola çıkmanız gerekir ve topun üzerindesiniz.

07:46.790 --> 07:54.900
iyi BEKLEYİCİLERİ nasıl bulursunuz? Maliyet işlevinizi en aza indirgeyen en iyi durum.

07:55.040 --> 08:04.520
Yine eğimi hesaplarsanız ve buradaki tüm boğaysanız, giderseniz gidersiniz, basit terimlerle bunu nasıl bulursunuz, en

08:04.590 --> 08:08.970
Elbette bir bilye yuvarlaması çok zikzak tipi bir yaklaşım olacak

08:09.210 --> 08:14.970
gibi olmayacak ama hatırlamak daha kolay ya da tür yuvarlanırken ona bakmak daha eğlenceli.

08:14.970 --> 08:19.980
Ama gerçekte evet sadece bir adım gibi yaklaşıyor olacak

08:19.980 --> 08:21.920
yöntemin zikzak tipi olacak.

08:22.050 --> 08:25.020
Evet, ayrıca birçok başka öğe var.

08:25.050 --> 08:35.190
neden aşağıya iniyorsa, neden neden çizginin üzerinde ilerlemiyor ki aşağıdan yukarıya doğru yukarıdan aşağı

08:35.190 --> 08:40.740
yukarı atlayabildiniz ve böyle çakıştırabileceğiniz parametreler var.

08:40.740 --> 08:41.950
Örneğin niçin

08:41.970 --> 08:45.570
Ve yine burada daha fazla bilgi edinebileceğiniz noktadan bahsedeceğiz.

08:45.580 --> 08:51.090
Ve ayrıca bunu pratik bir uygulamada yapacağız, ancak en basit sezgisel yaklaşımda olan biten

08:51.090 --> 08:51.770
şey budur.

08:51.780 --> 08:56.670
Sadece hangi yoldan gitmemiz gerektiğini anlayarak altına giriyoruz.

08:56.700 --> 09:01.890
Kaba kuvvet binlerce, binlerce ve milyonlarca, milyarlarca ve katrilyonlarca kombinasyon

09:01.890 --> 09:02.920
zorlamak yerine.

09:03.030 --> 09:09.920
nereye eğimli olduğu ya da bir tepede durduğunuzu hayal ettiğiniz yere her defasında sadece bakabilirsiniz.

09:09.910 --> 09:11.690
Sizin gibi her yöne

09:11.700 --> 09:15.870
Hangi yönden aşağı ineceğini ve hangi yönde gittiğini hissediyor ve sizden 50 adım

09:15.870 --> 09:20.760
öteye giderken böyle yürümeye devam ederseniz tekrar bu şekilde aşağıya doğru gidiş yönünü de tekrar

09:21.090 --> 09:21.470
değerlendiriyorsunuz.

09:21.500 --> 09:24.620
Tamam, 50 adım atacağım veya daha az 40 adım atacağım.

09:24.690 --> 09:28.160
Dolayısıyla, yaklaştıkça gittikçe azalıyor.

09:28.530 --> 09:32.720
Dolayısıyla, iki boyutlu bir alanda uygulanan eğim iniş örneği.

09:32.720 --> 09:36.450
Bu, tek boyutlu bir örnekti.

09:36.570 --> 09:41.880
Burada, eğim iniş için, minimuma daha yakınlaştığını görebileceğiniz ve bir degrade

09:41.970 --> 09:48.450
kökenli olarak adlandırıldığından, maliyet fonksiyonunun asgari seviyesine indiğinizden ve üç aşamada uygulanan bir

09:48.480 --> 09:53.430
eğim inişinin olduğunu bulabileceğiniz iki boyutlu bir alana sahibiz boyutları.

09:53.430 --> 09:58.740
İki boyuta yansıtıyorsanız, asgari seviyeye doğru zikzak yaparken görebileceğiniz gibi

09:58.740 --> 09:59.600
görünen budur.

09:59.700 --> 10:03.810
Dolayısıyla, Tauriel'in degradasyon endeksi oldu. Stochastic hakkında konuşacağız.

10:03.810 --> 10:06.850
Gradient inişi aslında bu öğreticinin bir devamıdır.

10:07.020 --> 10:08.720
Ve sizi orada görmek çok isterim.

10:08.740 --> 10:10.610
Ve bir dahaki sefere derinden öğrenmenin keyfini çıkarın.
