WEBVTT

00:00.390 --> 00:02.550
Merhaba ve bu öğreticiye hoş geldiniz.

00:02.550 --> 00:02.870
Tamam.

00:02.880 --> 00:08.370
Dolayısıyla önceki derslerde beynimizi yaptık veya eğer A-3 için beyinleri istersen şimdi

00:08.370 --> 00:09.560
bu beyni eğitmeliyiz.

00:09.660 --> 00:15.240
Fakat beynini eğitmek için, bu aleti kullanan ve öngörüleri ile hedefler arasındaki hataya

00:15.240 --> 00:20.820
ne kadar katkıda bulunduklarına göre ağırlığı almak için ortada bir sigara yapacak bir

00:20.940 --> 00:21.900
iyileştiriciye ihtiyacımız var.

00:22.200 --> 00:29.790
şimdiye kadar yaptığımız şey, birinci ve ikinci modülde, eğitimde torch tarafından atom optimizerini kullandık.

00:29.910 --> 00:30.660
Ve

00:30.840 --> 00:38.260
Fakat size söylendiği gibi çok zorlu bir problemle uğraşıyoruz ve A-380 algoritması

00:38.260 --> 00:41.560
bu sorunu çözmek için yeterli değil.

00:41.580 --> 00:48.480
Yaşları beklemeden bu sorunu çözmek için bazı özelleştirilmiş iyileştiricilere ve farklı püf noktalarına

00:48.480 --> 00:49.340
ihtiyacımız var.

00:49.530 --> 00:56.790
İşte bunu yapmak amacı bu ve atom optimizasyonunu temel alan ayrı bir özel optimizerimiz var

00:56.790 --> 00:57.990
bu yüzden.

00:58.200 --> 01:02.680
Ve bu paylaşılan düşman sınıfında ve paylaşılan atomda neden yer alıyor.

01:02.880 --> 01:08.190
Bunun nedeni aslında atom optimizeridir ancak paylaşılan Devletler üzerinde çalışacaktır.

01:08.190 --> 01:12.840
Bunun sonucunda nasıl çalıştığını açıklayacağız ve işe yaramaya çalışacağız.

01:12.840 --> 01:18.170
Öldürmeden farklı işleve gideceğiz, çünkü bir sonraki işiniz için biraz enerji

01:18.180 --> 01:23.190
toplamak istediğimizi biliyorsunuz; ayrıca düştüğünde yüz hatdan fazla satır alacak.

01:23.190 --> 01:24.550
Bu yüzden hazır ol.

01:24.600 --> 01:30.440
Ve bu nedenle, burada neler olup bittiğini bir Statoil Statoil'de açıklamaya çalışacağız.

01:30.480 --> 01:31.970
Ve şimdi başlayalım.

01:32.810 --> 01:38.480
fonksiyonunu ve adım fonksiyonunu içeren üç işlev içeren bu sınıf paylaşım atomunu tanıtalım.

01:38.480 --> 01:40.900
Pekâlâ, önce init fonksiyonunun paylaşılan hafıza

01:41.180 --> 01:48.410
Bu yüzden ilk önce yaptığımız şey, elbette atom optimizer olan bu atomu optinleştirmekten miras

01:48.410 --> 01:52.100
aldık ve meşale kütüphanesinden Upton modülüne giriyoruz.

01:52.280 --> 01:57.980
Yani, atom optimizeriyle ilgili tüm araçları elde etmek için basit bir miras ve

01:57.980 --> 01:59.320
init fonksiyonuyla başlıyoruz.

01:59.330 --> 02:00.990
Peki burada ne olacak.

02:01.150 --> 02:08.050
Önce Atom sınıfının atomundaki tüm temel parametreleri ve tüm temel araçları devralmak için süper

02:08.050 --> 02:11.310
fonksiyonu kullanırız ve bu temel parametreler burada.

02:11.380 --> 02:16.090
Harams ırk yediği Epsilon ve kilo zayıflaması öğrenirken.

02:16.240 --> 02:17.920
Ve sonra bir takip başlatırız.

02:17.980 --> 02:21.840
Paramo gruplarının kendisi için ilk olan bu foluke.

02:21.850 --> 02:28.310
Bu nedenle, parum grupları gruplar etrafında kurulan şey, optimizasyon cihazının tüm özelliklerini içerir.

02:28.510 --> 02:34.030
Ve bu özniteliklerin arasında, belki de kendi parum gruplarında bulunan ağın

02:34.030 --> 02:40.790
diğer yollarını atomize etmek istediğimiz bu parametreleri optimize etmek zorunda olduğumuz parametrelere sahibiz.

02:40.930 --> 02:44.860
Dolayısıyla gidiyoruz ki grup kendi kendine yardım gruplarına ait.

02:44.980 --> 02:50.920
benlik kuşkusu olan parum gruplarında bulunan bu parametreleri alacak ikinci Faltu var.

02:50.920 --> 02:54.910
Ve burada optimize etmek istediğimiz ve belki de

02:54.910 --> 03:01.870
Temel olarak, tüm parametreleri içeren kendi kendine yardım gruplarını inceliyoruz ve grupların her bir parametre

03:01.930 --> 03:07.480
grubu ve kendi kendine konuşma grubumuz için optimize etmek istediğimiz parametreleri kullanacağız.

03:07.540 --> 03:14.300
Bu sebeple Paramo grubu, optimize etmek istediğimiz ağırlıkların her Tanceri için anlamına gelir.

03:14.410 --> 03:20.200
Böylece, optimize etmek istediğimiz her sensör ağırlığı için ve daha sonra bu dört satırlık kodla

03:20.200 --> 03:21.550
bu grupta ne olur.

03:21.820 --> 03:29.650
Temel olarak ne olur, optimize edicinin yaptığı güncellemenin degradenin üstel hareketli

03:29.890 --> 03:31.170
ortalamasına dayandığıdır.

03:31.250 --> 03:32.880
İşte bu kod satırı.

03:33.010 --> 03:38.270
Birincisi, birinci dereceden gradyanın üstel hareketli ortalaması.

03:38.500 --> 03:44.860
Fakat atom tarafından yapılan cisimler sadece degradenin karenin üstel hareketli ortalamasına

03:45.190 --> 03:47.140
dayandığı üzerine değil.

03:47.260 --> 03:51.770
Bu momentumun gradyanının üste veya ikiye üssel bir hareketli ortalaması.

03:52.030 --> 03:55.320
İşte hepsinin üstel hareketli ortalaması buradadır.

03:55.480 --> 04:00.560
Ve burada her biri için iki üstel hareketli ortalama EMJ'nin bozulması var.

04:00.790 --> 04:01.890
Öyleyse burada ne olacak.

04:02.080 --> 04:07.930
Üstel hareketli ortalamanın nasıl işlediğini derinlemesine öğrenmek isterseniz, stokastik optimizasyon için

04:07.930 --> 04:14.560
bu araştırma kağıt Adam yöntemine bir göz atmanızı şiddetle tavsiye ederim, çünkü temelde

04:14.860 --> 04:20.610
şu anda uyguladığımız atom optimizasyon cihazı şu an dayanıyor. burada algoritma.

04:20.890 --> 04:27.700
Bu nedenle, algoritmanın iyi nasıl çalıştığına dair daha fazla ayrıntıya sahip olmak istiyorsanız, bu kağıt kesinlikle faydalı olacaktır.

04:27.700 --> 04:32.720
Ve sonra atomlar ve kurallar ile algoritma hakkında daha fazla açıklama var.

04:32.860 --> 04:37.840
Ve biliyorsun, daha sonradan yapılacak olan büyük tren işleğine saldırmadan

04:37.840 --> 04:39.120
önce saldırmak istiyorsun.

04:39.400 --> 04:41.990
Tamam, o halde bizison'a geri dönelim.

04:42.220 --> 04:46.140
Ve şimdi ikinci işlev paylaşımlı belleğe geçelim.

04:46.190 --> 04:47.890
Şimdi birkaç kelime söyleyeceğim.

04:48.010 --> 04:54.580
Bu paylaşılan hafıza fonksiyonunun fikri tensör gibidir, bildiğiniz kuda, bir görüşe dayanan

04:54.580 --> 04:55.830
bir hızlandırıcıdır.

04:55.870 --> 05:03.160
Ve temelde burada olan şey, burada ve burada, burada hızlanan hesaplamayı

05:03.160 --> 05:10.210
hızlandıracak tenso gibi davranan hafızayı paylaşan devlet tensörlerine sahip olduğumuz.

05:10.420 --> 05:17.140
Fakat fark, hafızayı paylaşan sensörlerin hesaplamayı, felç edilmiş tüm tehditler tarafından

05:17.140 --> 05:22.150
erişilebilen sizin veya sizin GP'nizin bir bölümüne gönderdiği farktır.

05:22.160 --> 05:23.580
Yani temel olarak burada yapılanlar.

05:23.590 --> 05:30.220
Bu kuda'ya biraz benzer 10 ama paralel tehditler için erişilebilir olması için

05:30.220 --> 05:32.090
GP'nin bir bölümüne gönderilir.

05:32.090 --> 05:32.460
Tamam.

05:32.470 --> 05:35.100
Ve son işlevi adımımız var.

05:35.110 --> 05:41.830
Yani bu işi biliyorsunuz, bu derste kullandığımız atom optimizerinin adım yöntemi gibi.

05:41.830 --> 05:47.170
Ve yine bu, daha önce gördüğümüz gazetelerden birinin algoritmasına dayanıyor.

05:47.170 --> 05:48.610
Yani bu algoritma.

05:48.850 --> 05:52.250
Yani yine de aşağıdaki kod satırlarını ayrıntılı olarak anlamak istiyorsunuz.

05:52.420 --> 05:57.240
Yine Ingrid, bu algoritmayı bir tanesine bu kağıttan bakmanız gerekiyor.

05:57.580 --> 06:04.330
Ve burada yapılması gereken şey tamamen zorunlu değildir, çünkü bu aslında atom sınıfını

06:04.330 --> 06:07.180
etkileyen adım yönteminin bir kopya yapıştırmasıdır.

06:07.180 --> 06:14.050
şey mirasımızı kullanarak yapmış olabiliriz, çünkü burada Acton'dan Adam'a miras kalır ve

06:14.050 --> 06:20.620
mirasımızı kullanmak için bütün bunları yapmak yerine yapabileceğimiz şey sadece burada

06:20.620 --> 06:29.260
yazacağımızdır yorum sadece Paylaştığımız Adam sınıfına uyguladığımız süper fonksiyon, o zaman nesne özümüz ve burada

06:29.710 --> 06:38.020
sadece parantez ile adım ekliyoruz. Adım, o sınıfın hareketinin yöntemi ve bu tamamen aynı.

06:38.320 --> 06:40.550
Temel olarak burada yapılan

06:40.750 --> 06:45.820
Bu yüzden sadece burada Atom sınıfındaki adım yönteminin bir kopya yapıştırma

06:45.850 --> 06:46.860
olduğunu söyliyordum.

06:46.930 --> 06:53.440
Bence bu şeyleri, Adam'ı ve adım metodunu iyi paylaşmak için uygulanan bu süper işlevle değiştirirseniz, tam

06:53.830 --> 06:55.960
olarak aynı şeyi elde edebiliriz.

06:57.220 --> 06:59.900
Tamam, ona hızlı bir şekilde bakmanız ilginçtı.

06:59.920 --> 07:02.750
Temelde bunu Adam optimizer olarak görebilirsiniz.

07:02.850 --> 07:04.530
Sanki ona daha derin bir göz atmışız gibi.

07:04.640 --> 07:10.000
Ancak bununla ilgili daha ayrıntılı bilgi almak isterseniz ve sahnenin arkasında neler

07:10.000 --> 07:14.120
olduğunu anlamak istiyorsanız, bu araştırma makalesine bir göz atmanızı öneririm.

07:14.170 --> 07:16.120
Ben linkteki açıklamaları buraya koyacağım.

07:16.120 --> 07:19.940
Bildiğiniz gibi, tüm kodu büyük ayrıntılarla ilişkilendirmiş olacaksınız.

07:19.990 --> 07:22.120
Dolayısıyla bakabilmeniz gerçekten çok güzel.

07:22.580 --> 07:30.310
Ve şimdi umarım büyük enerjiniz olur, çünkü bu büyük tren fonksiyonunu içerecek olan

07:30.310 --> 07:35.860
tren dosyasına geçeceğiz ve temelde bizim eniyileyicimiz olduğu için

07:35.860 --> 07:37.510
yapabileceğimiz beyinlerini eğiteceğiz.

07:37.690 --> 07:39.230
Şimdi iyi mola verin.

07:39.250 --> 07:41.840
İyi uykunuz ve ne zaman kendinizi iyi hissettiğinizde.

07:41.980 --> 07:44.440
Bir sonraki adıma geçelim.

07:44.440 --> 07:45.910
O zamana kadar AI zevk.
