WEBVTT

00:00.450 --> 00:02.520
Merhaba ve bu öğreticiye hoş geldiniz.

00:02.520 --> 00:06.140
Pekâlâ, AI'mız var, eğitim almaya hazır.

00:06.330 --> 00:09.660
Ve eğitimin ilk adımı tecrübelerimizi tekrarlamaktır.

00:09.900 --> 00:11.330
Bu yüzden yavaş yavaş oraya gidiyoruz.

00:11.340 --> 00:16.690
Eğitim ve iyi haber, deneyimin tekrar uygulanmasına ilişkin bir versiyonumuz olması.

00:16.830 --> 00:23.490
Hatta hatırlattığım uygunluk uyarlamasına göre adapte edilmiş bir tekniktir ve q değerlerini öğrenmek

00:23.490 --> 00:27.160
yerine her geçişi her 10 geçişte öğrenir.

00:27.210 --> 00:29.460
Yani temelde daha önce olduğu gibi.

00:29.490 --> 00:35.190
Ancak, her adım için tek bir kelimeyle tek bir hedef belirlemek yerine on adımın birikimli

00:35.190 --> 00:40.770
bir hedefi ve 10 basamağın birikimli ödülüne sahip olacağız ve her seferinde 10 basamağı öğreneceğiz.

00:40.980 --> 00:44.960
Dolayısıyla, daha önce olduğu gibi birer geçiş yerine 10 basamağı öğreniyoruz.

00:45.180 --> 00:50.440
Ve bununla harikalar yaratacağım ve bu, eğitim süreci için bazı mucizeler yaratacaktır.

00:50.440 --> 00:52.570
Eğitimin çok daha az zaman alacağı biliyorsun.

00:52.620 --> 00:58.850
Bu teknik sayesinde, deneyimsizlik tekrarını her 10 adımda öğrenmekte olduğumuzu belirtmek zorundayız.

00:58.980 --> 01:04.230
Bu nedenle, bu deneyim yeniden oynatma deneyimi yeniden oynatmanın klasik bir uygulaması değildir.

01:04.320 --> 01:06.160
Kendinden tahrikli bir araba gibi.

01:06.210 --> 01:12.540
Bu 10 aşamalı öğrenmeyi göz önüne alan bir deneyim yeniden oynatma uygulamasıdır

01:12.540 --> 01:19.110
ve bu nedenle, bu deneyimde, AI ilerlemesini 10 basamakla gerçekleştiren iki sınıfı bir

01:19.110 --> 01:23.460
sınıfa göreceksiniz; böylece, bu 10 basamakta ödüllerin toplamı sağlanabiliyor.

01:23.460 --> 01:28.430
Bu birinci sınıftır ve bu sınıfa ihtiyacımız var çünkü bu 10 basamağı,

01:28.430 --> 01:33.570
oynadığımız deneyim için sınıfta uygulayan replay hafıza sınıfına eklemeliyiz ve hafızanın aynı zamanda

01:33.630 --> 01:38.020
biz olduğumuz gerçeğini de hesaba kattığımızdan emin olalım. 10 adımda öğrenme.

01:38.040 --> 01:42.660
Bu nedenle deneyim tekrarının uygulanmasında bu iki sınıfı bulacaksınız, ancak

01:42.660 --> 01:49.070
bu sadece 10 aşamalı olarak öğrenildiğimizi ve hafızaya alınması gerektiğini hesaba katmak içindir.

01:49.410 --> 01:51.940
Bu yüzden hafızamızdan bahsedelim, onu yaratalım.

01:51.970 --> 02:00.150
Hafızadaki hafızamızı arayacağız ve hafıza, tekrar çalma hafıza aktarımının bir nesnesi olacak ve yeniden oynatma

02:00.570 --> 02:04.900
hafıza sınıfı bu deneyim yeniden oynatmanın bir sınıfıdır.

02:05.070 --> 02:14.430
Ve bu yüzden hissettim deneyim tekrarlama davranışını ilk önce alıyorum ve burada tekrar hafıza sınıfını

02:15.180 --> 02:15.880
alıyorum.

02:15.960 --> 02:16.840
Mükemmel.

02:16.890 --> 02:23.460
Ve şimdi ilk argümanın iki argüman koymamız gerektiğini ve anahtar değerleri öğrenmeye başlayacağımız

02:23.640 --> 02:27.540
adımların sayısına tek tek basmamız gerektiğini görebilirsiniz.

02:27.540 --> 02:32.090
Yani, hedefi topladığımız ve istediğimiz adım sayısını biliyorsunuz.

02:32.180 --> 02:37.290
Birikimli bir hedefe ve birikimli ödüle sahip olacağız ve ikinci

02:37.290 --> 02:39.840
argüman, belleğin büyüklüğü olan kapasitedir.

02:39.840 --> 02:42.650
Örneğin, burada on bin kişiyi görebiliriz.

02:42.810 --> 02:48.270
Dolayısıyla, kapasite 10000'e eşitse, o zaman 10000'lük bir boyuta sahip olacağız

02:48.270 --> 02:54.210
ve bu nedenle, göz tarafından gerçekleştirilen 10000 basamağın hafızasını alacağız demektir.

02:54.390 --> 02:57.390
Ancak yine de her geçişi öğreneceğiz.

02:57.390 --> 03:02.690
basamağı öğreneceğiz ve burada, daha önce karşılaştırıldığında burada sunduğumuz bu yeni özellik.

03:02.700 --> 03:06.100
Hafızadaki bu son 10000 basamaktaki her on

03:06.180 --> 03:12.480
Sadece bu tekrarlama hafızası hünerini almadan önce ve burada her tekrar tekrar hafıza puanı, artı her

03:12.570 --> 03:16.920
10 adımda öğrendiğim bu numara var ve on adımın hepsini öğreneceğiz

03:16.920 --> 03:20.000
ve onu hafızada yapacağız. son 10000 adım.

03:20.190 --> 03:27.810
Ve bu deneyimli tekrar oynama özelliği ile kombine edilemezlik özellikleriyle 10 adımla eğitim performansını

03:27.810 --> 03:29.240
önemli ölçüde artıracaktır.

03:29.490 --> 03:31.130
Bu iki argümanla son bulalım.

03:31.200 --> 03:35.900
İlki olan ve adımlar ve bu eşit olacaktır.

03:36.030 --> 03:43.180
Fakat şimdi şunu söyleyelim ve adımlar, bunun hemen ardındaki adımı belirleyecektir; bu, gerçekte, son adım ilerleme

03:43.360 --> 03:49.130
sınıfı olan ve on adımlar boyunca ilerleme kaydetmeye izin veren bu deneyim yeniden

03:49.140 --> 03:52.170
oluşturma dosyasının diğer sınıfının bir kıskanç olacağıdır.

03:52.170 --> 03:57.990
Ve 10 basamaktayken, 10 basamaktaki kümülatif ödülleri elde etmek için on basamaktaki

03:58.050 --> 03:59.550
kelimeleri seslendirecegimizi hatirlayin.

03:59.550 --> 04:02.250
Ve bu tamamen uygunluk testi.

04:02.250 --> 04:09.350
Şimdi yapmamız gereken bu adımları burada oluşturmak ve bu deneyim ilerleme dosyasında sahip

04:09.360 --> 04:13.040
olduğumuz ikinci aşamada adım ilerleme olanağı yaratmak.

04:13.160 --> 04:24.430
Şimdi, bu aşamaları oluşturacağız ve bu, oynadığımız deneyimlerimizden tekrar alacağımız

04:24.430 --> 04:30.650
adım ilerleme sınıfının bir nesnesi olacak.

04:30.940 --> 04:31.720
Oraya gidiyoruz.

04:31.840 --> 04:37.160
Bu ilerlemeyi önleme sınıfı ve şimdi aldığımız çevrenin bulunduğu ortamı

04:37.180 --> 04:41.010
koymamız gerektiğini gördüğünüz gibi üç argüman koymalıyız.

04:41.230 --> 04:47.680
O halde ikinci argüman AI'mız ve bu elbette burada U'da

04:47.830 --> 04:55.550
inşa ettiğimiz AI olacaktır. S. ve son argüman bu aşamada, burada her 10

04:55.570 --> 04:59.120
adımın her 10 geçişinde öğrenmek için bildiğiniz 10 adımın olmasını istediğimizi belirteceğiz.

04:59.200 --> 05:01.140
Öyleyse bu argümanlarla yardım edelim.

05:01.180 --> 05:06.920
İlki çevre, bu da azim ve tamamdır.

05:06.940 --> 05:11.700
Sonra ikincisi, AI AI olur ve biz ai ai'yi saydığımızı.

05:11.830 --> 05:12.720
Burada olanlar.

05:12.760 --> 05:17.590
Dolayısıyla adım ilerleme sınıfının ve bu ai ai'nin argümanının adı budur.

05:17.590 --> 05:19.730
İşte bizim ai ai.

05:19.750 --> 05:27.150
Yaptığımız ve son argümanımız yığını ve 10'a eşittir.

05:27.160 --> 05:27.910
Tamam.

05:27.910 --> 05:33.670
Dolayısıyla şu an hafızada 10 basamaktaki bir öğrenme olduğunu ve 10 basamaklı

05:33.670 --> 05:37.210
bu öğrenmeye uygunluk izi denildiğini hesaba katıyoruz.

05:37.240 --> 05:39.520
Bu yüzden burada gelişmiş şeyler üzerinde çalışıyoruz.

05:39.640 --> 05:44.160
Unutma, çünkü Dume olmaya çalışıyoruz, bu bir parça pasta yapmak gibi bir şey değil.

05:44.290 --> 05:47.650
Bu yüzden, çalışmasını sağlamak için bu ileri tekniklerimize ihtiyacımız var.

05:47.660 --> 05:48.880
Şimdi neredeyse hazırız.

05:48.880 --> 05:55.450
ve yani 10000 adam söyleyelim ki 10000 büyüklüğüne sahip olacağız, yani

05:55.450 --> 06:03.730
hafızanın son AI tarafından gerçekleştirilen 10000 adım ve bu bize çok sayıda üretmemizi sağlayacak.

06:03.730 --> 06:11.470
Aslında LGBT tepsilerini uygulamakla ilgili bir sonraki adıma geçmeden önce, dahil etmemiz gereken

06:11.500 --> 06:13.810
tek şey elbette kapasite

06:13.930 --> 06:16.020
Hatırladığım kadarıyla basit bir işlevi vardı.

06:16.180 --> 06:22.840
Hafızanın 10000 geçiş içerdiğini biliyorsunuz ancak göz eğitmek için, bu sefer 10

06:22.840 --> 06:28.360
geçişten önce çok sayıdaki on geçiş sayısını örnekleyeceğiz ve 10

06:28.360 --> 06:33.490
geçişin bu küçük gruplarını 10000 basamaktan oluşan belleğe örnekleyeceğiz .

06:33.490 --> 06:38.770
Pekâlâ, şimdi uygunluğun izini uygulamakla ilgili bir sonraki adıma geçmeye hazır olduğumuzu

06:38.770 --> 06:39.490
tahmin ediyorum.

06:39.520 --> 06:41.680
Yani burada biraz macera yaşayacağız.

06:41.680 --> 06:43.690
Bu basit bir uygulama olmayacaktır.

06:43.720 --> 06:47.830
İyi bir mola verin, hazır olduğunuzda buna saldırabiliriz.

06:47.920 --> 06:49.120
Ve o halde tadını çıkarın.
