WEBVTT

00:00.450 --> 00:02.670
Merhaba ve bu desene hoş geldiniz korku.

00:02.850 --> 00:06.890
Pekala, bu yüzden hafızayı yeni duruma ulaştıktan sonra güncelledik.

00:06.900 --> 00:09.010
Ve şimdi ertesi güne bakalım.

00:09.330 --> 00:12.810
Size göre bir sonraki güncelleme ne olacak.

00:12.810 --> 00:20.040
Aslında temel olarak yeni bir devlet olan geçişin son unsurunu tarihlendirdiğimiz bir

00:20.040 --> 00:20.960
geçişle bitirdik.

00:21.150 --> 00:23.340
Şimdi tekrar baştan başlıyoruz gibi.

00:23.520 --> 00:25.530
Ve baştan başladığımızda.

00:25.650 --> 00:31.320
Sanki bu yeni çevre ortamındayız ve şimdi doğal olarak ne yapmamız gerekiyor biliyorsun.

00:31.500 --> 00:37.170
Elbette bir eylem oynamak gerek çünkü haber haberlerinin gözlemlenmesine zaten başlamıştık.

00:37.410 --> 00:43.290
Şimdi yapmamız gereken şey bir eylem oynamak ve şu an yapmamız gereken şey

00:43.290 --> 00:46.960
elbette eylemi oynatmak için seçme eylemi işlevini kullanmaktır.

00:47.010 --> 00:54.320
Şimdi, yeni bir Voivode hareketi yaratalım ve aldığım eylemi seçme eylemiyle

00:54.320 --> 00:55.240
oynayalım.

00:55.380 --> 01:03.150
Seçim eylem işlevinin, oluşturulacak sınıfın nesnesinin bir yöntemi olduğunu belirtmek için öncelikle kendinden

01:03.150 --> 01:04.300
emin olun.

01:04.470 --> 01:08.610
Yani bir benlik eylemi seçer.

01:08.640 --> 01:09.520
İşte başlıyoruz.

01:09.560 --> 01:11.090
İşte bu sonraki eylem.

01:11.310 --> 01:17.560
Ve elbette, seçme eylemi işlevi, girdi olarak durum alır; çünkü

01:17.560 --> 01:24.270
seçme eylemi işlevi, geçerli giriş durumu sinir ağına girdiğinde sinir ağının

01:24.270 --> 01:25.220
çıktısını döndürür.

01:25.500 --> 01:31.650
ve şu an çevremizde ulaştığımız durumlar şu an girdi durumunun elbette

01:31.650 --> 01:37.350
bulunduğunuz yerdeydi çünkü biz şimdi şu anda ulaştığımız bu durum Newstead'ti.

01:37.350 --> 01:40.070
Dolayısıyla girdi aşamasını buraya girmeliyiz

01:40.290 --> 01:45.140
Yani bu seçme eylem işlevi yeni çubuklar koymak demek.

01:45.150 --> 01:51.710
Pekâlâ, bu kod satırı ile yeni durumu yeni duruma getirdikten sonra yeni bir oyun oynuyoruz.

01:52.140 --> 01:58.780
Tamam, şimdi bir eylem oynadık Peki biz ödülü alıyoruz ve bu nedenle ödülle geribildirim alıyoruz.

01:59.010 --> 02:04.550
Ve bu yüzden hafızasında 100'den fazla öğe varsa Peki öğrenme zamanı gelir.

02:04.860 --> 02:10.830
Dolayısıyla şimdi yapmamız gereken şey, AI'nın öğrenmeye başlamasına ihtiyaç duyan bir eylem seçtikten

02:10.830 --> 02:13.830
sonra mantıksal olarak ortaya çıktığı şeydir.

02:13.950 --> 02:15.620
Eğer işleri doğru şekilde yapıyorsa.

02:15.870 --> 02:22.530
Ve şimdi eylemi iyi oynadığından beri AI, son 100 etkinlikteki

02:22.530 --> 02:23.940
eylemlerinden öğreneceğiz.

02:24.130 --> 02:31.320
Fakat öğrenilen bu işlevi uygulamadan önce, rastgele seçilen örneklemlerden öğrendiğimizi bildiğiniz için

02:31.320 --> 02:37.380
100'den fazla olaya ulaştığımızdan emin olmak için bu koşulu sağlamamız gerekir.

02:37.530 --> 02:41.110
Biliyorsunuz, 10000 elementten oluşan bu devasa hafızamız var.

02:41.190 --> 02:48.930
100 unsurun hafızasında rasgele örnekler alıyoruz ve AI, 100 rasgele

02:48.990 --> 02:52.850
geçiş örneğinde bulunan bilgiden öğreniyor.

02:52.860 --> 03:00.690
olduğuna dikkat etmeniz şarttır ancak daha sonra yeniden oynatma hafıza sınıfının özellik olan bellek.

03:00.810 --> 03:06.390
Öyleyse, bu belleğin hafızasındaki öğelerin sayısından emin olmanızı ve

03:06.390 --> 03:12.380
daha sonra kendi kendine öğrettiğiniz hafızanın oynatma hafıza sınıfının nesnesi

03:12.510 --> 03:21.780
Aslında biz, ilk bellek yeniden oynatma bellek sınıfının nesnesinin olduğu bellekten bazılarını

03:21.780 --> 03:28.170
almamız gerekiyor ve ikinci bellek, bu bellek özniteliğidir.

03:28.200 --> 03:37.350
Dolayısıyla, bellekteki öğe sayısı iyi ise o zaman 100'den büyük olmasını istiyoruz, o zaman Cullin ve sonra

03:37.860 --> 03:38.800
ne olacak.

03:38.970 --> 03:46.320
Öyleyse öğrenebiliriz, ancak öğrenmek için bu rastgele 100 geçiş örneği almalıyız ve

03:46.320 --> 03:48.840
bu basit işlevle alabiliriz.

03:48.840 --> 03:55.140
Ve basit işlevi, farklı yığınları t zamanındaki durumlara döndürdüğünden, bu veri 20 artı bir zaman

03:55.290 --> 03:57.950
t'inin eylemleri ve biz 20 yaşındaydık.

03:58.200 --> 04:03.360
Şimdi yapmamız gereken şey, t zamanında devletlerin partisi olacak

04:03.360 --> 04:08.580
bazı yeni yenilikler yaratmaktır; bir sonraki toplu sözcükleri ve

04:08.580 --> 04:16.030
eylem topluluğunu topluyor ve aynı adları verebiliyoruz buradaki tartışmaları biz verdik ve onlar burada.

04:16.200 --> 04:24.720
Ve bu değişkenler, basitçe işlecin ne döndüğüne eşit olacaktır, çünkü tam olarak bu yığınları döndürür ve

04:24.720 --> 04:28.320
devletin bir sonraki harfleri ve eylemleri alır.

04:28.320 --> 04:35.570
olsun ve daha sonra bu bellek nesnesinden girdi olarak alacak basit yöntemi kullanacağımızdır.

04:35.620 --> 04:40.300
Bu yüzden şimdi yapmamız gereken şey, öncelikle bellek nesnemiz

04:40.500 --> 04:46.370
Bununla birlikte, AI'nın öğrenmesini istediğimiz geçiş sayısı 100'dür.

04:46.620 --> 04:50.540
Bu yüzden, yüzden fazla geçiş yaptığımızdan emin olduk.

04:50.610 --> 04:54.780
Dolayısıyla belleğin 100 geçişinden öğreneceksiniz.

04:54.840 --> 04:56.500
Böylece öğrenme daha iyi olacak.

04:56.610 --> 04:59.560
Ve şimdi şimdi bunu gerçekten gerçekleşelim.

04:59.700 --> 05:04.560
Öğrenme yöntemi sınıfımızdaki bir yöntem olduğundan.

05:04.830 --> 05:11.180
yaratılacak gelecek nesnelerden erişmemiz gerekiyor ve bu nedenle ne almamız kendiliğinden.

05:11.190 --> 05:14.300
Bu Learn yöntemine, farklı bir sınıftan

05:14.430 --> 05:21.960
Benlik, sınıfta yapmak için bu amaca atıfta bulunur ve bu öğrenilen yöntem olarak öğrendiği yöntemi

05:22.470 --> 05:29.340
öğreneceği anlamına gelir Tabii ki bu adamlar burada kötü devlet Belçika devleti doğal dünyası

05:29.340 --> 05:30.530
ve Bachche eylemidir.

05:30.630 --> 05:38.730
Bunlar hafızamızdan alınmış partilerimiz ve bunların 100'ünü alıyoruz çünkü aldığımız bu 100 geçişten

05:39.330 --> 05:47.750
100 geçişi var 100 Devlet 100 sonraki devlet 100 ödül ve 100 eylem burada

05:47.780 --> 05:51.530
karşı karşıya ve şimdi öğrenme gerçekleşecek.

05:51.850 --> 05:54.490
Tüm bu rasgele yığınlardan olacak.

05:54.520 --> 05:55.850
Mükemmel.

05:55.960 --> 06:03.310
Ve şimdi yapmamız gereken, yeni bir devlete girdiğini ve harekete geçtiğini bildikten sonra yapılan

06:03.310 --> 06:04.140
son güncellemeler.

06:04.330 --> 06:08.890
Gerçekten oynamaya zorladık ama yine de tepkimiz yoktu.

06:08.920 --> 06:11.590
Bu son eylem voivode bizim benlik.

06:11.770 --> 06:13.730
Bu yüzden unutmamıza izin verelim.

06:13.780 --> 06:15.160
Hemen yapalım.

06:15.190 --> 06:24.610
son eylemi kendine ait güncelleyeceğiz ve elbette burada bu seçme eylemi işlevi ile burada kalacağımız eylemi güncelleyeceğiz.

06:24.610 --> 06:27.020
Son eylemin eşit olduğu

06:27.020 --> 06:30.520
Pekâlâ, son bölüm güncellendi.

06:30.520 --> 06:31.890
Yeni devlet için de aynı.

06:31.930 --> 06:39.190
Yeni duruma vardık ama son tarihi henüz güncellemedik çünkü tabii ki sonuncusu t zamanındaki

06:39.280 --> 06:40.590
devletten önceydi.

06:40.750 --> 06:44.870
Fakat artık bir devletten vazgeçme zamanımız geldiğinde yeni devlet fazlası verdik.

06:45.070 --> 06:48.180
Son olarak burada söylediğin şu haline gelir.

06:48.190 --> 06:50.290
Bu nedenle güncellenmeliyiz.

06:50.290 --> 06:57.070
Kendinden son devlet bizim yeni durumumuza eşittir.

06:57.280 --> 06:58.020
Oraya gidiyoruz.

06:58.210 --> 06:59.620
Ve şimdi ne tarihe ihtiyacımız var.

06:59.830 --> 07:01.640
Tek bir şey kaldı.

07:01.660 --> 07:08.070
Elbette ki sözcük ve sözcük tam olarak gerçekte elde ettiğimiz kelimedir.

07:08.290 --> 07:15.910
Dolayısıyla bu fonksiyonun argümanı olacak, eğer haritayla bağlantı kurduysak son

07:15.910 --> 07:17.160
söz olacak.

07:17.200 --> 07:23.250
Bu, ulaşılmış yeni devletlerde harekete geçtikten hemen sonra elde ettiğimiz kelimedir.

07:23.470 --> 07:30.260
Bu yüzden, biraz ses çıkarırsak, bu son sözcük o eksi olacaktır, daha da ileri giderek

07:30.290 --> 07:35.580
hafif bir kelime eksi 0 alırsınız. 2 hedefe yaklaşırsak.

07:35.660 --> 07:38.680
Biraz iyi bir ödül alacağız 0. 1.

07:38.830 --> 07:43.370
Ve eğer haritanın bir kenarına çok yaklaşırsak ceza da olur.

07:43.510 --> 07:45.330
Her biri için eksi bir tane alacağız.

07:45.440 --> 07:47.110
Elde ettiğimiz son söz budur.

07:47.110 --> 07:50.700
Gerçekte o zaman gerçekte gerçekleşir.

07:50.830 --> 07:53.550
Ve bu fonksiyonun argümanı olacak.

07:53.600 --> 07:54.690
Son kelime burada.

07:54.700 --> 07:56.200
İşte tam da bu.

07:56.250 --> 08:01.840
Ve işte bu, güncelleme işlevinin argümanı olduğu için buna

08:02.170 --> 08:11.590
uygun değiliz, burada değildik ve bu nedenle, bu işlevin başında başlatılan son sözcük değişkeni kendimiz

08:12.070 --> 08:20.570
gerçekte elde ettiğimiz yeni kelimeye dönüşüyor yani sözcük veya sözcük aynı son sözü.

08:20.730 --> 08:21.360
Tamam.

08:21.410 --> 08:23.680
Şimdi son sözümüzü güncelledik.

08:23.990 --> 08:27.240
Ve şimdi sadece son sözümüzü aldık.

08:27.500 --> 08:29.470
Artık dünyayla buluşabiliriz.

08:29.850 --> 08:37.140
Savaşı, sınıfımızın nesnesinin değişkenlerinden biri olarak başlattıklarında hatırlıyorsunuz.

08:37.190 --> 08:42.500
Bu, trenin son 100 ödül ortalamasını alarak nasıl gittiğini

08:42.500 --> 08:44.270
takip edecek penceredir.

08:44.300 --> 08:50.180
Biliyorsunuz, dünyanın kaybolmasının nasıl bir ilerleme gösterdiğini gösteren kayan bir pencere gibi olacak.

08:50.180 --> 08:52.730
Ve bu yüzden sadece son sözümüzü aldık.

08:52.910 --> 08:56.910
Peki, pencereyi nasıl güncelleyeceğimizi güncelledik.

08:57.080 --> 09:03.680
penceremizi ben duyduğumda kendim alalım ve ekleme işlevini kullanacağım.

09:03.980 --> 09:12.350
Peki bu son sözcüğü pencereye eklemelisiniz ve bu yüzden ne yapacağım savaş

09:12.530 --> 09:18.830
Ve açık işlevin içinde, eklemek istediğimiz öğeyi girmek zorundayız tabii

09:18.830 --> 09:21.480
bunu yaparken biz istiyoruz.

09:21.500 --> 09:22.610
Tamam mükemmeldir.

09:22.610 --> 09:29.480
Ve o zaman bu savaş penceresi sabit bir boyuta sahip olacağından biliyorsun, büyüyen bir pencere

09:29.480 --> 09:35.300
olmayacak, dünyanın gelişimini göstermek için zamanla kayan sabit bir boyut penceresi olacak.

09:35.500 --> 09:38.590
Şimdi bu kışın büyüklüğüne karar vermemiz gerekiyor.

09:38.750 --> 09:43.600
Ve bu sadece bu pencerede ödül alacağımız araç sayısıdır.

09:43.900 --> 09:49.330
Ve bu nedenle örneğin son 100 kelimenin son 1000 aracını öğrenelim.

09:49.340 --> 09:58.730
Ve emin olmak için, sonra plan yaparsak ekleyeceğiz, daha sonra çalışma penceremizi

09:58.740 --> 10:05.810
alıyoruz ve penceredeki öğelerin sayısı 1000'den büyükse buraya ekleyelim.

10:05.990 --> 10:14.780
Peki yapmak istediğimiz şey, penceremizin ilk elemanını silmek ve bu

10:14.780 --> 10:19.070
pencerenin ilk elemanını sıfırlamak zorundayız.

10:19.150 --> 10:19.550
Tamam.

10:19.550 --> 10:24.620
Şimdi bu savaş penceresinin asla 1000'den fazla öğe bulamayacağından emin olalım.

10:24.620 --> 10:31.130
vardır, bu sabit büyüklükte bir pencere olacak, böylelikle sözcüğün ortalamasının arttığını görebiliyoruz.

10:31.310 --> 10:34.360
Son 100 sözcüğün bin yolu

10:34.460 --> 10:39.560
Ve bu nedenle eğitim iyi gidiyorsa ve mahkeme ne istiyorsa onu yapar.

10:39.800 --> 10:40.760
Mükemmel.

10:41.000 --> 10:46.010
Ve şimdi yapılacak küçük küçük ufak şey, sana göre ne olacağını bıraktı.

10:46.190 --> 10:52.130
Bu güncelleme işlevi, savaş penceresindeki geçişin farklı öğelerini sadece güncellemekle kalmaz,

10:52.140 --> 10:57.960
aynı zamanda bu yeni duruma erişirken oynanan eylemi de döndürür.

10:58.190 --> 11:05.270
Bu yüzden elimizde olan ve o eylemin eşit olduğu tarihten daha az sinyal aldığımız anlamına geliyor ve bu

11:05.360 --> 11:10.760
nedenle bir şey döndürmesi gerekiyor ve geri dönmesi gereken bir şey tabii ki eylemdir.

11:10.820 --> 11:18.950
Burada yapmamız gereken son basit şey, sadece yeni etapta ulaşıldığında oynanan eylemi

11:18.950 --> 11:20.180
yerine getirmektir.

11:20.600 --> 11:23.670
Ve bu bizim güncelleme fonksiyonumuz hazır.

11:23.840 --> 11:29.110
Gerekli tüm güncellemeleri yapacak ve yeni aşamaya ulaştığında eylemi değiştirecektir.

11:29.480 --> 11:30.650
Bu mükemmel.

11:30.650 --> 11:35.230
Tüm bunlar için bir süreç yapmak için son zor eylem buydu.

11:35.240 --> 11:37.120
Şimdi geri kalanlar iyi şeyler olacak.

11:37.220 --> 11:42.170
Pencerede istediğimiz araçları geri getirmek için temel bir işlevi yapacağız.

11:42.200 --> 11:47.450
Ardından, uygulamadan çıkıp geri dönmek istediğinizde arabanın beynini kurtarmak için güvenli

11:47.600 --> 11:48.840
bir işlev yapacağız.

11:48.890 --> 11:53.720
Ve elbette geri geldiğinizde arabanızın beynini yüklemek istiyorsanız,

11:53.720 --> 11:54.730
uygulamaya dönün.

11:55.040 --> 12:01.370
Aynı şekilde, modelinizi aynı işleve kaydettikten sonra yükleyecek bir yük fonksiyonu

12:01.370 --> 12:02.800
oluşturarak sonuçlanacağız.

12:02.840 --> 12:06.470
Bunu yapmak için üç fonksiyon var, ancak basit olacak.

12:06.500 --> 12:12.760
zaman havanın çalışması halinde göreceğimiz ilk modülün en heyecan verici bölümüne sahip olacağız.

12:12.770 --> 12:13.840
Ve o

12:13.850 --> 12:19.430
Aracın hedeflere ulaşıp ulaşmadığını göreceğiz ve onu nasıl geliştirebileceğimizi göreceğiz ve sonuçta

12:19.430 --> 12:21.980
ilk AI'nızı inşa etmeniz gerekecek.

12:22.160 --> 12:24.010
Bu yüzden demoyu başlatmak için sabırsızlanıyorum.

12:24.140 --> 12:27.580
Bu üç işlevi öncelikle ve o zamana kadar yapalım.
