WEBVTT

00:00.300 --> 00:02.000
Merhaba ve bu öğreticiye hoş geldiniz.

00:02.160 --> 00:05.090
Onunla birlikte olduğun için tekrar tebrik ederim.

00:05.150 --> 00:08.200
Gördüğümüz gibi beynini yaptık ve eğittik.

00:08.400 --> 00:15.600
Ancak şimdi yarın bir randevu çıkarmayacak bir test ajanı üretmek zorundayız, ancak kendi

00:15.780 --> 00:19.430
araştırmalarını yapmak için paylaşım modelini kullanacaktır.

00:19.530 --> 00:26.080
Ve elbette bu kodda bazı videoları kaydedeceğiz ve bunlar test aracıları belirli

00:26.090 --> 00:28.750
bir puanla çıkacak videolar olacak.

00:28.810 --> 00:30.840
Şimdi bu kodu inceleyelim.

00:30.850 --> 00:35.860
En önemlisi, sana burada çizgiyi kodlamayacağımızı söylemiştim ama sanırım burada

00:35.860 --> 00:38.580
neler olup bittiğini anlamak önemlidir.

00:38.800 --> 00:42.680
Dikkat ettiğiniz gibi, ilk bölümde bu kodla birlikte gidiyoruz.

00:42.790 --> 00:49.480
Kütüphaneleri ithal ediyoruz ve bu test aracının kendi keşiflerini yapmasını ve koparma oyununu

00:49.480 --> 00:52.390
oynatabilmesini sağlayan bu test fonksiyonunu bulduk.

00:52.600 --> 00:58.610
Bu yüzden, bu test fonksiyonu, eğitim aracıları için yaptığımız gibi test aracısını hala senkronize

00:58.850 --> 01:02.060
etmek için birincil sıralama olan üç argümanı alıyor.

01:02.230 --> 01:05.380
Elbette parametrelerimiz elbette ki bazılarına ihtiyacınız var.

01:05.380 --> 01:12.220
Ve elbette paylaşılan modele sahibiz, çünkü bu test aracı kendi keşiflerini yapmak için ortak bir

01:12.220 --> 01:13.360
model kullanacaktır.

01:13.360 --> 01:18.790
Tamam, işin içine giriyoruz ve test aracısına senkronize ettiğimiz bu kod satırı.

01:18.820 --> 01:23.120
Tam olarak önce yaptığımız gibi, çevreyi ithal ediyoruz.

01:23.170 --> 01:27.070
Bu nedenle, bir sonraki öğreticide olacak olan ana kodda hatırlatmak isterim.

01:27.250 --> 01:33.970
Burada, sıfırın sonuyla değiştirileceğiz, böylelikle sıfır ortamına girip oyun oynayabiliyoruz

01:34.060 --> 01:40.180
ve akşam mola verdiğimiz videoları alacak Kızılhaç Trumanları oynayabiliriz.

01:40.180 --> 01:46.680
Yani temel olarak bu kod satırı, bir ortamı video ile çalıştırmamız anlamına geliyor.

01:47.080 --> 01:54.520
Ardından, bir sonraki kod satırında, bu ortamı Trend işlevi ile aynı prensipte senkronize ederiz.

01:54.700 --> 02:02.170
Sonra modelimizi elde ederiz ve bunu yapmak için aktivite sınıfının bir nesnesi yaratırız ve

02:02.170 --> 02:08.920
girdi şeklini çevre gözlem alanımıza yerleştiririz ve şekil sıfırlar tren işlevi ve

02:09.190 --> 02:13.690
çıktı alanlarımızla aynıdır, bunlar eylem alanına sahip eylemlerdir.

02:13.900 --> 02:19.770
Dolayısıyla, daha önce burada olduğu gibi burada yeni bir şey var çünkü eğitim bitti.

02:19.870 --> 02:25.450
Modeli tren moduna geçirmek istemiyoruz çünkü yalnızca onu eğitmeyi istemiyoruz, onu geliştirme

02:25.450 --> 02:26.880
aşamasına geçmek istiyoruz.

02:27.160 --> 02:29.740
İşte gelişen modelle burada yapacağımız şey bu.

02:29.890 --> 02:36.940
Yani temel olarak test aracısını temelde test edilen performansı test edecek bir

02:37.030 --> 02:38.350
moda koymaktır.

02:38.720 --> 02:45.680
Sonra burada oyunumuzun girdi görüntüleri olan girdi durumlarımızı alıyoruz ki bu noktada bu noktada tüm bir

02:45.680 --> 02:46.790
yarış var.

02:46.840 --> 02:49.360
Sonra onları meşale dansçılarına dönüştürüyoruz.

02:49.480 --> 02:52.810
Burada bazı kelimeleri burada başlatıyoruz.

02:52.840 --> 02:54.980
Aşağı doğru başlatıyoruz.

02:55.200 --> 03:03.430
olduğu gibi tekrar yeni bir şey oluyor ve hesaplamanın zamanını ölçmek için bir zaman fonksiyonu ile bu üçüncü yaşayabilirliği sunuyoruz.

03:03.850 --> 03:05.990
Dolayısıyla yine de son kez

03:06.190 --> 03:08.680
Bunun nedeni, başlangıç ​​noktasını edinmek istiyorsun.

03:08.890 --> 03:15.160
O zaman eylemler, sağdan veya soldan ipucuya bir unsur eklemenize izin veren çok pratik bir

03:15.160 --> 03:16.550
ipucu tipi kullanır.

03:16.600 --> 03:21.960
Bu çok pratik ve kodun azaltılmış haliyle düşündüğüm referansı size vereceğim.

03:22.180 --> 03:27.320
Bu yüzden, bu dequeue'nin ne olduğunu gözlemleyeceksiniz ve bunu yapmanıza izin veren şey bu.

03:27.490 --> 03:33.370
Ardından, bir bölümün uzunluğunu elbette sıfır ile başlatırız ve ardından bu iyi

03:33.400 --> 03:34.690
döngüde boyutu artırırız.

03:34.870 --> 03:36.480
Yani burada aynı püf noktasını kullanıyoruz.

03:36.680 --> 03:42.290
Doğru ve döngü halinde, bölüm uzunluğunu bir arttırıyoruz.

03:42.490 --> 03:49.700
Oyun bittiğinde oyun bittiğinde paylaşılan modelin son kümesini diğer modellerin tarihli paylaşım

03:49.730 --> 03:51.460
modelini yeniden yükleriz.

03:51.460 --> 03:55.610
Burada, paylaşılan modelin artık tarihli olmadığını hatırlayın.

03:55.660 --> 04:04.030
Hala oyunun bitmesi durumunda oyun sona erdiğinde Reinette hücrelerin durumunu yeniden başlatırız, X ve

04:04.190 --> 04:13.840
ardından Devletleri H x'yı görürsünüz ve eğer oyun bitmedi ise, aynı hücre Devletlerini ve devletleri tutuyoruz.

04:13.840 --> 04:18.030
Ancak bir degradeye bağlanabilmeleri için değişken öğretildiğinden emin olmak için.

04:18.170 --> 04:25.240
Tamam, bu yüzden eğilim fonksiyonunda zaten ölü olan bir şey var ve halen halen while döngüsünde

04:25.240 --> 04:30.870
ve iki duruma bağlı olarak gizli durumları belirten bir veriye sahip olduktan sonra.

04:31.060 --> 04:34.360
Peki ne yapacağız yarın tahminleri olsun.

04:34.450 --> 04:37.380
İşte tam burada bu kod satırı ile yaptıklarımız.

04:37.750 --> 04:43.360
Böylece eleştirmenin çıktısı olan değeri, aktörün çıktısı olan gerçek değeri elde ederiz.

04:43.600 --> 04:49.750
Ve daha sonra gizli durumların tümü H x ve hücre Devletleri X'dir, o

04:49.750 --> 04:54.130
zaman burada Q değerleri eylem değerindeki eylemlerin olasılık dağılımını üretiriz.

04:54.270 --> 04:56.380
Bunu bir sonraki işle de yapacağız.

04:56.470 --> 05:01.230
Ve elbette şans olasılıklarını burada bulmamız gerekmiyor çünkü bu sadece test aracı

05:01.480 --> 05:02.650
için eğitim içindir.

05:02.650 --> 05:09.130
Sadece onu kullanacağımız eylemleri oynamak için doom'a belirli bir etkinlik gibi oynayacak, ancak burada

05:09.190 --> 05:10.920
herhangi bir eğitim yapmayacağız.

05:10.960 --> 05:19.040
Dolayısıyla sadece bir pervaraya sahibiz ve bundan hareketle, olasılıkları en yüksek olan eylemi gerektiren

05:19.040 --> 05:22.720
bu olasılıkların RMX'ine doğrudan alarak oynuyoruz.

05:22.810 --> 05:26.860
Ve nedeni test ajanının herhangi bir araştırma yapmamasıdır.

05:26.860 --> 05:32.830
bir kez yerine getirdiğimizde, bir sonraki aşamaya geçtiğimizde, bir sonraki kelimeyi alacağız.

05:32.830 --> 05:38.170
Unutmayın ki, bu diğer eylemlerin bir kısmını araştırmak istediğinizde düşük olasılıkları olan

05:38.170 --> 05:44.260
bazı eylemleri almak için bir şansımız olsun ve her seferinde en yüksek ihtimal olan

05:44.260 --> 05:50.800
eylemi yapmamayı biliyorsunuz, ancak burada test aracı herhangi bir arama yapabilir ve Bu nedenle, bu

05:50.800 --> 05:53.340
nedenle maksimum ihtimali olan işlemi doğrudan

05:53.470 --> 05:56.920
Ve oyunun bitip bitmediğine dayanan bir gün.

05:57.160 --> 06:03.700
Dolayısıyla, tüm bunları, Max ile burada seçtikten sonra harekete geçerek bu kod satırı

06:03.790 --> 06:04.630
ile alıyoruz.

06:04.840 --> 06:13.000
yapıyor ve sonra yeni bir ödül almış bulunuyoruz. Ödülün bir kısmını bu yeni kelimeyi ekleyerek güncelleyeceğiz.

06:13.090 --> 06:18.950
Bu yüzden eylemi burada oynuyoruz ve durumu alıyoruz, ödülü alıyoruz ve tekrar

06:19.180 --> 06:21.480
Ve son olarak oyun bittiğinde.

06:21.490 --> 06:28.510
Oyunu bitirdikten sonra oynamayı bitirdikten sonra sonuçlarını tam tersi

06:28.510 --> 06:31.210
zamanlarla basacağım demektir.

06:31.230 --> 06:36.100
Bölümün uzunluğunu, ne kadar zaman harcadığını istedik.

06:36.100 --> 06:42.890
Harika oynamak ve bu sadece bu minik hileleri kullanarak tüm bu değişkenleri yazdırmaktır.

06:42.910 --> 06:46.280
O zamanlar için o zaman bir miktar istiyoruz, sadece bir değişken.

06:46.340 --> 06:51.960
Sözcük ve düşüncelerden bazıları mevcut OK boyunun uzunluğudur.

06:52.160 --> 06:57.860
Sonra oyun sona erdiğinden beri tüm sonuçları bastıracağız ve yeni bir oyuna başlamak istiyoruz,

06:58.220 --> 06:59.930
her şeyi yeniden başlatacağız.

06:59.930 --> 07:04.170
Bu, bir bölümün uzunluğunu sıfıra sıfır olan iki kelimenin toplamıdır.

07:04.230 --> 07:10.100
Bu tuş işlevini kullanarak tüm eylemleri tekrar yürürlüğe koyacağız, tanıdığınız girdi

07:10.100 --> 07:13.360
görüntülerini tüm kesmeleri tamamen tekrarlayarak sıfırlar.

07:13.610 --> 07:21.980
Ve son olarak, diğer ajanlara uygulamaya izin vermek için bir dakika ara vermek için 60 saniyede uyuyan bu

07:21.980 --> 07:22.840
sefer kullanıyoruz.

07:22.850 --> 07:24.810
Ve oyun sona erdiğinde.

07:25.210 --> 07:25.840
TAMAM.

07:25.940 --> 07:32.210
Son olarak, bize yeni bir devlet kazandıracak son kod satırına sahibiz ve ileriye doğru ilerleyebiliriz.

07:32.240 --> 07:34.550
Bu yeni oyuna devam edebiliriz.

07:34.550 --> 07:35.840
İşte gidiyoruz.

07:35.870 --> 07:37.430
Test işlevi budur.

07:37.430 --> 07:40.550
Videoları bir veya iki dersle göreceğiniz şeyler.

07:40.550 --> 07:45.310
Umarım son kez sizinle birlikte olan sonuçları izlemek istersiniz.

07:45.350 --> 07:47.360
Curial ve ben eğlenceli olacak.

07:47.480 --> 07:48.400
Ben de söylüyorum.

07:48.440 --> 07:50.330
İyi sonuçlar beklemelisiniz.

07:50.360 --> 07:55.130
Ancak unutmayın ki, bu koparma oyunu süper zordu.

07:55.130 --> 07:58.430
İlk oyunun basit bir oyun olduğunu düşünüyorduk ama hiç oynamadık.

07:58.430 --> 08:01.480
Aslında, kıyametten çok daha zor olduğu ortaya çıktı.

08:01.670 --> 08:03.890
Bu yüzden onu son modüle koyduk.

08:04.190 --> 08:09.510
Ancak yine de bu ana işlevi bir sonraki öğreticide yapalım.

08:09.590 --> 08:11.770
Aynı Bu burada en önemli değil.

08:11.780 --> 08:18.860
Şimdi A-380 çılgına döndü, onu satır satır kodlamayacağız, kodu genişleteceğiz ve

08:18.980 --> 08:20.570
sonuçları hızla alacağız.

08:20.570 --> 08:22.130
O zamana kadar AI zevk.
