WEBVTT

00:00.270 --> 00:02.590
Merhaba ve bu Python öğreticisine hoş geldiniz.

00:02.820 --> 00:08.730
Pekâlâ, bu yüzden bugün, gözün yeni bir hale geldiğinde güncel olan

00:08.850 --> 00:12.240
her şeyi güncelleyecek olan güncelleme fonksiyonunu yapacağız.

00:12.510 --> 00:16.140
Yeni etapa ulaştığında, eylemi güncellememiz gerektiğini biliyorsunuz.

00:16.200 --> 00:19.320
Son gerçekte yeni çalınan yeni eylem geliyor.

00:19.530 --> 00:22.630
Ama aynı zamanda yeni devlet haline gelen son tarih.

00:22.680 --> 00:27.450
Ve son olarak, son sözü, oyunu oynadığımızda aldığımız yeni sözcük haline geliyor.

00:27.480 --> 00:31.480
Dolayısıyla, bir eylem seçtikten hemen sonra gerçekleşen mantıksal yol budur.

00:31.530 --> 00:35.100
Geçişlerin tüm unsurlarını güncellememiz gerekiyor.

00:35.310 --> 00:37.370
Ve elbette yeni bir geçiş elde edersiniz.

00:37.420 --> 00:40.300
Dolayısıyla, bu yeni geçişin hafızaya eklenmesi gerekecek.

00:40.350 --> 00:46.200
Ve nihayetinde, eğitimin nasıl gittiğini ve araştırmanın nasıl ilerlediğini de gözlemlemek için

00:46.200 --> 00:49.460
tanıdığınız pencereyi de güncelleyecek veya ödüllendireceğiz.

00:49.680 --> 00:55.380
biz şu anda uyguladığımız AI ile haritamıza bir bağ kurabiliyoruz, çünkü

00:55.530 --> 01:01.650
haritaya geri dönersek oyun sınıfına bu Beiji güncelleme fonksiyonu hatırlayacağız ve

01:01.650 --> 01:08.580
Aslında oyunu araba ile yapıyorduk ve bir hata yaptığında arabanın nasıl cezalandırılacağını belirliyorduk.

01:08.580 --> 01:12.940
Fakat anlamanız gereken en önemli şey şu ki

01:13.170 --> 01:19.140
Fakat bu oyun sınıfında bu güncelleme fonksiyonunu fark ettik ve bu güncelleme fonksiyonunda

01:19.500 --> 01:24.700
bu satır hareketini fark ettik çünkü beyin güncellendi, daha az sinyal çalıştı.

01:24.900 --> 01:28.410
Aslında tam da bunu yapmak üzereyiz.

01:28.410 --> 01:36.300
Bu güncelleme işlevi, bir sonraki eylemi oynatmak için son sözü ve son sinyali

01:36.300 --> 01:37.860
alacak şekilde hazırlanıyor.

01:37.860 --> 01:41.640
Dolayısıyla, yalnızca geçişin tüm farklı unsurlarını güncelleyecek değil.

01:41.910 --> 01:48.390
işlevi, tüm güncellemelerin yanı sıra oynamak için yön seçmek üzere hazırlanıyor.

01:48.390 --> 01:55.920
Ancak çoğunlukla, son sözü ve son sinyali alırken oynamamız gereken eylemi oynuyor olacağız

01:55.920 --> 02:02.400
ve bu güncelleme fonksiyonunda elbette, seçme eylemi işlevini, söz konusu eylem eylemine

02:02.400 --> 02:07.740
entegre etmeden önce uyguladığımız seçme eylemi işlevini kullanacağız. Gelecekteki güncelleme

02:07.860 --> 02:11.200
Dolayısıyla şu anda bu bağlantıyı harita ile yapmak gerçekten önemlidir.

02:11.310 --> 02:18.480
Nihayetinde, bu sınıfta yaptığımız oyunun gözümüz ile oyun arasındaki bağlantı

02:18.480 --> 02:19.750
olmasını sağlıyoruz.

02:19.770 --> 02:24.030
Ve şimdi yapabileceğimiz şu ki bu güncellemeyi doğrudan alıyor.

02:24.060 --> 02:29.970
olarak daha az sinyal olduğumuz için aslında bu iki argümanla burada yapacağımız işlevi görüyoruz.

02:29.970 --> 02:30.430
Son

02:30.720 --> 02:38.530
Tıpkı Dejuan sınıfının nesnesi olan hızlı bir hatırlatma beyni AI nesnesidir.

02:38.540 --> 02:45.690
Şimdi ne yapacağız, bu güncelleme daha az kelime daha az sinyal kopyalamak için gidiyoruz ve

02:45.690 --> 02:48.390
bu yaptığımız sonraki fonksiyonu olacak.

02:48.480 --> 02:54.120
Ve dolayısıyla burada yapıştırarak dikkatli olmak için burada sahip olduğum isimlerden

02:54.120 --> 02:56.190
farklı isimler vermek istiyorum.

02:56.200 --> 03:00.820
Biliyorsun burada son sözümüz var ve bu son kelimeyi bununla karıştırmak istemiyorum.

03:00.900 --> 03:02.060
Bu tehlikeli olabilir.

03:02.220 --> 03:06.100
Bu yüzden son kelimeyi kelimenin tam yerine koyacağım.

03:06.390 --> 03:13.880
Ve bu arada daha az sinyal için de aynen sinyal veya yeni bir sinyal koyalım ve bunu yeni bir duruma ulaştığınızda

03:13.920 --> 03:18.900
ölçmek ve böylece yeni bir sinyal elde etmek istediğimizi bildiklerini belirtmek için izin verelim.

03:18.900 --> 03:26.100
Ama elbette burada bulunan bu söz, buraya gelebilecek en son ödül olacak.

03:26.280 --> 03:32.400
Bazı kumlara ne zaman gideceğinizi veya son kelimeyi tanımladığımız haritanın bir kenarına

03:32.670 --> 03:34.130
çok yaklaştığını biliyorsunuzdur.

03:34.200 --> 03:39.400
Bu son kelime, güncelleme fonksiyonunun girişi olacak, bu yüzden burada son sözümüz var.

03:39.600 --> 03:43.660
Ama burada argümana başka bir isim veriyorum.

03:43.710 --> 03:47.640
Buradaki son kelimeyle karıştırmamak istiyoruz.

03:47.640 --> 03:50.160
Pekâlâ, bu güncelleme işlevi.

03:50.310 --> 03:54.090
Ve şimdi içeri girelim ve bu iki şeyi yapalım.

03:54.090 --> 03:58.970
Bu, geçişin tüm unsurları ve tabii ki eylemi seçen verilerdir.

03:59.290 --> 04:01.670
Tamam, ilk önce ne güncelleştirmeliyiz.

04:01.950 --> 04:06.760
Anladığınız gibi, herhangi bir eyalete ulaşırken randevu almak istiyoruz.

04:06.840 --> 04:12.800
Bu yüzden, güncelleneceğimiz ilk şey açıkça bu habere ulaştığımıza inanıyoruz.

04:12.840 --> 04:17.340
Böylece bu yeni devlet yeni halini arayacağım ve sonra olacak.

04:17.340 --> 04:19.810
Peki nasıl bu yeni durumu alabiliriz.

04:20.040 --> 04:25.460
Tabii ki bu, sensörlerin yeni tespit ettiği sinyalin sinyaline bağlı.

04:25.830 --> 04:32.760
Ve bir hatırlatma olarak devlet, sensörlerin bir sinyalden üç artı yönlendirme ve eksi

04:32.760 --> 04:37.470
yönlendirme sinyali sinyali verdiğini gösteren üç sinyalden oluşan sinyaldir.

04:37.530 --> 04:38.600
Bizim devletimiz.

04:38.610 --> 04:42.470
Bu yüzden sinyalin devlet olduğunu anladığınızdan emin olun.

04:42.660 --> 04:46.160
Ancak şu anda beş elementten oluşan basit bir liste var.

04:46.200 --> 04:51.540
hatırlattığımız tüm işi yapmak için bir girdi olacağından onu meşale algılayıcıya dönüştürmek zorundayız.

04:51.540 --> 04:52.200
Ve bu,

04:52.490 --> 04:54.960
İşte tam şu anda bunu yapacağız.

04:54.960 --> 05:03.910
Meşale kütüphanemizi alıp sonra tensör sınıfını alıp yeni sinyalimizi bir meşale yoğunluğuna dönüştüreceğiz;

05:04.450 --> 05:12.420
o zaman, meşale cevaplamanın tüm unsurlarının şamandıra olduğundan emin olmak daha iyidir

05:12.420 --> 05:19.650
böylece gidiyoruz. bunları şamandıralara dönüştürmek için bir tür dönüştürme yapın.

05:19.900 --> 05:24.500
Ve sonra nihayet bir sonraki adımda ne yapmamız gerektiği konusunda bir fikir edinmeye çalışın.

05:24.530 --> 05:29.590
Tabii elmas eklemek ve toplu iş karşılık gelen bu sahte

05:29.590 --> 05:37.080
aşağı motor oluşturmak için ve elbette bu büyük elmas endeksi koymak zorunda sıkma işlevi ile bunu.

05:37.100 --> 05:40.210
Ve sıfır toplu iş istiyoruz.

05:40.770 --> 05:41.320
Tamam.

05:41.320 --> 05:47.110
Ve şimdi yeni durumlarımızı üç sensör artı yönlendirme eksi yönlendirme üç

05:47.110 --> 05:54.290
sinyalinden oluşuyor ve elbette bu güncelleme işlevi ile elde ettiğimiz yeni sinyale bağlı olacak.

05:54.400 --> 05:57.940
Şu anda son sinyal üç sinyal alıyoruz.

05:57.940 --> 06:04.450
Buna ek olarak ek veya ek olarak ve bir hatırlatma olarak üç sinyal sensörlerin

06:04.720 --> 06:06.490
etrafında algılanan sensör yoğunluğudur.

06:06.490 --> 06:06.940
Tamam.

06:06.970 --> 06:13.710
Dolayısıyla yeni bir aşamaya gelmiş bulunuyoruz, yani yeni aşamaya geçtik ve bir sonraki güncellemeyi yapmak zorundayız.

06:13.750 --> 06:16.440
Şimdi sana göre ne güncelleştirmeliyiz şimdi.

06:16.660 --> 06:22.320
Yeni devlete ulaştıktan sonra şu ana kadar mantıksal olan ne olurdu.

06:22.630 --> 06:25.940
Şu ana kadar çıkmamız gereken şey hafızadır.

06:25.960 --> 06:27.010
Neden.

06:27.010 --> 06:34.200
Her seferinde bir geçiş şu anki durum Estey'den oluşuyor çünkü ertesi gün tipis olarak

06:34.220 --> 06:37.660
ödül arti ve eylem 80 olduğunda.

06:37.860 --> 06:44.020
ekibimize sahibiz ve zaten 80'imiz var ve geçiş Estep artı birinin son elemanı var.

06:44.020 --> 06:47.540
Ve şu anda zaten S-T'ye sahibiz ve zaten

06:47.590 --> 06:55.720
Bu yüzden, bu yeni durumu birincisi kadar derin bir hale getirerek, belleğin yepyeni bir geçişini elde ediyoruz ve

06:55.720 --> 07:01.910
bu nedenle bu yeni yepyeni geçişi anıya eklemeliyiz, çünkü bu sadece bir sonraki geçişimizdir.

07:01.930 --> 07:03.980
Bu yüzden şu an bu hafızaya sahip olmamızın nedeni bu.

07:04.120 --> 07:10.990
Ve bu nedenle ne yapacağım, yeniden oluşturma bellek sınıfından oluşturulan bellek nesnem

07:10.990 --> 07:17.130
almak ve bu nedenle nesne bakın için kendi bellek almaya gidiyorum.

07:17.160 --> 07:22.700
Ancak ben'i kullandığım için benin bu işleve dahil edilmesi zorundayım.

07:22.950 --> 07:25.440
Böylece şimdi bu benliğin ne için olduğunu görebilirsiniz.

07:25.550 --> 07:32.600
Oluşturduğunuz ve init işlevinde başlattığınız bir değişkeni her bellek kullandığınızda o bir belleğe sahipsiniz.

07:32.600 --> 07:33.960
Ve şimdi yaptık.

07:34.190 --> 07:36.950
Ve sana göre biz bunu nasıl güncelleyeceğiz.

07:37.160 --> 07:41.290
İyi haber, bunu yapmak için zaten bir işleve sahip olduğumuz.

07:41.300 --> 07:46.990
Bir olayı veya belleğe geçişi engelleyen itme işlevi.

07:47.190 --> 07:49.060
Dolayısıyla şimdi tam olarak bunu kullanacağız.

07:49.070 --> 07:55.460
yaptığımız yeni geçişi kalibre etmek için kullanacağız ve bu nedenle burada eşitliği

07:55.760 --> 08:01.820
kabullenmiyorum çünkü yöntemi kullanacağız ve bu nedenle itme işlevini doğrudan kullanabiliriz.

08:02.320 --> 08:04.200
Push fonksiyonunu, hafızaya yeni

08:04.280 --> 08:10.010
Ve önce, yeni geçiş sürecini ekleyeceğiz ve ilk önce son tarih olan

08:10.010 --> 08:10.780
bu geçiş.

08:10.850 --> 08:14.010
Yani son randevuyu kendin yap.

08:14.270 --> 08:18.680
Yani bu S-T Bu zaten var olanı.

08:18.680 --> 08:23.620
Bu geçişin bir sonraki unsuru tabii ki yeni ulaştığımız yeni durumdur.

08:23.840 --> 08:29.720
Ve bu nedenle, bu init fonksiyonunda yarattığımız ve başlattığımız nesnenin uygulanabilir olmadığı için

08:30.080 --> 08:31.470
burada kendimizi koymuyoruz.

08:31.580 --> 08:39.940
Doğrudan Newstead'i koyduktan sonra geçişin bir sonraki unsuru eylemdir ve burada son eylem olan bu kendilik

08:39.940 --> 08:43.690
olan son bölümü biz zaten sahibiz demektir.

08:43.840 --> 08:45.320
Tabii ki bu sıfıra eşittir.

08:45.350 --> 08:50.050
Ancak elbette, select eylemi işlevi ile güncellenecektir.

08:50.170 --> 08:51.190
Ama bu o.

08:51.190 --> 08:55.620
Öyleyse son eylemin kendiliğinden olduğunu.

08:55.840 --> 08:57.120
Ama şimdi dikkatli ol.

08:57.190 --> 09:01.540
Bu geçişte yer alan unsurların tümü yanıp tutuşmalı cevaplar olmalıdır.

09:01.870 --> 09:03.860
Gördüğünüz gibi son tarihe denk geliyor.

09:03.880 --> 09:05.200
Bu bir meşale alıcısı.

09:05.350 --> 09:07.860
Yeni devlet de yanıp tutuşuyor.

09:07.900 --> 09:12.050
Ve bu nedenle eylem için aynı olması ve sonra tabii ki ödül olması gerekir.

09:12.190 --> 09:17.320
Ama şimdi sadece bir numara olduğunu göz önüne alarak nasıl keskin bir cevap olabilir diye düşünmeye başlıyorsunuz.

09:17.410 --> 09:20.700
Eylemin 0 1 veya 2 olduğunu biliyorsun.

09:20.890 --> 09:22.370
Ama aslında bu bir problem değil.

09:22.390 --> 09:28.640
Bu 0 1 veya 2 değişkenini hala meşale sensörüne dönüştürebiliriz.

09:28.660 --> 09:31.530
Bu sadece uzun tensör dediğimiz şey olacak.

09:31.540 --> 09:36.910
Uzun bir türdür ve bir tamsayı içerecek olan tensördür, çünkü son eylem 0

09:36.910 --> 09:39.660
1 veya 2 olan bir tam sayıdır.

09:39.670 --> 09:47.650
Şimdi alacağımız şey, kütüphanemizin torch'udur ve o zaman, uzun süren tensör sınıfı, mülkiyetin kendisi

09:48.190 --> 09:53.470
olmayacak bir nesne yaratacak olan uzun öğretmen sınıfını alacağız.

09:53.710 --> 10:00.370
Ve bu kendiliğinden son eylem işlevini girdi olarak alarak, bu uzun tensör nesneyi yaratacaktır ancak

10:00.370 --> 10:08.590
yine de uzun bir tensör nesne içine 0 1 veya 2 içerecektir ve bu sadece tensörleri içerdiği geçişle

10:08.830 --> 10:14.070
tutarlı olmak için PI meşale ile çalışıyoruz ve bir sinir ağıyla çalışıyoruz.

10:14.170 --> 10:18.480
Dolayısıyla, sensörlerle çalışmalıyız, böylece cevaplamaya uzun uzun devam edelim.

10:18.580 --> 10:20.780
Ve bir son dönüşüm yapmak.

10:20.860 --> 10:27.520
Bu uzun cevabın içinde olanın bir tam sayı olduğundan emin olmalıyız ve son eylemin

10:27.520 --> 10:34.000
0 1 veya 2 olduğunu bilsek bile emin olmak için bu int türü dönüştürmeyi

10:34.000 --> 10:39.310
tekrar yapacağımızdan emin olmak için bizim son hareketi tam sayıya çevirin.

10:39.310 --> 10:46.450
Orada gidiyoruz ve o zaman bu tamsayıyı özverili hareketi sağa parantez içine koymalıyız, böylece şimdi bu

10:46.450 --> 10:52.810
son eylem 0 veya 1 veya 2 olacak uzun bir tensör bir tensor alalım.

10:52.810 --> 10:59.880
Anahtar nokta, basit bir sayıyı bir veya iki sıfırdan bir tensörde nasıl dönüştürdüğünüzdür.

11:00.060 --> 11:00.360
Tamam.

11:00.360 --> 11:06.820
Sonunda geçişin son unsuru ve elbette elimizdeki en son söz var.

11:06.880 --> 11:12.980
İşte sıfırdan başlatılan, herhangi bir işleve girdiğimiz son voleybol sözcüğü.

11:13.110 --> 11:19.720
Fakat tabii ki burada bu kodda ya negatif sözcüğün bazı anlamlarına gittiğimizde ya

11:19.770 --> 11:24.020
da tekrar negatif bir ödül olan hedeften uzaklaştığımızda güncelleniyor.

11:24.180 --> 11:30.090
Eğer hedefe daha yakın olursak, olumlu bir ödül ve en kötü ceza, haritanın bir

11:30.090 --> 11:34.080
kenarına çok yaklaştığımızda, bu eksi bir korkunç negatif kelime.

11:34.290 --> 11:36.190
Ve bu bir.

11:36.260 --> 11:40.810
Öyleyse, bu son öğeyi kendi kendine yönlendiren kelimeye ekleyin.

11:41.060 --> 11:47.660
Dolayısıyla, bu yapıştırmayı buraya kopyaladım ve şimdi sadece başka bir dönüştürme yapmak zorundayız. Bu dönüşüm,

11:47.750 --> 11:53.570
kelimenin tam sayı değil de bir float numarası olduğu için bu kelimenin aynısı olacak.

11:53.780 --> 12:00.350
Dönüştürmeyi tensör yapan bir meşale yapacağız, ancak bunun olmadan köşeli parantezleri burada tutacağız, çünkü

12:00.350 --> 12:06.200
önce sayıyı bir listeye koymamız gerektiğini biliyorsun, sonra bu liste gidecek ve meşaleyi

12:06.200 --> 12:11.510
sınıfa getireceğiz, ancak yok Dönüşümü yapabilmek için son sözcük float numarasıdır.

12:11.510 --> 12:21.400
Peki biz ne yapacağız burada sadece bir tensör parantez parantez torched nokta tensör torched ekleyin.

12:21.680 --> 12:27.470
Parantezleri burada kapatacağız ve parantezi kapatacağız.

12:27.470 --> 12:28.820
Oraya gidiyoruz.

12:28.820 --> 12:35.180
Özetleyecek olursak, hangisine ulaştığımızı söyledikten sonra biz, hafızaya eklediğimiz yeni bir

12:35.540 --> 12:37.150
geçiş olayını gözlemledik.

12:37.550 --> 12:44.240
Ve bu geçiş son tarihi içeriyor ve son durumu 80 ve son

12:44.540 --> 12:47.640
kelimeyi Archie oynarken tipis olarak görüyor.

12:48.020 --> 12:48.390
Tamam.

12:48.440 --> 12:51.220
Ve şimdi tarihlerimizle devam edeceğiz.

12:51.410 --> 12:55.710
Bu yüzden hızlı bir mola verelim ve sonraki öğreticide bir sonraki güncellemeye özen göstereceğiz.

12:55.970 --> 12:57.440
O zamana kadar ben
