WEBVTT

00:00.610 --> 00:03.190
Merhaba ve bu Python öğreticisine hoş geldiniz.

00:03.190 --> 00:09.460
Şimdi bunu, sağdan başlayıp sola dönerek başlayalım ve bunu yapmak

00:09.460 --> 00:11.900
için dört eklemeye gidelim.

00:11.920 --> 00:17.980
Dolayısıyla, bu tekrar eden bir VAR adımımız olacaktı, çünkü son adımdan

00:17.980 --> 00:21.590
bir dizi geçişin ilk adımına vb. Gideceğiz.

00:21.960 --> 00:29.850
Ve sonra sağdan sola gitmek hile tersine tersine adım kullanmak için.

00:30.160 --> 00:35.300
Ve şimdi sadece bir dizi girmeliyiz ve bu sıra tabii ki bizim serimiz olacak.

00:35.380 --> 00:41.790
Bu yüzden serimizi koyabiliriz, ancak yazıda gördüğünüz gibi T eksi 1'den başlamak için gidiyoruz.

00:41.950 --> 00:47.760
Dolayısıyla, terminal aşamadaki son adımdan geçmiyoruz; ancak eksi bir adım öncesi olan

00:47.800 --> 00:50.380
adım ancak başlatmak için ilk adım.

00:50.430 --> 00:59.090
Ve işte burada, parantez sütununa eksi bir eklememiz gerekmeden önce bu adımı atmamamız gerekiyor.

00:59.380 --> 01:04.270
Eminim daha derin bir derste makine öğrenmeyi takip edenler için bu

01:04.560 --> 01:11.050
hileyi biliyorsunuz Kollin eksi bir unsur, son öğeden önce elemana gidiyoruz ancak son öğeye kadar

01:11.050 --> 01:14.740
gitmediğiniz anlamına geliyor ve bu nedenle İstediğimiz sekans.

01:14.860 --> 01:20.890
Son öğeden önce öğeden ilk öğeye gideceğimiz şey bu ve sağdan

01:20.890 --> 01:23.900
sola dönmek için tersine işler yapıyoruz.

01:24.160 --> 01:26.810
Tamam, for döngüsüne girmeye hazırız.

01:27.170 --> 01:29.740
Ve bu yüzden döngü için ne yapacağız.

01:29.780 --> 01:32.870
Tam olarak gazetede olduğu gibi nereye gideceğiz.

01:32.900 --> 01:39.340
Kümülatif ödülü, Gana ile çarparak ve takip aşamasındaki şu andaki aşamada

01:39.400 --> 01:42.500
elde edilen kelimeyi ekleyerek güncelleyeceğiz.

01:42.670 --> 01:45.450
Pekala, bunu Python'a geri dönelim.

01:45.590 --> 01:57.780
Ve bu yüzden, topladığımız kümülatifleri güncellemek istiyoruz; ilk önce gama çarpılarak aşağıdaki şekilde çalışıyoruz.

01:57.780 --> 01:58.580
Oraya gidiyoruz.

01:58.660 --> 02:07.910
Burada, gamma ile çarpıyoruz ve sonra özel yapıyla bu yola erişebildiğimizin ödülünü

02:07.970 --> 02:09.420
eklemek istiyoruz.

02:09.450 --> 02:13.120
Bu kelimenin nesnenin bir özelliği olduğunu unutmayın.

02:13.130 --> 02:15.910
Ve elbette burada bir artı ekliyoruz.

02:16.020 --> 02:17.330
Tamam, bu birikimli bir ödül.

02:17.450 --> 02:19.310
Eşittir, biz bu adımı isteriz.

02:19.370 --> 02:25.620
Şu an döngü artı Gahanna'nın bir önceki kümülatif ödülü bir katına çıktık.

02:26.150 --> 02:26.870
Mükemmel.

02:26.870 --> 02:28.190
O yüzden şimdi iyi olduğumuzu düşünüyorum.

02:28.220 --> 02:30.180
Algoritmayı iyice takip ediyoruz.

02:30.500 --> 02:32.600
Ve şimdi bir sonraki adımların zamanı.

02:32.840 --> 02:35.090
Artık çok kolay olacak.

02:35.090 --> 02:40.880
İlk tekrarlamaya geri dönüyoruz çünkü for döngüsü sadece bu şekilde güncellenerek sağdan

02:41.060 --> 02:44.010
sola gitmeyen kümülatif ödülü hesaplamak içindir.

02:44.030 --> 02:50.930
Algoritmayı takiben, şimdi bunu hatırlamanın amacını hatırlarken, girişimleri hazır hale getirmek ve hedeflerimizi hazır

02:50.930 --> 02:55.950
hale getirmek, böylece eğitim için ikisi arasındaki farkı en aza indirebilmektir.

02:55.950 --> 03:01.020
Ve şu anda bunu yapmak zorunda olduğumuz tek şey, bu girdileri ve tuvaleti hazır tutmak.

03:01.220 --> 03:08.410
Bu yüzden önce yapmamız gereken şey, serinin ilk tarihini parça listemize eklemektir.

03:08.510 --> 03:11.460
Şu ana kadar bu devlet bizim amacımızın bir parçası.

03:11.480 --> 03:14.100
Bu sadece çıktıyı hesaplamak içindir.

03:14.270 --> 03:19.370
Bu yüzden, ilk adımın bu girdi durumunu ayrı ayrı alacağız çünkü tam da

03:19.370 --> 03:21.320
listemizde olması gereken şey bu.

03:21.380 --> 03:23.340
Bu yüzden ayrı olarak alalım.

03:23.360 --> 03:25.910
Bu nedenle devlet diyeceğiz.

03:26.000 --> 03:32.930
Ve burada da aynı şekilde, ilk geçişin bulunduğu dizinin ilk dizinini alarak ve ardından bu

03:32.930 --> 03:38.300
ilk geçişin durumunu elde etmek için bu durumu ekleyerek elde edebilirsiniz.

03:38.330 --> 03:44.390
İhtiyacımız olan site bu, o zaman bu giriş aşaması ile ilişkili hedefleri

03:44.840 --> 03:46.830
ayrı ayrı alacağımızı söylüyor.

03:46.880 --> 03:53.450
Ve ilginç bir yeni değişken burada hedef, ilk adımın değerine eşit olacaktır.

03:53.540 --> 03:59.990
Ve Q değeri, sinir ağı ve içeriği ve çıktısı tarafından döndürüldüğünden ve

04:00.070 --> 04:07.370
çıktıların, geçişin birincisini içeren bu girişle ilişkili çıktı olduğu için, ilk tarihe ait bu

04:07.370 --> 04:12.830
q değerini, sadece burada çıktı alarak ve endeksi sıfır alarak.

04:13.100 --> 04:20.630
Ve sonra bize sadece ilk geçişteki giriş durumunun Q değerini verecek olan verileri ekledik ve tam

04:21.050 --> 04:22.310
da bu zamanı.

04:22.320 --> 04:30.080
S Bu şekilde, bu hedef değişkeni güncelleyeceğiz ancak yalnızca serinin ilk adımında

04:30.080 --> 04:35.680
seçilen eylem için ve serinin ilk adımına erişeceğiz.

04:35.870 --> 04:42.710
İlk seriyi 0 almalıyız çünkü bu 3 0 serisindeki tam da ilk adım.

04:42.970 --> 04:50.290
Ve serinin bu ilk adımına karşılık gelen eyleme erişmek için şunu tekrar

04:50.380 --> 04:57.340
eklemeliyiz: Eylemi tekrarladığımızda, kullandığınız bu öznitelik yapısı, eylemin dizinin ilk adımının

04:57.340 --> 04:58.900
bir özniteliğidir.

04:58.900 --> 05:04.570
Dizinin her geçişinde aşağıdaki yapı hali eylem kelimesi bulunduğu ve bu

05:04.720 --> 05:11.350
nedenle bu öznitelik eyleminin eylemi burada yapıldığı anlamına gelir, çünkü bu ilk tarihin

05:11.500 --> 05:14.150
hareketini alıyoruz demektir; dizinin ilk geçişidir.

05:14.330 --> 05:21.320
Ve böylece ilk adımın belirli bir eylemi için hedef, dünyanın topluluğu tarafından

05:21.410 --> 05:22.850
güncellenmesi gereken şeydir.

05:22.850 --> 05:29.490
Yani esas olarak burada, oynatılan eylemle ilişkili bu hedefi yazacağız.

05:29.630 --> 05:35.810
Dizinin ilk adımı, yeni hesapladığımız kümülatif ödül.

05:36.130 --> 05:44.780
girişimizi bu ilk kalış ekleyerek güncellemeye hazırsız ve ilk önce burada ilk saatimiz var.

05:44.780 --> 05:46.770
Pekâlâ, şimdi nihayet

05:46.970 --> 05:53.090
10 adımda AI'yi eğittiğimizi bildiğiniz için yalnızca serinin ilk adımı güncellemeliyiz ve bu

05:53.090 --> 05:56.000
nedenle girdi on adımın ilk adımı.

05:56.180 --> 06:01.400
Ayrıca, bu ilk adımda hedefi elde ederiz, ancak o zaman 10 basamağın aşağıdaki adımlarında

06:01.400 --> 06:06.310
herhangi bir girdi ya da tuvalet bulamıyoruz çünkü temel olarak öğrenme 10 basamakta gerçekleşiyor.

06:06.500 --> 06:11.380
İşte bu yüzden şimdi sadece devleti ve serinin ilk adımının hedefini alıyoruz.

06:11.840 --> 06:16.820
Bunu anlamak önemlidir ve bu nedenle şunu anladığımız takdirde, bunları

06:16.820 --> 06:20.590
girdi listemize ve hedef listemize girmemiz gerektiğini anlıyoruz.

06:20.660 --> 06:21.560
O halde bunu yapalım.

06:21.560 --> 06:25.140
Önce devletleri girişlerimize ekleyelim.

06:25.190 --> 06:33.680
Böylece, girişler listemizi alıyoruz ve serinin ilk adımının giriş durumunu hatırlayan durumu eklemek için

06:33.680 --> 06:41.030
ek fonksiyonunu kullanıyor ve ardından hedefi ilk adımdaki hedefler listesine ekleyip bunu

06:41.120 --> 06:47.270
yapacağız hedefler listemize giriyoruz ve bu ilk hedefi eklemek için

06:47.270 --> 06:49.460
ek fonksiyonunu kullandığımızı söylüyoruz.

06:49.490 --> 06:50.360
Oraya gidiyoruz.

06:50.540 --> 06:56.750
hedefleri söylediğimiz gibi tabii ki ihtiyaç duyduğumuz son şeyleri iade etmeye ihtiyacımız var.

06:56.840 --> 07:01.760
Neredeyse bitti ve şimdi, bu dersin başında, güncellenen girdileri ve

07:02.090 --> 07:07.580
Bu yüzden her fırsatta buraya ekleyeceğiz ve ilk önce girişlerimizi alacağız, ancak

07:07.580 --> 07:14.660
o zaman bunları bir sayı dizisine dönüştürmek için ihtiyacımız olan şey o zaman önce türle tek

07:14.660 --> 07:21.710
bir türe sahip olduğumuzdan emin olmak için bir tür dönüşümü yapın. Eşittir ve 32 aynı yüzer.

07:21.890 --> 07:28.520
Ve bunu bir meşale tensörüne dönüştürüyoruz, çünkü tabii ki tamamen zorunlu olan bir meşale

07:28.730 --> 07:29.540
ile çalışıyoruz.

07:29.570 --> 07:36.040
Ve ben de meşale tekrar Taylandlı olmayan işlevi kullanıyorum.

07:37.180 --> 07:39.000
Ve bu bize giriş bilgilerimizi verir.

07:39.130 --> 07:39.590
Mükemmel.

07:39.590 --> 07:42.460
Ve şimdi de hedefler için aynı şeyi yapalım.

07:42.520 --> 07:44.620
Şimdi daha hızlı olan bu numarayı kullanabiliriz.

07:44.710 --> 07:50.950
Hedefleri bir araya getireceğiz ve bunu yapmak için öncelikle meşale

07:50.950 --> 07:57.230
kütüphanemize ihtiyacımız var çünkü hedefleri yığmak için meşale fonksiyonunu kullanacağız.

07:57.250 --> 07:57.550
Tamam.

07:57.550 --> 08:04.030
Ve bu nedenle bu kod satırı temel olarak bu uygunluk izi Sarsour algoritması

08:04.030 --> 08:07.100
yoluyla güncellenen girdileri ve tuvaletleri döndürür.

08:07.180 --> 08:10.710
Veya onu çağıracağız ve içeri girip tebriklerimizi gönderelim.

08:10.780 --> 08:16.540
Son eğitim vermeye hazır olduk çünkü temel olarak eğitimimiz, girdilerimizin tahminleri

08:16.540 --> 08:20.950
ile tuvaletler arasındaki kare farklarını en aza indirgemekten ibarettir.

08:21.160 --> 08:22.870
Bu yüzden gözümüzü akıllı hale getirelim.

08:22.870 --> 08:25.150
Akıllı hale gelecek ve sonraki.

08:25.210 --> 08:26.980
Ve o zamana kadar AI zevk.
