WEBVTT

00:00.510 --> 00:02.990
Merhaba ve bu Python öğreticisine hoş geldiniz.

00:03.240 --> 00:08.400
Pekâlâ, şimdi beynimizin çıkış sinyallerini AI'nın gövdesine yayacak ileri

00:08.400 --> 00:13.550
yeleği yapacağız, böylece yeleğe ulaşmak için doğru harekete geçecektir.

00:13.770 --> 00:20.100
Fakat henüz reaksiyon yok çünkü AI'yı henüz eğitmediğimiz herhangi bir eğitim yok,

00:20.100 --> 00:25.920
ancak derin konvolüsyonel bölgede uygulamak için yapacağımız şey de bu, eğitimi

00:25.920 --> 00:29.720
AI'yi derin konvolüsyonel Killary ile yeniden adlandıracağım.

00:29.940 --> 00:35.340
Ancak şu anda beynin çıkış katmanından sinyali vücudumuza iletmemiz gerekiyor.

00:35.370 --> 00:40.170
vücudumuzun son işlevi olan ileri fonksiyonla tam olarak bunu yapacağız.

00:40.170 --> 00:40.670
Ve

00:41.420 --> 00:42.860
O halde bunu yapalım.

00:42.860 --> 00:50.140
Teff ile başlarız ve size göre hangi argümanları alacaktır.

00:50.330 --> 00:55.030
İlk başta kendini zorlayacak ve sonra başka bir tane var.

00:55.220 --> 00:56.740
Evet, var.

00:56.870 --> 00:58.140
Ve ne olacak bu.

00:58.310 --> 01:04.700
Doğal olarak beynin çıkış sinyalini vücuda iletmek istiyoruz ve bu nedenle

01:04.700 --> 01:07.470
girdi beynin çıkış sinyali olacaktır.

01:07.850 --> 01:10.480
Şimdi de bu dışa dönük sinyallere bir isim vermeliyiz.

01:10.610 --> 01:14.390
Ve ben de buradaki argümanı ekleyeceğim.

01:14.460 --> 01:21.200
Pekâlâ, beyne giriş görüntüleri beynin çıkış sinyallerine karşılık gelir, böylece tüm beyin boyunca

01:21.200 --> 01:26.540
yayılır ve daha sonra beyne ilerleyişiyle geri dönen X elde

01:26.540 --> 01:27.170
edilir.

01:27.380 --> 01:32.480
Ve şimdi beyindeki bu çıktı sinyali, bir sonraki sınıfta yaptığımız

01:32.480 --> 01:35.410
bu yeni ilerleme fonksiyonuyla vücuda gönderilecek.

01:35.460 --> 01:41.760
gibi biraz renk katalım, hareketi oynamak için bir sonraki metodu kullanacağız.

01:41.870 --> 01:43.940
Şimdi bunu yapalım, anladığınız

01:43.940 --> 01:49.820
Bu, beyne ait çıkış sinyallerini aldıktan sonra AI vücudumuzun sonraki tekniği ile hareket

01:49.820 --> 01:51.440
etmesi anlamına geliyor.

01:51.440 --> 01:56.510
Yani temelde şimdi yapmamız gereken şey, arabayla yaptığımız şeyle tam olarak aynı.

01:56.600 --> 01:59.390
Olasılık dağılımımızı alacağız.

01:59.540 --> 02:05.960
Bu ilk adımdır ve olasılık dağılımına göre bir eylem örnekleyeceğiz.

02:05.960 --> 02:11.510
Yani temelde şimdi yapabileceğimiz şey kendi kendine sürüş otomobil dosyamız olsun ve kendiliğinden sürüş otomobilinde

02:11.510 --> 02:14.570
seçilen gerçek fonksiyon için uyguladığımız şeyleri kopyalayıp yapıştırın.

02:14.810 --> 02:15.700
Ama yine yapalım.

02:15.710 --> 02:19.710
İyi uygulama olacak ve aslında benden önce yazmayı deneyebilirsiniz.

02:20.150 --> 02:23.870
Tamam, önce yapacağımız şey olasılıklarımızı elde etmek.

02:23.870 --> 02:29.930
Dolayısıyla, bunun, giriş imgesine ve her eyleme bağlı olan q değerlerinin her biri için olasılık

02:29.960 --> 02:31.790
dağılımı olduğunu hatırlatmak isterim.

02:31.790 --> 02:38.120
Dolayısıyla, altı veya yedi olası eylemin her biri için bir anahtar değerimiz var ve bu nedenle

02:38.120 --> 02:43.600
yedi olasılığın dağılımını elde ediyoruz ve 7'den sonra, altılı yerine yedi eylem olduğunu düşünüyorum.

02:43.670 --> 02:50.010
nedenle, her bir eylemle ilişkili her bir q değeri için yedi olasılık dağılımı elde ederiz.

02:50.420 --> 02:57.260
Çünkü sağdan sola hareket etme ya da atış yapmanın yanı sıra, yedi muhtemel eylemi gerçekleştiririz ve bu

02:57.260 --> 02:58.930
Yani Propst eşittir.

02:59.040 --> 03:00.670
Ve şimdi ne yapmamız gerektiğini unutma.

03:00.860 --> 03:06.650
Aslında temelde fonksiyonel modüldeki soughed max fonksiyonunu kullanmak zorundayız.

03:06.680 --> 03:13.010
İşlevsel modülümüzü ilk önce alıp, bunu yaptıktan sonra bir sonraki işlevi almamız çok

03:13.130 --> 03:13.700
basit.

03:13.700 --> 03:14.480
İşte burada.

03:14.570 --> 03:22.430
hatırlattığım bir sonraki işlecin argümanlarını olasılık dağılımı oluşturmak istediğiniz öğeler haline getirdik.

03:22.430 --> 03:25.290
Enter'a bastık ve şimdi

03:25.550 --> 03:30.560
Ve tabii ki bu da sinir ağının çıktıları olan q değerleridir.

03:30.680 --> 03:35.830
Olasılık dağılımı oluşturmak istediğiniz sinir ağının çıktısı budur.

03:35.990 --> 03:41.270
Şimdi, bize, maksimum Q değerine sahip olanı doğrudan seçmek yerine farklı

03:41.270 --> 03:45.760
eylemleri keşfetmek için bu olasılık dağılımını yaratmak istediğimizi hatırlatalım.

03:46.010 --> 03:51.020
Doğrudan maksimum Q değerine sahip olanı seçersek, diğer eylemleri çok fazla keşfetmezsek,

03:51.350 --> 03:52.650
bir şeyi özleyebiliriz.

03:52.880 --> 03:58.760
daha araştırma yapabiliriz ve bu nedenle belki de daha iyi olabilecek bazı gizli çözümler bulabiliriz.

03:58.760 --> 04:01.520
Fakat bu suşi bir sonraki yöntemle biraz

04:01.850 --> 04:08.060
Nax'ı tekrar tekrar tavsiye ederim ve bundan sonra yapmamız gereken şu ki burada çıktı

04:08.060 --> 04:09.560
olan değerleri girmektir.

04:09.560 --> 04:13.860
Beynimizin çıktısı o kadar çıktı ki gittiğimizi.

04:13.970 --> 04:21.710
Fakat aramayı özelleştirmek için yapılandıracağımız kullanabileceğimiz sıcaklık parametresine sahibiz.

04:21.710 --> 04:28.130
En azından daha düşük ihtimalle seçilecek olan diğer eylemlerin aksine, en iyi eylemin

04:28.130 --> 04:33.260
daha yüksek bir olasılıkla seçileceği için, sıcaklığı ayarladıkça, diğer eylemlerin

04:33.260 --> 04:35.910
daha az araştırılabileceğini de unutmayın.

04:35.930 --> 04:42.620
Aynen otomobilin içindeymiş gibi ve bu yüzden buradaki sıcaklık parametresiyle çıktıyı çarpmak

04:43.010 --> 04:51.800
zorundayız, çünkü mükemmel oluyoruz, şimdi küçük bir uyarı var, çünkü henüz prepps kullanmadık, ancak şu an

04:51.810 --> 04:53.220
bunu kullanmak üzereyiz.

04:53.260 --> 04:55.540
Ve bu da bizi bir sonraki işimize getiriyor.

04:55.540 --> 04:57.750
Bu olasılıkları nasıl kullanacağız.

04:57.910 --> 05:04.390
Bu olasılık dağılımından oynamak için son işlemi örnekleyeceğiz ve şimdi yapmamız

05:04.990 --> 05:10.960
gereken şey, bu olasılık dağılımına göre eylemi örneklemek için çok terimli

05:10.960 --> 05:12.080
fonksiyonu kullanmaktır.

05:12.370 --> 05:15.030
Şimdi de eylemlerimize hazırız.

05:15.190 --> 05:20.500
Bu yüzden burada yeni bir Voivode oluşturacağım, çünkü AI'nın vücudunun oynayacağı

05:20.500 --> 05:21.490
işlemler olacak.

05:21.520 --> 05:30.330
Ve şimdi, noktalar eklediğimiz olasılık probları dağılımını ve daha sonra çok normal metodu

05:30.880 --> 05:31.480
kullanıyoruz.

05:32.220 --> 05:38.030
Pekâlâ, şimdi biz de sahne dağıtımımızdan toplanan son oyunlarımızı oyuna sokuyoruz.

05:38.430 --> 05:39.570
Tamam mükemmel.

05:39.570 --> 05:42.300
Şimdi biz ne istediğimize geri dönmeye hazırdık.

05:42.360 --> 05:44.450
Oynanacak eylem budur.

05:44.670 --> 05:48.720
Ve bunlar elbette eylemler ve şimdi uyarı kaybolmalıdır.

05:48.840 --> 05:50.440
İstediğimiz her şeyi kullanırız.

05:50.460 --> 05:51.270
Oraya gidiyoruz.

05:51.270 --> 05:52.020
Mükemmel.

05:52.210 --> 05:53.950
Şimdi ileri fonksiyon hazır.

05:54.080 --> 05:55.740
Ve tebrikler.

05:55.800 --> 05:57.300
Vücut da hazır.

05:57.540 --> 05:59.070
Şimdi de bizim beynimiz var.

05:59.190 --> 06:05.760
Vücudumuz var ve bu nedenle geleceğimizi AI gelecekteki AI yapacak şekilde bir araya getirmeyi planlıyoruz. Bir

06:05.760 --> 06:08.900
beyin ve bir bedenden başka bir şeyden oluşmayacağız.

06:08.970 --> 06:14.160
Ve zekâ ve bu istihbarat sayesinde oynamak için doğru eylemler olacak eylemleri

06:14.160 --> 06:16.610
yürütmek için bir organı var.

06:16.620 --> 06:22.060
Ancak zekayı öğrenmeden önce bunu da unutma, oysa konvansiyonel serin öğrenme

06:22.070 --> 06:25.180
ile göz eğitimi için kısmen yapacağız.

06:25.200 --> 06:25.500
Tamam.

06:25.500 --> 06:28.470
Öyleyse AI'yı bir dahaki sefere çıkaralım.

06:28.490 --> 06:31.810
Bence yine de iki fonksiyon sınıfı olacak.

06:31.950 --> 06:34.510
Ve bu yüzden bu iki veya üç öğretici gerektirir.

06:34.680 --> 06:35.660
Bu yüzden bekleyemem.

06:35.670 --> 06:36.780
Bu heyecan verici olacak.

06:36.780 --> 06:37.930
Ve o zamana kadar ben.