WEBVTT

00:00.720 --> 00:03.210
Merhaba ve yapay zeka dersine tekrar hoş geldiniz.

00:03.210 --> 00:08.400
Bugün A-3'ün ilk bölümünden bahsediyoruz, aktör eleştiri bölümüne bakınız.

00:08.400 --> 00:10.540
İşte senkronize bir avantajımız var.

00:10.550 --> 00:12.380
Oyuncu eleştirmen algoritması.

00:12.420 --> 00:15.440
Ve altı çizili Akrotiri'den bahsedeceğiz.

00:15.570 --> 00:17.210
Başlayacağımız yer burası.

00:17.400 --> 00:21.960
her yere başlayabilirsiniz, ancak bir eleştirmenden başlamak çok daha mantıklı,

00:22.320 --> 00:29.640
çünkü bu şekilde, neler olduğunu sezgisel olarak anlayabilmemizin ardışık bir açıklamasına ihtiyacımız olacaksa bizi kolaylaştıracaktır.

00:29.640 --> 00:30.470
Teknik olarak

00:30.480 --> 00:33.970
Fakat bu sapmanın sonunda henüz şaşırtmaya başlarsak.

00:34.170 --> 00:41.840
Bu ders şu ana kadar çok iyi bir Kule öğrenimi hazırladık ve bu da burada

00:41.880 --> 00:48.780
illüstratör oldu, böylece bilgisayarı pikselleri görüp, gerçek görüntüyü ve pikselleri yalnızca bir vektör değil.

00:48.780 --> 00:53.610
Yani hile yapmıyor aslında bir insanın gören canavarların gördüğü

00:53.610 --> 01:00.540
canavarların gördüğü sağlığı gördüğü alttaki parametreleri gördüğü veya tabancayı gördüğü tam olarak insanoğlunun gördüğü

01:00.540 --> 01:03.080
şeylerle aynı şeyi oynuyor. oyun.

01:03.090 --> 01:09.450
var, bu küp değerlerinin olduğunu hatırladığımızda bir eylem seçim politikası uyguluyoruz onlara.

01:09.450 --> 01:16.380
Daha sonra bu görüntü bir konvolüsyonlu inekten geçirilir ve sonra çeken bir lariatların içinden

01:16.380 --> 01:20.270
geçip sinir ağına girer ve ardından çıktıklarında eylemleri

01:20.270 --> 01:24.540
Mesela yumuşak bir Max kullanıyoruz ve hangi eylemi gerçekleştirmek istediğimizi buluyoruz.

01:24.540 --> 01:28.470
Ve bu yüzden, bazı keşif ve sömürü devam ediyor.

01:28.470 --> 01:29.860
İkisinin bir kombinasyonu var.

01:30.270 --> 01:33.480
Bu, ne kadar derin konvolüyonel serin öğrenme işidir.

01:33.640 --> 01:34.980
Ama şimdi onunla ne yapacağımıza bakalım.

01:34.970 --> 01:39.510
daha kolay olabilmesi için, çünkü bu görüntüyü ayarlayıp hareket ettireceğiz.

01:39.510 --> 01:41.770
Basitlik uğruna sadece bizimle çalışmanın

01:41.790 --> 01:46.490
Çemberleri bu veya bu dikdörtgen kutularla karelerle değiştireceğiz.

01:46.560 --> 01:53.190
Ayrıca bu çizgilerden kurtulacağız ve bu çizgiden özleri değiştirmeyecek şekilde

01:53.190 --> 01:54.440
oklarla değiştirelim.

01:54.450 --> 01:56.590
Bu sadece bu grafikteki gösterimdir.

01:56.610 --> 02:01.620
Bu yine de bu gösterim hala derin konvolüsyonel Kule öğrenmesi sadece onu değiştirmek

02:01.620 --> 02:05.520
ve tam olarak ne olduğunu göstermek için daha kolay olacak.

02:05.520 --> 02:08.820
İşte bu yüzden buradan nasıl temsil edeceğiz.

02:08.820 --> 02:13.070
Peki ya bu belirli bölüm ne kadar başlıyor.

02:13.080 --> 02:16.680
Unutmayın, aktif eleştiri bölümüyle başlayalım adım adım başlıyoruz.

02:16.680 --> 02:23.490
Bu nedenle derin kritik Kule öğreniminden A-3'e nasıl adım adım ilerlediğimizi göreceğiz ve ilk adımda bunu

02:23.490 --> 02:27.520
bu aktörü PARTOVI eleştireniyle tanıtacağım, o yüzden bu konuda konuşacağız.

02:27.750 --> 02:32.490
Bu yüzden gerçekleşen ilk şey bu son bit.

02:32.640 --> 02:36.990
Çıktı aslında biz sadece bunun gibi yeniden çizelgemiz oluyoruz, böylece tam olarak

02:36.990 --> 02:40.350
aynı çıktılar aynı q değerleri tam olarak aynı eylemdir.

02:40.350 --> 02:45.810
üste getireceksiniz, böylece daha az yer kaplıyorlar, böylece şimdiye kadar hiç bir şey şimdiye kadar değişmemiş.

02:45.810 --> 02:50.280
Eğer sekiz olası işlemi yaptıysanız, halen sekiz olası eyleminiz vardır ve bunları en

02:50.280 --> 02:52.080
Bu ve bu tamamen aynı.

02:52.080 --> 02:55.080
Ancak şimdi aktif eleştirmen partisinin geldiği yer burası.

02:55.110 --> 02:56.580
İkinci bir çıktı alacağız.

02:56.580 --> 03:02.460
Birinci çıktıyı bir çıktılar dizisi olarak alacağız ve burada, teknik olarak sinir

03:02.460 --> 03:06.040
ağımızı kullanacağımız ayrı bir çıktı elde edeceğiz.

03:06.040 --> 03:08.310
Yani saatte bir.

03:08.340 --> 03:14.720
Veya imge ve değerler gibi her şey şebeke üzerinden soldan sağa geçer.

03:14.730 --> 03:17.910
Aslında iki set tükettikleri bir takım değerler tüketmekle yetinmezler.

03:17.910 --> 03:23.910
Ve bu yüzden üst, muhtemel eylemlerin ne olduğunu gerçekten bildiğimizi söyledi, ancak burada başka bir

03:23.910 --> 03:26.970
ekstra değere sahip olacağız, buna bir göz atalım.

03:27.000 --> 03:28.430
Bu değer ne

03:28.620 --> 03:31.260
İşte başımız buradayız.

03:31.380 --> 03:35.190
Dolayısıyla bu illüstrasyonun boyutunu azaltmaktan biraz hoşlanıyoruz.

03:35.340 --> 03:41.210
Daha önce eylemler için tartışıldığımız gibi, en iyi çıktı küp değerleridir.

03:41.220 --> 03:42.500
Yani onlar aynı şey.

03:42.510 --> 03:43.240
Her şey aynı.

03:43.410 --> 03:47.640
Ancak şimdi bu alt kısım ve üst kısım aslında X

03:47.640 --> 03:53.400
olarak adlandırılıyor ya da aktörün adına bir isim vereceğiz, çünkü bu, aracının yapmak

03:53.400 --> 03:59.160
istediğini seçtiği, sanki sanki sahnede performans gösteriyor ve ekranda ikinci adı da bulduğumuz

03:59.160 --> 04:00.730
zaman daha mantıklı olacak.

04:00.900 --> 04:08.120
Ve sonra ikinci çıktı bir değer gibi, yani V'nin S'idir, yani devletin değeri budur.

04:08.130 --> 04:16.800
S'nin q'su A'nın Q'sı belirli bir eylemin q'sı değeridir ve görebildiğiniz gibi eylemin bir nedeni olduğunu göreceksiniz iki eylem üç, eylem altı

04:16.980 --> 04:21.450
ya da daha yüksek, orada muhtemelen bu durumda olan eylemleri ifade eder.

04:21.450 --> 04:22.030
Öyleyse

04:22.030 --> 04:28.410
Belirli bir durumda ne bir eylemi bir aksiyonu aksiyona götürmenin q değeri nedir?

04:28.460 --> 04:34.900
Sonra burada, aslında içinde olduğumuz sahnenin değerinin ne olduğunu tahmin etmek için

04:34.900 --> 04:40.620
sinir ağı kullandığımızı ve bu bölümün eleştirmen olarak da adlandırıldığını öngörüyoruz.

04:40.820 --> 04:47.070
Ve bu, oyuncunun sezgisinin başlangıcında olduğu gibi, sinir ağından sadece iki tane

04:47.880 --> 04:53.260
çıktı olduğunu öngördüğü gibi tamamen sezgisel olmayan türler için sezgisel.

04:53.380 --> 04:56.470
P hareketi denecek kadar yakın olmayan birine sahip olmadan önce.

04:56.470 --> 04:59.040
Ama şimdi Akshara ve eleştirmen olmak üzere iki çıktıımız var.

04:59.250 --> 05:02.320
Ve aralarında dinamik olacak, daha ileride keşfedeceğiz.

05:02.370 --> 05:08.850
Ancak şimdilik, aracının mevcut durumdan alabileceği eylemlerin değerlerini değil, aynı yıl eski ağını

05:09.330 --> 05:14.100
kullanarak bu tür bir durumda olmasının değerini de tahmin

05:14.100 --> 05:15.750
ettiğimizi anlamak önemlidir.

05:15.750 --> 05:20.700
Aktif eleştiricinin ilk adımı budur.

05:20.790 --> 05:24.990
Ve şimdi şimdi görev için neyin bittiğini tam olarak anlamak

05:24.990 --> 05:30.900
için bir sonraki ders kitabında yapacağımız bir senkron hakkında konuşmamız gerekecek. Bugünün nihai konusu

05:30.900 --> 05:32.640
şu ki Pulse .

05:32.640 --> 05:39.720
Bazı bloglarda yapılan bazı literatürde ve aktif eleştirmende bulabileceğiniz bazı tartışmalarda, yazarın bazı

05:39.720 --> 05:47.400
aktörlerin aktör tarafında Cue değerleri hakkında konuştuğunu ve blog yazıları ve tartışmalarında yazarın yazarını

05:47.400 --> 05:53.780
bulabileceğini görebilirsiniz politika hakkında konuşmak ve genellikle politikayı temsil etmek için bir

05:53.860 --> 05:59.810
Yunan harfi P gibi kullanıcıyı kullanın ya da sadece devlet politikasını söyleyin.

05:59.970 --> 06:05.790
Dolayısıyla, bunlar tamamen devletin politikasıdır, çünkü politikayı hatırlarsak, tüm eylemleri

06:05.790 --> 06:11.660
bir araya getirip olası eylemleri yaparsanız, hangisinin yapılması gerektiğine karar verirsiniz.

06:11.660 --> 06:15.400
Dolayısıyla bunlar, her bir eylemi gerçekleştirmenin olasılıkları gibi olacak, böylece bu ilkedir.

06:15.540 --> 06:19.410
Bu yüzden birini veya diğerini görürseniz atılmayın.

06:19.410 --> 06:21.090
Temelde aynı şeyi ifade ediyorlar.

06:21.090 --> 06:24.720
Öte yandan bir taraftan politika ya da q değerleriniz var, öte yandan devletin

06:24.720 --> 06:27.620
gerçek değerine sahip olacaksınız ve o yildan bu yil öngörülüyor.

06:27.750 --> 06:31.770
Bu yüzden aktif eleştirmenin başlangıcı senkronlardan bahsederken bir sonraki öğreticide

06:31.770 --> 06:34.320
buna devam edecek ve oraya bakacağız.

06:34.380 --> 06:35.910
O zamana kadar tadını çıkarın.
