WEBVTT

00:00.930 --> 00:03.970
Merhaba ve yapay zeka dersine tekrar hoş geldiniz.

00:03.990 --> 00:08.480
Belman denkleminden bahsettik ve küçük labirentimizi analiz ettik.

00:08.520 --> 00:11.100
Plana bir göz atalım.

00:11.100 --> 00:12.400
Plan nedir.

00:12.750 --> 00:14.650
Ana analizimiz burada.

00:14.670 --> 00:20.970
Ve devletlerin aslında her bir devletin değerlerini görebildiğimizi biliyoruz, her bir devletin

00:20.970 --> 00:23.310
varlık değerinin ne olduğunu görebiliyoruz.

00:23.400 --> 00:27.810
Bu nedenle AI can veya aracı bu labirentte gezinebilir.

00:27.840 --> 00:28.770
Peki plan ne planlıyor.

00:28.770 --> 00:35.640
Plan, basitçe, bu değerlere bakmak yerine, yapay zeka için bir hazine haritası gibidir;

00:35.730 --> 00:41.420
bu değerler, ajanın hangi yönde gitmesi gerektiğini gösteren oklarla değiştirilir.

00:41.490 --> 00:43.360
Bunlardan dolayı bu değerleri biliyor.

00:43.350 --> 00:47.230
Bu yüzden bu çevreyi araştırdıktan sonra ideal bir senaryo.

00:47.250 --> 00:50.860
Her eyalette varlık değerini bilir ve bu nedenle bu haritayı hazırlayabilirsiniz.

00:50.870 --> 00:52.330
O zaman tekrar bir göz atalım.

00:52.380 --> 00:58.410
buradaysanız, o zaman buradan çıktıktan sonra buradan daha iyi olan bu değer daha iyi bir değerdir.

00:58.830 --> 01:02.010
Değerlerinizin bir olduğunu biliyoruz, öyleyse ikinizin arasından en iyisi

01:02.010 --> 01:02.750
Bu daha iyisi.

01:02.760 --> 01:04.740
Veya aslında buradan iki seçeneğiniz var.

01:04.770 --> 01:11.130
Yani o bir kravat gibiydi, o yüzden rasgele seçmek hangisi önemli değil, çünkü her iki durumda da

01:11.130 --> 01:16.110
değer aynı ve daha fazla, bakarsanız bile adımların aynı miktarını alacak aynı sayıda

01:16.110 --> 01:18.390
sonuna kadar atılmak için adımlar atın.

01:18.690 --> 01:22.520
Buradan üç seçeneğiniz var ancak bu daha iyi bir değer.

01:22.530 --> 01:24.360
Bu, buradan daha iyi bir değer.

01:24.360 --> 01:29.380
Açıkçası bu daha iyi bir değerdi, çünkü hemen eksi bir ödül kazandığınızı biliyorsunuz.

01:29.590 --> 01:35.250
Ve buradan aslında üçünüz var, ancak bu, devletin en iyi değerinden en iyisi.

01:35.400 --> 01:41.190
Ve bu yüzden onları oklarla değiştirirsek, burada yıldızlar ya da neden çözüldüğünde bu karede

01:41.200 --> 01:44.570
sona eren ajan bunun nasıl geçeceğini anlamış olur.

01:44.580 --> 01:46.070
Buradan nasıl çıkacağını biliyor.

01:46.280 --> 01:48.980
Yıldızlar ve bu meydan burada nasıl geçileceğini bilir.

01:48.980 --> 01:51.440
Yani bir plan budur.

01:51.440 --> 01:56.850
benzemektedir ancak onlarla ilgili biraz hünerleri vardır, çünkü çevre biraz farklı olacaktır.

01:56.850 --> 02:01.660
Ve planı politikayla karıştırmayın çünkü İran'ın politikalarından bahsedeceğiz; İran, planlara

02:01.670 --> 02:02.380
çok

02:02.420 --> 02:07.560
Stokastik olacak ve bir sonraki öğretmende konuşacağız.

02:07.910 --> 02:10.000
Yani Conway size bir sonraki.

02:10.020 --> 02:12.060
Ve o zamana kadar tadını çıkarın.
