WEBVTT

00:00.580 --> 00:01.330
嗨, 伙计们

00:01.330 --> 00:03.410
欢迎学习Breakout的最终教程｡ 

00:03.430 --> 00:08.380
嘿, 伙计们, 超级兴奋有你在这里和超级高兴大家再次在一起后, 厄运｡ 

00:08.620 --> 00:13.990
所以这次我们要看《突围》的结果, 我提醒你, 它比《毁灭战士》更具挑战性｡

00:14.200 --> 00:15.860
所以希望我们能得到一些好的结果｡ 

00:16.040 --> 00:17.330
好吧, 那我们现在怎么办？

00:17.350 --> 00:19.410
这是主代码｡ 

00:19.420 --> 00:21.100
所以我们有几个代码｡ 

00:21.310 --> 00:23.650
所有的代码都在这里, 这是主代码｡ 

00:23.650 --> 00:26.670
这意味着将执行所有其他代码的代码｡ 

00:26.680 --> 00:30.700
因此, 建立一个神经网络, 并训练代理人的批评｡ 

00:31.240 --> 00:37.270
因此, 基本上我们要做的就是执行, 看看进展如何, 但我们不会等待结果,

00:37.270 --> 00:39.850
因为实际上这需要几个小时｡

00:39.870 --> 00:40.210
是的, 我知道

00:40.480 --> 00:43.270
因此, 我们在此测试文件夹中准备了结果｡ 

00:43.270 --> 00:46.840
我们已经有了视频, 我们将在那之后给你看｡ 

00:46.880 --> 00:47.390
好吧, 我会的

00:48.220 --> 00:53.440
所以要执行, 基本上, 我们只要在这里选择整个代码, 然后开始｡ 

00:56.960 --> 00:57.440
好吧, 我会的

00:57.770 --> 01:00.670
正如你所看到的, 视频已经被填充｡ 

01:00.680 --> 01:01.040
好吧, 我会的

01:01.070 --> 01:01.550
好吧, 我会的

01:01.550 --> 01:08.480
所以现在, 我们已经有了两个视频, 然后特工们正在训练, 但这需要很长时间｡

01:08.480 --> 01:12.650
现在我们要做的是观察结果, 我还没有看到结果｡ 

01:12.650 --> 01:13.760
你还没看过呢

01:13.820 --> 01:14.260
好吧, 我会的

01:14.260 --> 01:14.590
好吧, 我会的

01:14.810 --> 01:24.080
因此, 在SES网站上的模板文件夹中, 您将找到两个文件夹代码､ 无注释和带注释的代码｡

01:24.080 --> 01:28.490
所以即使你错过了任何细节, 你仍然可以看看这个代码｡ 

01:28.490 --> 01:30.530
你对所有的评论都解释得很好｡ 

01:30.530 --> 01:33.830
所以每一行都是欢迎输入的, 这样你就能理解了｡ 

01:33.950 --> 01:40.580
然后, 在此文件夹中, 您将找到此测试文件夹, 该文件夹将填充视频｡

01:40.580 --> 01:40.880
好吧, 我会的

01:40.940 --> 01:42.650
所以录像带就在那里｡ 

01:42.650 --> 01:46.370
这是我们之前培训的视频｡ 

01:46.610 --> 01:50.300
我们对模型进行了几个小时的训练, 并获得了这些视频｡ 

01:50.480 --> 01:53.240
所以我们要一个一个看, 从第一个开始｡ 

01:53.420 --> 02:00.480
我们将看看是否有人工智能在发挥作用, 我们是否能解决问题｡

02:00.620 --> 02:01.520
好吧, 我们来看看｡ 

02:01.580 --> 02:03.110
我们来看第一段视频｡ 

02:03.110 --> 02:06.260
所以这第一个视频, 你知道, 实际上是我们要做的｡ 

02:06.260 --> 02:10.190
是的, 我们要做的是停止训练, 因为它正在减慢我的电脑现在｡ 

02:10.190 --> 02:10.610
是这样｡ 

02:10.610 --> 02:13.790
好吧, 被打断了, 但一切都好｡ 

02:13.790 --> 02:14.160
是的, 我知道

02:14.210 --> 02:15.560
让我们看第一段视频｡ 

02:16.780 --> 02:19.930
这将是非常糟糕的, 因为这真的是第一个｡ 

02:19.930 --> 02:21.620
踏板甚至可能不会移动｡ 

02:21.640 --> 02:22.090
我们走吧｡ 

02:22.330 --> 02:22.840
它不动了｡ 

02:22.870 --> 02:23.890
他为什么一动不动？

02:23.980 --> 02:25.960
因为, 你知道, 这才刚刚开始｡ 

02:26.050 --> 02:27.640
那家伙不知道该怎么办｡ 

02:27.820 --> 02:30.370
它仍然是一个预处理的图像｡ 

02:30.370 --> 02:31.780
所以, 是的, 没什么｡ 

02:31.900 --> 02:34.750
第二个视频甚至可能是这样｡ 

02:34.780 --> 02:37.930
如果我们看第二个, 专家组可能不会｡ 

02:38.350 --> 02:39.460
可能还是不会动｡ 

02:41.890 --> 02:42.320
好吧, 我会的

02:42.370 --> 02:45.250
那么到目前为止, 你对这个人工智能有什么看法？

02:46.070 --> 02:46.070
是的, 我知道

02:47.140 --> 02:49.870
所以这才是一个耗费了如此多能量的地球｡ 

02:51.920 --> 02:54.310
好了, 下一个视频, 我们可能会有一些东西｡ 

02:54.310 --> 02:56.140
好吧, 也许有点什么｡ 

02:56.140 --> 02:59.260
一点点人工智能泄露了太多信息｡ 

03:05.060 --> 03:08.150
甚至不是甚至不是无用地｡ 

03:08.180 --> 03:09.560
我们是要突围还是｡ 

03:09.920 --> 03:11.120
不, 不, 不, 不

03:11.270 --> 03:11.510
好吧, 我会的

03:11.510 --> 03:11.830
来吧, 来吧

03:11.840 --> 03:13.490
我们来做点酷的吧｡ 

03:13.520 --> 03:13.880
我们走吧｡ 

03:14.000 --> 03:16.430
希望下一次能有所收获｡ 

03:18.100 --> 03:18.400
是的, 我知道

03:18.400 --> 03:21.760
我想我们得到了一些东西, 因为现在是11秒｡ 

03:22.870 --> 03:23.710
我们走吧｡ 

03:25.000 --> 03:25.660
好点了｡ 

03:25.690 --> 03:27.520
好了, 现在眼睛有眼睛了｡ 

03:27.520 --> 03:28.750
它能看见｡ 

03:29.020 --> 03:30.310
能感觉到它在做什么｡ 

03:30.310 --> 03:30.760
是的, 我知道

03:32.240 --> 03:33.620
但还不是很快｡ 

03:33.710 --> 03:34.460
没什么聪明的｡ 

03:34.460 --> 03:36.310
我抓住你了｡ 

03:36.320 --> 03:37.130
但更好｡ 

03:37.400 --> 03:38.140
所以四个｡ 

03:38.180 --> 03:38.690
四个｡ 

03:39.710 --> 03:40.880
下一个视频｡ 

03:42.810 --> 03:44.300
现在看起来好多了｡ 

03:44.330 --> 03:44.720
是的, 我知道

03:45.400 --> 03:46.180
多点时间｡ 

03:46.180 --> 03:46.600
是的, 我知道

03:46.930 --> 03:47.420
你准备好了吗？

03:47.440 --> 03:47.770
是的, 我知道

03:47.800 --> 03:48.470
我们来看看｡ 

03:48.490 --> 03:48.910
是的, 我知道

03:48.940 --> 03:49.900
好吧, 我会的

03:49.930 --> 03:50.680
我知道了｡ 

03:50.960 --> 03:51.250
抓到你了

03:51.250 --> 03:52.150
还有吗？

03:53.140 --> 03:53.970
不, 他弄丢了｡ 

03:53.980 --> 03:54.330
是的, 我知道

03:54.370 --> 03:56.110
还不完美, 但绝对｡ 

03:56.110 --> 03:59.110
就像人类在演奏一样｡ 

03:59.320 --> 04:01.480
不太擅长打破, 但仍然, 这就像｡ 

04:02.280 --> 04:02.490
喜欢｡ 

04:02.630 --> 04:04.090
就像人类在玩耍一样｡ 

04:04.240 --> 04:06.220
就像一个五岁､ 两岁的人类在玩耍｡ 

04:08.170 --> 04:08.780
好吧, 我会的

04:08.890 --> 04:09.300
哇哦｡ 

04:09.310 --> 04:10.290
它真的在抓他们｡ 

04:10.300 --> 04:10.870
是的, 我知道

04:11.000 --> 04:11.910
很高兴见到你们｡ 

04:11.920 --> 04:12.310
是的, 我知道

04:14.520 --> 04:21.070
但它就像是在做一个, 你知道, 试图用一些奇怪的策略抓住船｡ 

04:21.090 --> 04:21.660
是的, 我知道

04:22.290 --> 04:25.680
这不像是一个完美的预测球会在哪里｡ 

04:26.010 --> 04:26.520
好吧, 我会的

04:26.790 --> 04:27.410
我希望我们能好起来｡ 

04:27.600 --> 04:28.980
27岁更好｡ 

04:29.370 --> 04:31.350
好吧, 下一个｡ 

04:33.400 --> 04:34.210
又是37号｡ 

04:35.500 --> 04:36.400
那是27次｡ 

04:36.400 --> 04:36.820
这是30

04:36.820 --> 04:37.090
是这样｡ 

04:37.420 --> 04:37.810
好吧, 我会的

04:38.260 --> 04:39.970
不, 我是说时间｡ 

04:40.190 --> 04:40.510
好吧, 我会的

04:41.110 --> 04:41.770
哦, 好吧｡ 

04:43.050 --> 04:44.490
现在, 我会说这是一个五岁｡ 

04:50.470 --> 04:51.290
好吧, 我会的

04:51.820 --> 04:52.150
嗯嗯嗯

04:52.210 --> 04:52.690
不错吧？

04:52.720 --> 04:53.170
是的, 我知道

04:53.800 --> 04:56.620
现在那个女孩, 公牛跑得更快了｡ 

04:56.770 --> 05:00.790
所以, 当然, 这要困难得多, 但仍然, 它做得很好｡ 

05:02.690 --> 05:05.510
看看这次能不能打败27号｡ 

05:06.200 --> 05:06.770
23.

05:06.770 --> 05:07.730
24.

05:08.620 --> 05:09.160
28.

05:09.460 --> 05:10.120
我们走吧｡ 

05:10.150 --> 05:10.480
看到了吗？

05:10.480 --> 05:11.590
越来越好了｡ 

05:11.620 --> 05:12.460
这是个好兆头｡ 

05:13.920 --> 05:18.870
下一个是93号指挥官

05:20.170 --> 05:21.350
哇, 哇｡ 

05:21.820 --> 05:22.960
1分10秒｡ 

05:24.070 --> 05:24.640
让我想想｡ 

05:28.440 --> 05:29.550
就在那儿

05:29.760 --> 05:30.410
那很酷｡ 

05:30.570 --> 05:32.520
这绝对是个代名词, 不是吗？

05:32.550 --> 05:32.820
是的, 我知道

05:32.820 --> 05:37.710
你可以看出这不是一架人类的飞机, 因为它像是在零星地移动, 像是超快｡ 

05:37.710 --> 05:38.250
是的, 我知道

05:38.700 --> 05:42.780
它在节省不必要的动作方面做了很多, 但它仍然在达到目标｡ 

05:43.080 --> 05:45.420
让我们看看当球飞得很快时它会怎么做｡ 

05:46.210 --> 05:48.420
唉, 到底是什么牛旋靠？

05:51.300 --> 05:51.780
我不知道我不知道

05:51.780 --> 05:52.470
我想是的｡ 

05:52.930 --> 05:55.260
它是否取决于它破坏的块的颜色？

05:55.500 --> 05:56.130
也许吧｡ 

05:56.610 --> 05:57.900
或者只是随机的？

05:58.770 --> 06:02.190
看起来是随机的, 但是, 呃, 我们应该看看越狱规则｡ 

06:02.500 --> 06:05.130
是啊, 但现在真的很好｡ 

06:05.130 --> 06:05.670
是的, 我知道

06:05.700 --> 06:06.540
34.

06:06.540 --> 06:06.990
34.

06:06.990 --> 06:07.470
得分｡ 

06:07.500 --> 06:08.100
很好｡ 

06:08.320 --> 06:08.730
好吧, 我知道了

06:09.530 --> 06:10.880
它真的, 真的做得很好｡ 

06:11.240 --> 06:15.320
所以, 是的, 我们肯定有一些a3c发挥爆发了｡ 

06:15.350 --> 06:15.790
很好｡ 

06:18.630 --> 06:19.320
移动列表｡ 

06:19.810 --> 06:20.770
是啊, 这是很好的｡ 

06:21.060 --> 06:22.650
就像我们有一个有记忆的大脑｡ 

06:22.750 --> 06:22.910
是的, 我知道

06:23.010 --> 06:24.150
不仅用眼睛｡ 

06:24.660 --> 06:25.260
它的眼睛很好｡ 

06:25.260 --> 06:27.630
你知道, 这是一个快速, 相当快的接球｡ 

06:28.140 --> 06:30.000
但它也有一些记忆, 但是｡ 

06:32.270 --> 06:32.750
我不知道我不知道

06:32.780 --> 06:34.850
你会用你的记忆力来玩突围游戏吗？

06:34.880 --> 06:35.510
当然可以了｡ 

06:35.990 --> 06:36.380
是的, 我知道

06:36.710 --> 06:37.270
好吧, 我会的

06:37.490 --> 06:38.900
干得好｡ 

06:38.900 --> 06:39.350
干得漂亮｡ 

06:39.350 --> 06:40.550
来了三个｡ 

06:41.570 --> 06:42.500
最后一个是什么？

06:42.800 --> 06:43.880
最后一个｡ 

06:45.940 --> 06:46.360
哦, 我的天

06:46.810 --> 06:47.700
五十五秒｡ 

06:47.700 --> 06:48.520
所以少了一点｡ 

06:48.730 --> 06:51.550
你还记得上一场比赛的比分吗？

06:51.700 --> 06:54.340
他们把它摇了摇, 看我们是否有所改进｡ 

06:54.340 --> 06:56.170
我们可能得不到什么改善｡ 

06:56.170 --> 06:56.820
每一个视频｡ 

06:56.830 --> 06:57.020
是的, 我知道

06:57.020 --> 06:57.310
是的, 我知道

06:58.450 --> 06:59.200
那是78次｡ 

06:59.310 --> 06:59.680
好吧, 我会的

07:00.470 --> 07:00.850
是的, 我知道

07:00.860 --> 07:02.660
正如你所说, 那是由于探索｡ 

07:06.380 --> 07:06.890
好吧, 我会的

07:07.010 --> 07:07.640
我们走吧｡ 

07:09.730 --> 07:09.940
为｡ 

07:16.600 --> 07:17.010
好吧, 我会的

07:17.290 --> 07:22.360
我觉得我们应该在催眠的时候放点音乐｡

07:27.480 --> 07:28.920
你能做到的

07:39.010 --> 07:40.120
她就像打了类固醇｡ 

07:40.930 --> 07:42.790
一直在左右点击｡ 

07:45.650 --> 07:46.610
但它做得好吗？

07:46.640 --> 07:54.840
是啊, 但我们可能无法解决整个游戏的突破, 但我们只是需要有它的训练更多｡ 

07:54.870 --> 07:55.240
是的, 我知道

07:56.910 --> 07:57.990
真的很棒｡ 

07:58.020 --> 07:58.560
真的很好吃

08:01.130 --> 08:01.670
哦, 好吧｡ 

08:02.720 --> 08:03.370
哦, 是的｡ 

08:03.380 --> 08:04.320
有点太快了｡ 

08:04.340 --> 08:04.820
60.

08:04.820 --> 08:06.230
所以再次击败比分｡ 

08:06.620 --> 08:07.910
有78个不是吗｡ 

08:07.960 --> 08:08.180
是的, 我知道

08:09.380 --> 08:11.600
于是我们就这样一点也没停下来｡ 

08:11.660 --> 08:13.240
绝对是一些玩突破｡ 

08:13.260 --> 08:13.490
是的, 我知道

08:13.550 --> 08:13.820
很好｡ 

08:13.820 --> 08:14.330
很不错｡ 

08:14.330 --> 08:15.020
很不错｡ 

08:15.050 --> 08:15.530
太棒了｡ 

08:15.530 --> 08:16.970
所以我希望你喜欢｡ 

08:16.970 --> 08:25.160
最重要的是, 我希望你喜欢这个, 呃, 强大的a3c实现, 是的, 你可以看到它是如何,

08:25.310 --> 08:27.870
如何做得很好的列表｡

08:27.920 --> 08:29.720
M是的, 没错｡ 

08:29.720 --> 08:37.520
比如, 在论文的最后, 他们对不同的算法进行了比较, 这是目前为止最好的一种｡

08:37.550 --> 08:43.100
不仅他们有最好的其他比较这些模型, 但我也经历了他们中的几个,

08:43.280 --> 08:46.970
所以我经历了一个没有STM和去与｡

08:46.970 --> 08:49.850
当然, 系统改进了算法｡ 

08:49.850 --> 08:51.080
有多好？

08:52.010 --> 08:52.670
好多了｡ 

08:52.670 --> 08:54.070
像我一样｡ 

08:54.080 --> 09:01.190
我几乎没有一些人工智能之前, 发挥突破它持续像15秒或20秒, 但肯定不会超过一分钟,

09:01.190 --> 09:04.430
因为我们在这里看到的｡

09:04.430 --> 09:05.450
是啊, 是啊, 这很好｡ 

09:05.480 --> 09:06.050
那就好｡ 

09:06.410 --> 09:07.280
好吧, 酷｡ 

09:07.310 --> 09:07.850
好的, 谢谢

09:07.850 --> 09:08.990
谢谢, 伙计们｡ 

09:09.110 --> 09:09.920
谢谢你, 谢谢你

09:09.920 --> 09:12.920
这是第三单元的结尾, 因此也是本课程的结尾｡ 

09:12.920 --> 09:20.150
恭喜你完成了三个模块, 主要是a3c, 这是一个相当大的, 相当大的｡

09:20.150 --> 09:20.620
是的, 我知道

09:20.750 --> 09:26.780
当然, 我们还可以探索a3c的不同修改,

09:26.780 --> 09:31.550
也许在您观看这段视频时, 3C中有一些非常酷的新改进,

09:31.550 --> 09:36.110
您可能会拥有甚至是一款比a3c更好的新型号？

09:36.110 --> 09:37.130
是的, 当然｡ 

09:37.340 --> 09:39.080
我们来看看2018年的情况｡ 

09:39.080 --> 09:39.650
好吧, 我会的

09:39.980 --> 09:40.170
好吧, 我会的

09:40.180 --> 09:40.350
好吧, 我会的

09:40.370 --> 09:41.090
谢谢大家｡ 

09:41.090 --> 09:41.510
-谢谢—谢谢

09:41.510 --> 09:42.080
-再见—再见
