WEBVTT

00:00.270 --> 00:02.640
大家好, 欢迎学习本Python教程｡ 

00:02.670 --> 00:03.130
好吧, 我会的

00:03.130 --> 00:06.480
这是一个非常快速的教程, 今天使这个核心功能｡ 

00:06.480 --> 00:12.560
所以这个函数基本上只会计算奖励滑动窗口的得分｡ 

00:12.570 --> 00:18.000
所以基本上我们会非常简单地计算出奖励窗口中所有奖励的平均值｡ 

00:18.000 --> 00:19.590
所以这会很简单｡ 

00:19.590 --> 00:20.670
我们现在就开始吧

00:20.670 --> 00:24.240
我们要创建一个新函数, 叫做score.

00:24.240 --> 00:29.370
评分函数只取自变量self因为基本上我们不需要任何东西.

00:29.640 --> 00:33.630
我们需要把自我, 因为我们当然会把自我, 奖励窗口｡ 

00:33.630 --> 00:37.560
所以只要self和冒号就行了｡ 

00:37.590 --> 00:39.750
只需要一行代码｡ 

00:39.750 --> 00:43.770
所以我们要计算奖励窗口中所有奖励的平均值｡ 

00:43.770 --> 00:49.230
基本上就是这个奖励窗口中所有奖励的总和, 在-1和+1之间,

00:49.230 --> 00:53.220
除以这个窗口中元素的总数.

00:54.000 --> 00:55.020
所以我们开始吧｡ 

00:55.020 --> 00:57.060
我们直接把它退回去｡ 

00:57.060 --> 00:59.460
所以我从回报开始｡ 

00:59.460 --> 01:04.530
所以我们需要计算奖励窗口中所有奖励的总和｡ 

01:05.010 --> 01:08.640
要做到这一点, 我们只需要把奖励窗口本身｡ 

01:08.640 --> 01:13.830
所以我在这里输入自我点奖励窗口｡ 

01:13.980 --> 01:14.430
好吧, 我会的

01:14.430 --> 01:20.460
所以很简单, 这将把奖励窗口中的所有元素相加｡ 

01:20.550 --> 01:22.020
所以这很实用｡ 

01:22.020 --> 01:29.250
然后要得到平均值, 我们需要用这个总和除以奖励窗口中的元素数量｡ 

01:29.280 --> 01:36.960
为了得到元素的个数, 我们需要取Len函数, 然后再取我们的were窗口｡

01:39.050 --> 01:39.830
就在那儿｡ 

01:39.830 --> 01:42.620
但现在我们只需要小心一些东西｡ 

01:42.650 --> 01:49.940
这是Len的自我奖励窗口作为分母, 它绝对不能等于零｡ 

01:49.970 --> 01:55.520
无论如何, 我们需要避免这种情况, 并确保这里的分母不等于零｡ 

01:55.520 --> 01:58.570
我们将添加这个安全技巧｡ 

01:58.580 --> 02:07.100
我们在这里加上一个加一, 这样, lens self, 奖励窗口加一永远不会等于零｡

02:07.130 --> 02:11.210
如果这里的分母等于零, 这将使您的系统崩溃｡ 

02:11.210 --> 02:12.950
所以我们必须避开它｡ 

02:12.950 --> 02:14.120
这完全没问题｡ 

02:14.120 --> 02:17.510
再加一个加号, 我们还是会得到一个很好的分数衡量标准｡ 

02:17.660 --> 02:18.650
好吧, 完美｡ 

02:18.650 --> 02:24.770
这就是我们的得分函数, 它将给予滑动窗口中奖励的平均值｡

02:25.040 --> 02:25.440
好吧, 我会的

02:25.440 --> 02:31.640
现在我们来看看下一个函数, 它是保存函数, 它将保存你的模型,

02:31.640 --> 02:39.500
也就是说, 保存你的汽车大脑, 这样你就可以通过加载另一个函数来重用它, 这个函数将在保存函数之后产生｡

02:39.620 --> 02:46.100
所以这个保存技巧非常实用, 保存函数可以保存你的模型, 以防你想重用它们,

02:46.100 --> 02:49.220
用于任何用途｡

02:49.340 --> 02:51.350
这就是我们在下一个教程中要做的｡ 

02:51.350 --> 02:52.630
在那之前, 好好享受吧｡ 

02:52.640 --> 02:53.180
一､ 
