WEBVTT

00:00.270 --> 00:02.640
こんにちは､ このPythonチュートリアルへようこそ｡ 

00:02.670 --> 00:03.130
わかりました｡ 

00:03.130 --> 00:06.480
今日はこのコア機能を作るための超簡単なチュートリアルです｡ 

00:06.480 --> 00:12.560
この関数は､ 基本的に報酬のスライディングウィンドウ上でスコアを計算するだけです｡ 

00:12.570 --> 00:18.000
そこで､ 基本的には､ 報酬ウィンドウ内のすべての報酬の平均を非常に簡単に計算することにします｡ 

00:18.000 --> 00:19.590
だから､ これはとてもシンプルなものになります｡ 

00:19.590 --> 00:20.670
今すぐやりましょう｡ 

00:20.670 --> 00:24.240
この新しい関数を作って､ scoreと呼ぶことにします｡ 

00:24.240 --> 00:29.370
そして､ score関数は引数selfを取るだけで､ 基本的には何も必要ないからです｡ 

00:29.640 --> 00:33.630
私たちは自己を取る必要があります｡ もちろん､ 私たちは自己を取るので､ その報酬のウィンドウ｡ 

00:33.630 --> 00:37.560
だから､ セルフとコロンの2つでいいんです｡ 

00:37.590 --> 00:39.750
1行のコードで済むんです｡ 

00:39.750 --> 00:43.770
そこで､ 報酬ウィンドウにあるすべての報酬の平均を計算したい｡ 

00:43.770 --> 00:49.230
つまり､ この報酬ウィンドウのマイナス1からプラス1までの報酬の合計を､

00:49.230 --> 00:53.220
このウィンドウの要素の総数で割ったものです｡

00:54.000 --> 00:55.020
では､ こうしてみましょう｡ 

00:55.020 --> 00:57.060
それを直接返すんです｡ 

00:57.060 --> 00:59.460
だから､ リターンから始めています｡ 

00:59.460 --> 01:04.530
それで､ 報酬ウィンドウにあるすべての報酬の合計を取る必要があります｡ 

01:05.010 --> 01:08.640
そして､ そのためには､ 単純にリワードウィンドウそのものを取り出せばいいのです｡ 

01:08.640 --> 01:13.830
それで､ ここにセルフドット報酬のウィンドウを入力しているのです｡ 

01:13.980 --> 01:14.430
わかりました｡ 

01:14.430 --> 01:20.460
というように､ 非常にシンプルに､ これは報酬ウィンドウ内のすべての要素を合計します｡ 

01:20.550 --> 01:22.020
ということは､ かなり実用的なんですね｡ 

01:22.020 --> 01:29.250
そして､ 平均を求めるには､ この合計を報酬ウィンドウの要素数で割る必要があります｡ 

01:29.280 --> 01:36.960
そして､ 要素数を求めるには､ Len関数を使ってから､ 再びwe were windowを使う必要があります｡

01:39.050 --> 01:39.830
そこにあるのは

01:39.830 --> 01:42.620
ただ､ 今は何かに気をつける必要があります｡ 

01:42.650 --> 01:49.940
それは､ あのLenのセルフリワードウィンドウを分母として､ これが絶対にゼロになってはいけないということです｡ 

01:49.970 --> 01:55.520
何があっても､ これを避け､ ここの分母が0にならないようにする必要がある｡ 

01:55.520 --> 01:58.570
この安全の仕掛けを追加するのです｡ 

01:58.580 --> 02:07.100
ここにプラス1を加えて､ Len self､ 報酬窓プラス1が決してゼロにならないようにします｡

02:07.130 --> 02:11.210
ここで分母が0に等しいと､ システムがクラッシュします｡ 

02:11.210 --> 02:12.950
だから､ 避けなければならないのです｡ 

02:12.950 --> 02:14.120
そして､ それは全く問題ありません｡ 

02:14.120 --> 02:17.510
プラスアルファを加えるなら､ やはりスコアの良し悪しを測ることでしょう｡ 

02:17.660 --> 02:18.650
よし､ 完璧だ｡ 

02:18.650 --> 02:24.770
これでスコア関数ができあがり､ スライディングウィンドウ内の報酬の平均が得られます｡

02:25.040 --> 02:25.440
わかりました｡ 

02:25.440 --> 02:39.500
次に､ モデルを保存する機能､ つまり車の頭脳を保存して､ 保存機能の後に作る別の機能で読み込んで再利用できるようにする機能です｡

02:39.620 --> 02:46.100
このように､ モデルを保存しておけば､ 何かの機会に再利用することができるので､

02:46.100 --> 02:49.220
とても実用的です｡

02:49.340 --> 02:51.350
というわけで､ 次のチュートリアルでは､ それをやってみましょう｡ 

02:51.350 --> 02:52.630
そしてそれまで､ お楽しみに｡ 

02:52.640 --> 02:53.180
I.
