WEBVTT

00:00.180 --> 00:04.930
こんにちは､ この最初のモジュールの自動運転車の楽しいチュートリアルへようこそ｡ 

00:04.950 --> 00:06.160
壮大なものになりそうです｡ 

00:06.180 --> 00:11.600
環境に対する眼力を､ 4つのレベルでテストするのです｡ 

00:11.610 --> 00:13.290
つまり､ ゲームをするのです｡ 

00:13.290 --> 00:18.150
ゲームの難易度は全レベルで､ AIはこの4つのレベルをクリアする必要があります｡ 

00:18.160 --> 00:20.460
では､ この4つのレベルはどうなるのでしょうか？

00:20.460 --> 00:29.100
まずレベル1ですが､ 空港に到着して､ 空港とダウンタウンを何往復かすることになります｡

00:29.100 --> 00:34.470
だから､ 車が往復するのを見たら､ すぐにレベル1を通り越してレベル2になるんです｡ 

00:34.470 --> 00:40.920
レベル2は､ この往復を続けながら､ 自分たちで描いた特定の道路を走るというものです｡ 

00:40.920 --> 00:48.960
でも､ レベル2だから簡単な道になるし､ もちろんその道を走り続けることでクルマは自走することになる｡

00:48.960 --> 00:53.190
つまり､ 空港からダウンタウンへ､ そしてその反対側へ行く道路になるのです｡ 

00:53.190 --> 00:56.970
そして､ 車はその道路に留まることで､ この往復をしなければならなくなるわけです｡ 

00:57.000 --> 01:00.810
そうなれば､ レベル2､ そしてレベル3と合格していくことになります｡ 

01:00.810 --> 01:08.640
レベル3では､ 地図上に障害物を描き､ 車がその障害物を避けながらゴールにたどり着けるかどうかを確認します｡

01:08.640 --> 01:09.540
だから心配ない｡ 

01:09.540 --> 01:16.650
難易度の高い障害物を描き､ それを回避しながら空港や市街地までたどり着けるかどうか｡

01:16.830 --> 01:25.170
そしていよいよレベル4､ 車にとって最も難しい､ ダウンタウンにたどり着くまでの非常に困難な道を描くことになるのです｡

01:25.170 --> 01:28.020
だから､ よくわからないけど､ どこかのジグザグみたいな道になるんでしょうね｡ 

01:28.020 --> 01:31.560
私は優秀な建築家ではありませんが､ 挑戦的な道を作ってみようと思っています｡ 

01:31.650 --> 01:35.220
だから､ せめて1級は合格してほしい｡ 

01:35.220 --> 01:36.150
それは素晴らしいことです｡ 

01:36.150 --> 01:39.120
そして､ レベル2､ 3も合格できるようにしましょう｡ 

01:39.120 --> 01:41.880
そして､ レベル4に合格すれば､ それは素晴らしいことです｡ 

01:41.880 --> 01:43.080
では､ こうしてみましょう｡ 

01:43.080 --> 01:44.400
挑戦してみよう｡ 

01:44.400 --> 01:49.290
まあ､ 実際には自動運転車が挑戦することになるのですが､ 私たちはそのブレインですから､

01:49.290 --> 01:51.630
それでもうまくいくことを期待しましょう｡

01:51.900 --> 01:52.410
わかりました｡ 

01:52.410 --> 01:57.060
では､ まず最初に地図について簡単に説明します｡ 

01:57.060 --> 01:58.950
それが地図なんですね｡ 

01:58.950 --> 02:00.870
そして､ まずは地図を見ます｡ 

02:00.870 --> 02:03.930
AIを使わない自動運転車を見てみる｡ 

02:03.960 --> 02:09.240
つまり､ このモジュールの冒頭で見たような､ ランダムなアクションを起こす車ということになります｡ 

02:09.330 --> 02:10.830
では､ それをどう見ればいいのか｡ 

02:10.830 --> 02:19.380
さて､ AIを停止させ､ AIを起動させるには､ 単純に温度を0にすればいいわけです｡

02:19.380 --> 02:24.090
ここでいうパラメータとは気温のことで､ 今は7に等しいことを思い出してください｡ 

02:24.090 --> 02:25.560
だから低温なんですね｡ 

02:25.560 --> 02:27.270
それを後から増やしていくのです｡ 

02:27.270 --> 02:35.970
しかし､ 車に脳を持たせたくない､ つまりAIを起動させたくないのであれば､ 単純に温度をゼロにするtイコールゼロにすればいいのです｡

02:35.970 --> 02:36.810
こちらも同じです｡ 

02:36.810 --> 02:39.600
もちろん､ それはコード上の本当の温度です｡ 

02:39.600 --> 02:40.380
そうそう､ そうなんです｡ 

02:40.380 --> 02:45.390
そして､ 保存することを忘れてはいけません｡ そうしないと､ 変更が反映されないからです｡ 

02:45.630 --> 02:47.400
なるほど､ 今はAIがないんですね｡ 

02:47.430 --> 02:49.020
AIが起動する｡ 

02:49.020 --> 02:55.260
では､ この地図を見て､ どんなものかを簡単に思い出してみましょう｡

02:55.260 --> 03:00.030
そこで､ すべてを選択してエンターキーを押します｡ 

03:00.960 --> 03:01.470
わかりました｡ 

03:01.470 --> 03:03.630
そして､ 私たちの地図と車がある｡ 

03:03.630 --> 03:10.020
ご覧のように､ 車は左へ行ったり､ 直進したり､ 右へ行ったりと､ まったくランダムに行動しています｡

03:10.020 --> 03:17.430
したがって､ 地図の左上で思い出したが､ 空港に到達していないのである｡

03:17.430 --> 03:18.210
まあ､ そうなんですけどね｡ 

03:18.210 --> 03:19.620
でも､ それは全くのランダムです｡ 

03:20.130 --> 03:28.110
今は空港にいて､ もうひとつの目標であるマップ右下のダウンタウンには到達していませんよね｡

03:28.200 --> 03:29.670
だから､ 私たちはここと同じだったんです｡ 

03:29.670 --> 03:33.900
しかし､ その行動が全くランダムであることは､ 今はっきりとわかります｡ 

03:33.900 --> 03:39.240
どこにも行かないし､ 人工知能も間違いなくない｡ 

03:39.240 --> 03:40.170
でも､ 心配は無用です｡ 

03:40.170 --> 03:41.880
今すぐ起動させます｡ 

03:42.090 --> 03:44.400
マップを閉じます

03:45.100 --> 03:49.450
そして､ カーネルを再起動します､ カーネルを再起動します｡ 

03:49.480 --> 03:51.460
ここでこのツールボタンをクリックしてから､ です｡ 

03:51.460 --> 03:54.550
はい､ それではいよいよ本番です｡ 

03:54.590 --> 04:01.360
いよいよ私たちが作ったこの脳を車に搭載し､ AIを起動させます｡ 

04:01.480 --> 04:03.920
どうなるのか､ 超楽しみです｡ 

04:03.940 --> 04:08.920
これからAIを起動させるのですが､ そのためには温度を上げる必要があります｡ 

04:09.280 --> 04:17.220
ですから､ 温度を変えるには､ このゼロをまあ､ さっきと同じように7に置き換えればいいんです｡

04:17.230 --> 04:19.450
そこで､ ここでは7つを指定することにしよう｡ 

04:19.480 --> 04:20.050
わかりました｡ 

04:20.050 --> 04:21.430
貯金を忘れないようにしよう｡ 

04:21.430 --> 04:23.380
そして､ 今度は地図に戻りましょう｡ 

04:23.380 --> 04:27.460
そして､ カーネルを再起動したので､ もう一度これを実行すればよいのです｡ 

04:27.640 --> 04:30.670
だから実行しよう､ そうすればいいんだ｡ 

04:30.670 --> 04:33.490
車があるのに､ 何をやっているんだ？

04:33.580 --> 04:36.550
まあ､ 自分の道を探そうとしているのでしょう｡ 

04:36.550 --> 04:39.700
探索し､ 何をしなければならないかを理解しているのです｡ 

04:39.700 --> 04:41.920
そして､ そろそろ空港に到着です｡ 

04:41.920 --> 04:43.090
そして､ そこに行く｡ 

04:43.090 --> 04:44.560
第一目標達成

04:44.560 --> 04:45.400
素晴らしい｡ 

04:45.430 --> 04:47.920
そして､ 次の目標はダウンタウンに到達することです｡ 

04:47.920 --> 04:50.500
そして､ それはちょうどダウンタウンに到達したところでした｡ 

04:50.500 --> 04:54.070
そして今､ それは空港に戻る空港を探そうとしています｡ 

04:54.070 --> 04:55.660
そして､ またまた出ました｡ 

04:55.660 --> 04:56.380
素晴らしい｡ 

04:56.380 --> 04:57.310
だからうまくいくんです｡ 

04:57.310 --> 05:01.150
実は時間がかからなかったんです､ 探索するにも､ 失敗から学ぶにも｡ 

05:01.150 --> 05:04.270
ここでの間違いは､ ゴールから遠ざかることですよね｡ 

05:04.300 --> 05:08.680
そこで､ 車に少しマイナスの報酬を与えて罰するのです｡ 

05:08.890 --> 05:10.240
それは-0です｡  2.

05:10.240 --> 05:12.430
だから､ その失敗から学んだのだ｡ 

05:12.430 --> 05:18.850
そして､ その失敗から学ぶことで､ ゴールに近づくというプラスの報酬を得ることに成功したのです｡

05:19.060 --> 05:21.760
そして今､ ようやく自分たちが何をしなければならないかを理解した｡ 

05:21.760 --> 05:27.740
確かに空港に到着して､ ダウンタウンに到着して､ この往復ですからね｡ 

05:28.230 --> 05:29.620
だから､ 完璧なんです｡ 

05:29.740 --> 05:35.800
自動運転車もありますが､ どうしても昆虫に見えてしまうんです｡ 

05:35.980 --> 05:40.480
クルマが自信なさげなんですよね､ 動きが｡ 

05:40.480 --> 05:42.520
右往左往しているような感じです｡ 

05:42.520 --> 05:44.500
車の動きには見えませんね｡ 

05:44.500 --> 05:45.940
どちらかというと､ バグに近い印象です｡ 

05:46.210 --> 05:47.710
だから､ それを解決するんです｡ 

05:47.710 --> 05:52.570
そして､ ご想像の通り､ それを解決する方法は温度を上げることです｡ 

05:52.570 --> 06:00.430
なぜなら､ 温度はソフトマック機能のパラメータで､ アクションがより確実に返されるように増やすことができることを覚えているからです｡

06:00.610 --> 06:05.200
そうすると､ 温度を上げれば､ まあ､ AIがどのアクションをすべきか確信を持つようになるので､

06:05.200 --> 06:09.610
より確かなクルマを手に入れることができるかもしれないというのは､ 理にかなっていますね｡

06:10.000 --> 06:15.070
そしてそれは､ より高い確率でアクションが再生されるからであることを忘れてはならない｡ 

06:15.100 --> 06:20.740
この温度を上げることの唯一の問題は､ 温度を上げることによって､ 他の行動が低確率になるので､

06:20.740 --> 06:26.020
AIが他の行動を探索することが少なくなることを覚えていることです｡

06:26.140 --> 06:33.820
でも､ 今は問題ないようです｡ 都心の空港でも問題なく目的地に到着しているようです｡

06:33.820 --> 06:36.910
だから､ 温度を上げようと思えば全然上げられるんです｡ 

06:36.910 --> 06:40.930
今までは昆虫のように見えていたものが､ 車のように見える｡ 

06:41.140 --> 06:42.400
では､ こうしてみましょう｡ 

06:42.400 --> 06:44.800
これにて終了とさせていただきます｡ 

06:45.370 --> 06:46.180
これでよしとしよう｡ 

06:46.180 --> 06:48.280
再度カーネルを再起動する｡ 

06:49.300 --> 06:49.750
そして､ プレス｡ 

06:49.750 --> 06:50.350
はい｡ 

06:50.530 --> 06:52.690
そして､ 今度は温度を上げる｡ 

06:52.990 --> 06:53.950
では､ こうしてみましょう｡ 

06:53.950 --> 06:56.290
自分のファイルに戻る

06:56.290 --> 06:59.980
そして､ このtイコール7を100で置き換えてください｡ 

07:01.200 --> 07:02.090
これでよしとしよう｡ 

07:02.100 --> 07:03.240
そして､ 保存するのです｡ 

07:03.450 --> 07:06.270
そして今､ 自動運転車が誕生した｡ 

07:06.270 --> 07:07.590
自分自身に確信を持って｡ 

07:07.590 --> 07:11.850
だから､ より良い結果が得られるかもしれないし､ よりクルマらしいものができるかもしれない｡ 

07:11.880 --> 07:15.630
では､ 地図をクリックして､ もう一度実行してみましょう｡ 

07:16.480 --> 07:17.270
わかりました｡ 

07:17.290 --> 07:18.830
何があったんですか？

07:18.930 --> 07:21.190
オッ､ なんかやけくそになった｡ 

07:21.220 --> 07:25.850
なぜかはわかりませんが､ とにかく今は､ よりクルマに近いものができています｡ 

07:25.870 --> 07:28.090
よりまっすぐに進んでいるのがわかると思います｡ 

07:28.120 --> 07:30.960
左右に素早く動くわけではありません｡ 

07:30.970 --> 07:35.620
それは､ その都度､ クルマが進むべき方向性をより確実に把握できるようになったからです｡ 

07:35.860 --> 07:40.600
空港に行き､ ダウンタウンに行くという最適な方向性を取りたいのです｡ 

07:40.750 --> 07:44.260
ですから､ 明らかにレベル1に合格していると言えます｡ 

07:44.290 --> 07:47.770
この車は空港とダウンタウンを往復しているのです｡ 

07:47.770 --> 07:49.330
だから､ それを保存しておくのです｡ 

07:49.630 --> 07:52.370
それは......脳を救う方法を教えてあげることです｡ 

07:52.390 --> 07:54.760
あとは､ この保存ボタンをクリックするだけです｡ 

07:54.880 --> 07:56.770
そして､ もし私たちが

07:58.340 --> 07:59.450
ここで起こることを見てください｡ 

07:59.450 --> 08:02.300
さて､ 冒頭の報酬のカーブがあります｡ 

08:02.300 --> 08:04.570
その中で､ いくつかの失敗を観察することができます｡ 

08:04.580 --> 08:06.920
そこで､ 報酬がマイナスになるわけです｡ 

08:06.920 --> 08:16.610
しかし､ その後､ 失敗から学び､ 少しずつ報酬が増え､ 一定の正の報酬である0に到達した｡

08:16.610 --> 08:16.610
1.

08:16.610 --> 08:21.410
でも､ それは私たちが設定した最大限の報酬であり､ 探索に終始したからこその結果です｡ 

08:21.650 --> 08:23.420
それが探索の段階です｡ 

08:23.420 --> 08:25.910
そして､ 何をしなければならないかがわかったのです｡ 

08:25.910 --> 08:32.000
そこで､ 空港とダウンタウンを間違えなく往復していたのです｡ 

08:32.390 --> 08:33.350
そうそう､ そうなんです｡ 

08:33.350 --> 08:34.400
レベル1をクリアした｡ 

08:34.400 --> 08:35.600
おめでとうございます｡ 

08:35.630 --> 08:38.000
では､ もっと挑戦してみましょう｡ 

08:38.000 --> 08:39.860
次のレベルに持っていこう｡ 

08:39.860 --> 08:46.970
レベル2は､ 自分で描いた特定の道路を往復することを想定して､ 合格を目指そう｡

08:46.970 --> 08:49.010
では､ 次のチュートリアルでそれを確認してみましょう｡ 

08:49.010 --> 08:50.840
そしてそれまで､ iを楽しんでください｡ 
