WEBVTT

00:00.330 --> 00:03.060
こんにちは､ 人工知能のコースにようこそ｡ 

00:03.060 --> 00:08.130
今日のコーナーでは､ ディープQラーニングというテーマに取り組んでいます｡ 

00:08.130 --> 00:10.110
では､ どのように攻略していくかを見ていきましょう｡ 

00:10.260 --> 00:15.000
ここでは､ ディープラーニングの勘所である学習面を学びます｡ 

00:15.000 --> 00:20.730
そこで､ ディープラーニングを支える直感を､ 学習と演技の2つに分けて考えることにしました｡

00:20.730 --> 00:22.500
そして､ そのチュートリアルを2回行う予定です｡ 

00:22.590 --> 00:28.230
そこでまず､ ニューラルネットワークが実際にどのように学習するのか､ また､ 入力された内容に基づいてどのように重みを更新するのか､

00:28.230 --> 00:33.750
学習の全体的な仕組みを理解することにします｡

00:33.750 --> 00:37.770
では､ 単純な学習で議論する時間差の概念をどのように取り入れるか｡ 

00:37.770 --> 00:47.400
それらをディープラーニングに応用し､ 実際にディープラーニングのアルゴリズムが､ どのような状態でどのような行動を取るべきかを決定するのかについてお話します｡

00:47.850 --> 00:56.070
次に､ ディープラーニングの上に追加された非常に重要な機能であるリプレイについて説明します｡

00:56.070 --> 00:58.020
そして､ そのチュートリアルから､ なぜそれが重要なのかがわかるはずです｡ 

00:58.020 --> 01:02.070
そして､ 行動選択ポリシーについてです｡ 

01:02.340 --> 01:11.100
今回は､ 深層学習エージェントがどのように探索と利用を組み合わせているのかについてお話します｡ 

01:11.100 --> 01:18.210
そのため､ 何か良い方法を見つけたら､ その方法を使うだけでなく､ 局所的な最大値にはまらないように探索することも必要です｡

01:18.630 --> 01:24.600
そしてもう一つ､ このセクションで触れておきたいのは､ 別館の1番､ 人工ニューラルネットワークを見ていただくと､

01:24.600 --> 01:27.960
非常に有益だということです｡

01:27.960 --> 01:34.290
そのため､ これらのトピックを探索する場合､ 非常に強力な直感のチュートリアルが用意されているのです｡

01:34.560 --> 01:37.920
もちろんやっていない人は､ ディープラーニングコースをやっている人は､

01:37.920 --> 01:41.280
これらのことをすでに知っているので､ このセクションを進めてください｡

01:41.280 --> 01:46.860
ニューラルネットワークがどのように機能するのか､ なぜそれほど強力なのか､

01:46.860 --> 01:58.110
なぜこの深層学習アルゴリズムで活用しているのかを正確に理解するのに役立つからです｡

01:58.110 --> 02:03.060
そして､ その別館でニューラルネットワークの知識を再確認したり､ 知識を得たりしたら､ ここに戻ってきて､

02:03.060 --> 02:06.420
ディープラーニングを進めていきましょう｡

02:06.420 --> 02:10.080
もしあなたがニューラルネットワークにかなり慣れているのなら､ さっそくやってみましょう｡ 

02:10.080 --> 02:15.360
ディープラーニングの直感の話を始めましょう！第1回目のチュートリアルでお会いできるのを楽しみにしています｡ 

02:15.360 --> 02:16.530
それまではお楽しみに｡ 

02:16.530 --> 02:17.070
I.