WEBVTT

00:00.330 --> 00:03.060
大家好, 欢迎回到人工智能课程｡ 

00:03.060 --> 00:08.130
在今天的章节中, 我们将讨论深度Q学习的话题｡ 

00:08.130 --> 00:10.110
让我们来看看我们要怎么解决这个问题｡ 

00:10.260 --> 00:15.000
在这一节中, 我们将学习一种深度学习直觉, 即事物的学习面｡ 

00:15.000 --> 00:20.730
所以我们要把深度学习背后的直觉分成两部分, 学习和行动｡

00:20.730 --> 00:22.500
我们会有两个教程｡ 

00:22.590 --> 00:28.230
首先, 我们将了解神经网络实际上是如何学习的, 它们是如何根据我们输入的信息来更新它们的权重的,

00:28.230 --> 00:33.750
以及学习的整个概念是如何工作的｡

00:33.750 --> 00:37.770
那么我们如何理解, 我们在简单学习中讨论的时间差概念呢？

00:37.770 --> 00:47.400
我们将把它们应用到深度学习中, 然后我们将讨论深度学习算法实际上是如何决定在什么状态下采取什么行动的｡

00:47.850 --> 00:52.680
然后我们将讨论经验, 在深度学习的基础上, 我们将讨论一个非常重要的补充,

00:52.950 --> 00:56.070
它实际上使深度学习能够正常工作｡

00:56.070 --> 00:58.020
从教程中您将了解它的重要性｡ 

00:58.020 --> 01:02.070
然后我们将讨论行动选择策略｡ 

01:02.340 --> 01:11.100
我们将讨论深度学习代理如何能够将探索与利用结合起来｡ 

01:11.100 --> 01:15.390
所以一旦他们发现了什么, 一个好的方法, 他们就可以使用这个方法, 但是他们也需要探索,

01:15.390 --> 01:18.210
这样他们就不会陷入局部最大值｡

01:18.630 --> 01:24.600
关于这一节, 我还想提一件事, 如果你看一下附录一, 人工神经网络,

01:24.600 --> 01:27.960
它是非常有益的｡

01:27.960 --> 01:34.290
所以如果你去探索所有这些主题, 我们会为你准备一些非常强大的直觉教程｡

01:34.560 --> 01:37.920
如果你还没有完成课程, 如果你还没有完成深度学习课程, 如果你已经完成了深度学习课程,

01:37.920 --> 01:41.280
那么你已经知道了所有这些东西, 你可以继续学习这一部分｡

01:41.280 --> 01:46.860
但是如果你想在学习这部分课程之前获得更多关于神经网络的知识, 这是非常明智的,

01:46.860 --> 01:51.510
因为这将帮助你确切地理解神经网络是如何工作的,

01:51.510 --> 01:58.110
为什么它们如此强大, 为什么我们在深度学习算法中利用它们｡

01:58.110 --> 02:03.060
一旦你更新了你的知识, 或者从附录中获得了关于神经网络的知识, 然后回到这里,

02:03.060 --> 02:06.420
我们将继续进行深度学习｡

02:06.420 --> 02:10.080
如果你对神经网络很熟悉, 那么让我们直接进入它｡ 

02:10.080 --> 02:15.360
让我们开始讨论深度学习直觉, 我期待着在第一个教程中见到你｡ 

02:15.360 --> 02:16.530
在那之前, 好好享受吧｡ 

02:16.530 --> 02:17.070
一､ 
