WEBVTT

00:00.240 --> 00:02.460
大家好, 欢迎学习本教程｡ 

00:02.490 --> 00:07.800
好了, 现在是时候构建我们的第一个人工智能了, 因为现在我们只制作了人工智能类的说明手册,

00:07.800 --> 00:12.090
但我们还没有创建任何对象｡

00:12.090 --> 00:17.490
所以我们还没有真实的的人工智能, 但我们马上就要得到它了,

00:17.490 --> 00:20.220
因为我们要创建一个人工智能类的对象｡

00:20.220 --> 00:25.260
而这个物体将只不过是一个拥有大脑和身体的AI｡ 

00:25.650 --> 00:25.980
好吧, 我会的

00:25.980 --> 00:26.960
所以我们开始吧｡ 

00:26.970 --> 00:32.340
现在我们已经用类定义了所有的东西, 实际上做起来非常简单｡ 

00:32.340 --> 00:38.550
所以基本上我们需要做的是首先创建一个大脑, 因为正如你所看到的, 当我们创建一个人工智能时, 我们需要输入一个大脑,

00:38.550 --> 00:42.180
但我们也输入一个身体｡

00:42.180 --> 00:44.040
所以我们也需要创造一个身体｡ 

00:44.040 --> 00:50.640
一旦我们创建了一个大脑对象和一个身体对象, 那么, 我们就可以创建人工智能了, 但不用担心,

00:50.670 --> 00:54.000
我们将在一个手电筒中创建大脑和身体｡

00:54.000 --> 00:55.620
事实上, 我们现在就开始吧｡ 

00:55.620 --> 00:57.000
让我们从大脑开始｡ 

00:57.000 --> 01:02.550
我们把大脑叫做CNN, 因为大脑是一个卷积神经网络,

01:02.550 --> 01:05.490
它是CNN类的一个对象｡

01:05.490 --> 01:07.470
所以叫它CNN是有道理的｡ 

01:07.590 --> 01:14.870
所以CNN等于, 然后我们上CNN的课, 我们在括号里输入, 根据你的说法｡ 

01:14.880 --> 01:20.460
现在, 当我们创建一个类的对象时, 我们需要输入的只是init函数的参数,

01:20.460 --> 01:25.710
也就是number操作.

01:25.710 --> 01:30.750
感谢我们之前所做的,

01:30.780 --> 01:37.920
在缩放环境中, 我们已经有了这个数字动作, 因此我们只需要在CNN类中输入数字动作｡

01:37.920 --> 01:38.790
好极了｡ 

01:38.790 --> 01:40.140
现在我们有大脑了｡ 

01:40.140 --> 01:42.030
现在让我们来做哥们儿｡ 

01:42.330 --> 01:47.370
我们将创建一个self max body类的对象, 我们将把这个对象命名为soft

01:47.370 --> 01:51.180
max body, 它将是我们的AI的主体｡

01:51.180 --> 01:59.970
这个对象是soft max buddy类的一个对象, 我们必须输入soft max body类的init函数的唯一参数,

01:59.970 --> 02:05.790
也就是温度t, 所以我们在这里输入t, 但是我们必须指定值,

02:05.910 --> 02:10.410
因为到目前为止, t只是一个参数｡

02:10.410 --> 02:11.760
所以t等于｡ 

02:11.760 --> 02:17.580
我们将从一个小温度开始, 但这可能会很好地工作｡ 

02:17.580 --> 02:20.340
事实上我已经知道这会很好地工作｡ 

02:20.340 --> 02:23.520
但是你可以试试其他的温度｡ 

02:23.520 --> 02:27.690
你现在知道它是怎么运作的了你的行动会更有把握｡ 

02:27.690 --> 02:32.730
也就是说, 与其它动作相比,

02:32.730 --> 02:38.250
具有最高Q值的动作将具有更高的被选择概率, 其它动作将具有更低的被选择概率, 因此将存在更少的探索｡

02:38.250 --> 02:40.500
但不管怎样, 我们可以从一个开始｡ 

02:40.560 --> 02:43.080
这会给我们一个好的身体｡ 

02:43.900 --> 02:44.410
好吧, 我会的

02:44.410 --> 02:49.300
现在我们有了大脑, 有了伙伴, 所以我想是时候进入决赛了｡ 

02:49.300 --> 02:50.610
我最终｡ 

02:50.620 --> 02:54.610
所以现在你会看到事情是如何变得如此简单｡ 

02:54.610 --> 02:56.860
这是直觉达到顶峰的时候｡ 

02:56.860 --> 03:03.850
要制造一个人工智能, 我们只需要创建一个对象, 我们称之为, 当然, 从我们的眼睛类｡ 

03:03.850 --> 03:10.180
因为眼睛是由大脑和身体组成的, 我们输入大脑,

03:10.180 --> 03:17.680
这是我们的卷积神经网络, 但物体和身体, 这不是别的, 只是软最大身体｡

03:18.700 --> 03:21.190
从soft Mack的body类中返回对象｡ 

03:21.190 --> 03:30.340
看, 我们在手电筒里建立了一个人工智能, 只需要输入大脑和身体, 现在我们有了一个人工智能, 可以接受训练｡

03:30.340 --> 03:38.740
所以现在是时候启动整个深度卷积学习过程了, 在10个步骤上重放资格跟踪的奖金｡

03:38.740 --> 03:43.660
最终, 一旦我们拥有了所有这些, 我们将训练人工智能使其变得聪明｡ 

03:43.750 --> 03:45.820
所以迫不及待地想这么做｡ 

03:45.820 --> 03:51.190
下一节将介绍如何设置体验回放,

03:51.190 --> 03:56.770
因此我们不会像自动驾驶汽车那样重新实现它, 因为好消息是我们已经实现了它｡

03:56.770 --> 03:57.880
所以这会很快｡ 

03:57.880 --> 04:03.280
我们将在这个体验重放文件中的重放内存类中创建一个对象｡ 

04:03.280 --> 04:09.550
所以这对我们帮助很大, 因此我们将迅速转移到新的和最重要的, 这是培训｡

04:09.760 --> 04:13.750
因此, 让我们在下一个教程中讨论这个问题, 在此之前, 好好享受I｡ 
