WEBVTT

00:00.420 --> 00:02.850
好了, 精彩教程即将开始.

00:02.880 --> 00:04.740
欢迎回到深度学习课程｡ 

00:04.740 --> 00:07.800
今天我们要讨论的是神经网络是如何工作的？

00:07.830 --> 00:09.720
我们已经做了很多基础工作｡ 

00:09.720 --> 00:16.310
我们已经讨论了神经网络的结构, 它们由什么元素组成, 甚至它们的功能｡

00:16.320 --> 00:21.750
今天我们要看一个新的神经网络如何应用真实的实例子｡ 

00:21.750 --> 00:28.140
实际上, 我们将一步一步地完成它的应用过程, 这样我们就知道发生了什么｡

00:28.140 --> 00:29.160
让我们来看看｡ 

00:29.160 --> 00:30.650
我们要讨论什么样的例子呢？

00:30.660 --> 00:33.120
我们要看的是房产估价｡ 

00:33.120 --> 00:39.490
我们来看看一个神经网络, 它接受一些关于属性的参数, 然后给它赋值｡

00:39.510 --> 00:45.750
今天的教程有一个小小的警告, 那就是我们实际上并不打算训练网络｡

00:45.750 --> 00:49.290
所以神经网络中非常重要的一部分就是训练它们｡ 

00:49.290 --> 00:53.250
我们将在本节的下一节教程中讨论｡ 

00:53.250 --> 00:55.530
现在, 我们将重点关注实际应用｡ 

00:55.530 --> 01:01.980
所以我们要用一个神经网络来工作, 我们要假装它已经训练好了, 这样我们就可以把注意力集中在应用方面,

01:01.980 --> 01:07.710
而不是陷入训练方面｡

01:07.710 --> 01:11.520
然后, 当我们已经知道我们正在努力实现的最终目标时, 我们将结束培训｡ 

01:11.520 --> 01:12.450
听起来不错吧？

01:12.450 --> 01:13.050
好吧, 我会的

01:13.050 --> 01:14.670
让我们直接进入它｡ 

01:15.060 --> 01:19.260
假设我们有一些输入参数, 对吗？

01:19.260 --> 01:21.360
假设我们有四个关于属性的参数｡ 

01:21.360 --> 01:24.120
我们有平方英尺的面积｡ 

01:24.120 --> 01:29.730
我们有卧室的数量, 到城市的距离和最近的城市的英里数和财产的年龄｡

01:29.730 --> 01:33.450
所有这四个都将构成我们的输入层｡ 

01:33.450 --> 01:39.660
当然, 它们可能更多地是定义房产价格的参数｡ 

01:39.660 --> 01:45.330
但为了简单起见, 我们现在只看这四个最基本的形式｡ 

01:45.330 --> 01:49.980
神经网络在输出层中只有一个输入层, 因此没有隐藏层｡ 

01:49.980 --> 01:52.200
我们的输出层是我们预测的价格｡ 

01:52.200 --> 02:00.930
在这种形式下, 这些输入变量会被突触加权, 然后输出层会被计算, 或者基本上价格会被计算,

02:00.930 --> 02:06.120
我们会得到一个价格｡

02:06.120 --> 02:14.040
例如, 价格可以简单地计算为所有输入的加权和｡ 

02:14.040 --> 02:19.440
同样, 这里你可以使用我们现在使用的几乎任何函数,

02:19.440 --> 02:23.220
我们可以使用之前的任何激活函数｡

02:23.220 --> 02:29.130
你可以用逻辑回归, 你可以用平方函数｡ 

02:29.130 --> 02:30.840
你在这里几乎可以做任何事｡ 

02:30.960 --> 02:33.390
但关键是你得到了一定的输出｡ 

02:33.390 --> 02:40.920
此外, 大多数现有的机器学习算法都可以用这种格式表示｡ 

02:40.920 --> 02:45.240
这基本上是如何处理变量的图形表示｡ 

02:45.570 --> 02:50.940
通过改变公式的形式, 你可以完成很多我们之前讨论过的机器学习算法,

02:50.940 --> 02:55.350
并将它们转化为这种形式｡

02:55.350 --> 03:00.720
这就表明了新的神经网络是多么的强大, 即使没有隐藏层,

03:00.720 --> 03:05.250
我们已经有了一个适用于大多数其他机器学习算法的表示｡

03:05.250 --> 03:11.700
但在神经网络中, 我们拥有的是一个额外的优势, 它给了我们很大的灵活性和能力,

03:11.700 --> 03:16.800
这就是准确性提高的原因｡

03:16.800 --> 03:20.190
而那力量就是隐藏的层层｡ 

03:20.400 --> 03:21.990
好了

03:21.990 --> 03:22.830
这是我们的隐藏层｡ 

03:22.830 --> 03:29.970
我们已经添加了它, 现在我们将了解隐藏层如何为我们提供额外的功能｡ 

03:29.970 --> 03:34.020
事实上, 为了做到这一点, 我们将通过一个例子｡ 

03:34.020 --> 03:38.520
正如我们之前说好的, 这个神经网络已经训练好了, 现在我们要把它插进去｡ 

03:38.520 --> 03:44.160
假设我们要插入一个属性,

03:44.160 --> 03:51.840
我们要一步步地了解神经网络如何处理输入变量, 计算隐藏层, 然后计算输出层｡

03:51.840 --> 03:52.860
所以我们来看看这个｡ 

03:52.860 --> 03:54.300
一定会很刺激的｡ 

03:54.300 --> 03:54.810
好吧, 我会的

03:54.810 --> 04:01.230
左边有四个变量, 我们先从隐藏层的最上面的神经元开始｡

04:01.230 --> 04:07.230
现在, 正如我们在前面的教程中看到的, 输入层的所有神经元,

04:07.230 --> 04:12.750
都有突触连接, 每一个都连接到隐藏层的顶部神经元｡

04:13.260 --> 04:15.060
这些突触有权重｡ 

04:15.060 --> 04:18.780
现在, 让我们同意一些权重将具有非零值｡ 

04:18.780 --> 04:25.170
一些权重将具有零值, 因为基本上不是所有的输入都将有效或无效｡ 

04:25.170 --> 04:27.780
所有的输入对每一个神经元都很重要｡ 

04:27.780 --> 04:29.310
有时输入并不重要｡ 

04:29.310 --> 04:31.200
这里我们可以看到两个例子, 在x1处｡ 

04:31.200 --> 04:37.020
接下来的三个因素, 面积､ 到城市的距离和英里数对神经元很重要, 而卧室和年龄对神经元不重要｡

04:37.410 --> 04:38.670
让我们想一想｡ 

04:38.670 --> 04:39.180
为什么？

04:39.180 --> 04:40.440
怎么会这样呢？

04:40.590 --> 04:46.170
为什么某个神经元会与面积和距离联系在一起？

04:46.170 --> 04:47.280
这是什么意思？

04:47.280 --> 04:52.920
嗯, 这可能意味着通常你离城市越远, 真实的就越便宜,

04:52.920 --> 04:58.210
因此, 房地产的平方英尺空间就越大｡

04:58.210 --> 04:58.310
好吧, 我知道了

04:58.350 --> 04:59.970
所以同样的价格, 你可以得到一个更大的｡ 

05:00.030 --> 05:02.490
你离城市越远, 这是正常的, 对吗？

05:02.670 --> 05:03.450
有道理｡ 

05:03.450 --> 05:09.840
很可能这个神经元所做的是它看起来特别像一个狙击手｡ 

05:09.840 --> 05:17.550
它正在寻找的地区属性有哪些是不是远离城市, 但有一个大的面积｡ 

05:17.550 --> 05:24.750
所以对于他们离城市的距离来说, 他们有一个不公平的平方英尺面积｡ 

05:24.750 --> 05:25.010
好吧, 我知道了

05:25.020 --> 05:27.570
所以, 有些异常的东西, 它高于平均水平｡ 

05:27.570 --> 05:32.610
所以它们离城市很近, 但相对于同样距离的其他城市来说, 它们仍然很大｡

05:33.030 --> 05:38.520
所以这个神经元, 我们在这里再次推测, 这个神经元可能会选择激光, 选择那些特定的特性,

05:38.520 --> 05:43.950
然后它会激活, 从而激活激活功能

05:43.950 --> 05:46.950
只有在满足特定条件时它才会启动｡ 

05:46.950 --> 05:51.840
这是, 你知道, 距离和面积的探测, 距离城市和面积的财产｡

05:51.840 --> 05:57.300
它在自己的内部进行计算, 并将两者结合起来｡ 

05:57.300 --> 06:01.980
一旦某种恐怖主义活动爆发, 就会影响产出层的价格.

06:01.980 --> 06:07.620
因此, 这个神经元并不真正关心卧室和房子的年龄, 因为它专注于特定的事情｡

06:07.620 --> 06:14.040
这就是神经网络的力量来源, 因为你有很多这样的神经元, 我们刚才会看到其他神经元是如何工作的｡

06:14.040 --> 06:24.120
我想说的是, 我们不要画这些线来表示那些没有到位的突触, 这样我们就不会把图像弄得乱七八糟｡

06:24.120 --> 06:25.530
这是我们不画的唯一原因｡ 

06:25.530 --> 06:27.210
所以我们把这些也扔掉吧｡ 

06:27.210 --> 06:29.220
这样我们就能知道了｡ 

06:29.460 --> 06:33.750
所以这个神经元关注的是区域和到城市的距离｡ 

06:33.780 --> 06:34.290
好吧, 我会的

06:34.740 --> 06:36.810
既然我们都同意了, 那就继续下一个吧｡ 

06:36.810 --> 06:39.090
让我们来看看中间的那个｡ 

06:39.090 --> 06:42.030
我们有三个参数输入这个神经元｡ 

06:42.030 --> 06:45.630
所以我们有面积, 卧室和物业的年龄｡ 

06:45.750 --> 06:48.420
那么, 这其中的原因是什么呢？

06:48.420 --> 06:56.040
让我们再次, 让我们试着去理解神经元思维的直觉这个神经元是如何思维的？

06:56.040 --> 06:57.720
为什么要选择这三个参数？

06:57.750 --> 06:58.650
会是什么呢？

06:58.650 --> 07:02.040
有什么能像在资料中发现的那样命中？

07:02.040 --> 07:02.220
好吧, 我知道了

07:02.220 --> 07:04.530
我们已经建立了一个训练好的数据集｡ 

07:04.530 --> 07:09.360
训练发生在很久以前, 可能是一天前, 或者有人已经训练了这些数据｡

07:09.360 --> 07:14.160
所以现在我们只是在应用, 我们知道这个神经元,

07:14.160 --> 07:20.370
通过所有上千个属性的例子, 已经发现面积, 卧室, 年龄这些参数的组合是重要的｡

07:20.370 --> 07:21.540
为什么会这样呢？

07:21.540 --> 07:29.040
举个例子,

07:29.040 --> 07:43.110
也许在这个神经网络已经被训练好的郊区的某个城市, 也许有很多有两个或两个以上孩子的家庭, 他们正在寻找有很多卧室的大房子, 但这些房子是新的｡

07:43.110 --> 07:50.910
没错, 这些都不是老房子,

07:50.910 --> 07:55.530
因为在那个地区,

07:55.800 --> 08:03.270
大部分的房子都是老房子, 但是有很多现代家庭,

08:03.270 --> 08:11.700
也许社会人口结构发生了变化, 或者年轻人的就业和工作机会有了很大的增长, 也许就像人口结构发生了变化｡

08:11.700 --> 08:22.980
而现在年轻夫妇或年轻家庭正在寻找房产, 但他们更喜欢较新的房产, 所以他们希望房产的年龄更低｡

08:23.610 --> 08:28.800
因此, 从这个神经网络所经历的训练中, 它知道,

08:28.800 --> 08:34.770
当有一个大面积的房子, 有很多卧室, 至少有三个卧室给父母, 给第一个孩子｡

08:34.770 --> 08:40.830
对于第二个孩子来说, 至少有三间卧室, 也许是一间客房,

08:40.830 --> 08:45.900
当一个新的财产与一个高面积和大量的卧室是有价值的, 在该市场是有价值的｡

08:45.900 --> 08:48.210
所以神经元已经捕捉到了｡ 

08:48.210 --> 08:51.390
它知道这一点, 好吧, 这就是我要找的｡ 

08:51.390 --> 08:56.220
我不在乎城市的距离和英里数, 只要它有很大的面积, 很多的卧室,

08:56.250 --> 08:59.730
只要满足这个标准, 神经元就会兴奋起来｡

08:59.730 --> 09:03.870
这三个参数的组合,

09:03.870 --> 09:10.020
这就是神经网络的力量来源, 因为它把这三个参数组合成一个全新的参数,

09:10.020 --> 09:17.730
一个全新的属性, 帮助评估, 帮助评估财产｡

09:17.730 --> 09:21.300
它将它们组合成一个新的属性, 因此更加精确｡ 

09:21.690 --> 09:23.610
所以他们会去, 这就是神经元的工作原理｡ 

09:24.030 --> 09:25.500
让我们看另一个例子｡ 

09:25.500 --> 09:26.940
让我们看看最下面的一个｡ 

09:26.940 --> 09:31.830
例如, 这个神经元甚至可能只提取了一个参数｡ 

09:31.830 --> 09:35.430
它可能只是变老了, 而不是其他任何一个｡ 

09:35.430 --> 09:37.260
怎么会这样呢？

09:37.680 --> 09:47.640
这是一个典型的例子, 年龄意味着我们都知道, 老房子通常因为破旧而贬值.

09:47.640 --> 09:51.840
可能是建筑物太旧了, 可能是东西都快散架了, 需要更多的维护｡ 

09:51.840 --> 09:56.700
所以价格会随着真实的价格的下降而下降, 而一栋全新的建筑会更贵, 因为它是全新的,

09:56.700 --> 09:59.700
但是也许｡

09:59.800 --> 10:03.850
如果一处房产超过了一定的年限, 这可能表明它是一处历史性房产｡ 

10:03.850 --> 10:11.140
例如, 如果一个物业的历史在100年以下, 那么它的历史越长, 它的价值就越低｡ 

10:11.140 --> 10:15.790
但一旦它的年龄超过100岁, 突然之间, 它成为一个历史遗产｡ 

10:15.790 --> 10:20.700
因为这是几百年前人们居住的地方｡ 

10:20.710 --> 10:22.000
它讲述了一个故事｡ 

10:22.000 --> 10:24.010
它背后有着悠久的历史｡ 

10:24.010 --> 10:26.110
有些人喜欢这样, 有些人重视这样｡ 

10:26.110 --> 10:32.050
事实上, 很多人会喜欢这样, 并会为能住在这样的房子里而感到自豪,

10:32.050 --> 10:36.910
尤其是在社会经济地位较高的阶层, 他们会向朋友炫耀之类的东西｡

10:36.910 --> 10:42.220
因此, 超过100年历史的房产可以被视为历史性的｡ 

10:42.220 --> 10:47.050
因此, 这个神经元, 一旦它看到一个超过100年历史的房产, 它就会被激活,

10:47.050 --> 10:49.300
并对整体价格做出贡献｡

10:49.300 --> 10:52.750
否则, 如果不到100年, 那么它甚至不会工作｡ 

10:52.750 --> 10:57.490
这是应用整流器功能的一个很好的例子｡ 

10:57.490 --> 11:05.530
所以这里有一个非常像零的值, 直到某个点, 然后是100岁, 然后是100岁.

11:05.530 --> 11:11.230
它越老, 价值越高, 这个神经元对整体价格的贡献就越高｡

11:11.230 --> 11:18.010
这只是一个很好的例子, 一个非常简单的例子, 这个整流器功能的作用｡ 

11:18.610 --> 11:19.630
好了, 我们走吧｡ 

11:19.630 --> 11:20.860
可能是这个神经元｡ 

11:20.860 --> 11:27.760
而且, 神经网络甚至可以捕捉到我们自己都想不到的东西｡

11:27.760 --> 11:28.120
好吧, 我知道了

11:28.390 --> 11:30.090
例如, 卧室加上距离｡ 

11:30.110 --> 11:34.540
城市, 也许这是在某种程度上有助于价格的组合｡ 

11:34.540 --> 11:40.060
也许它不像其他神经元那么强大, 它也有贡献, 但它仍然有贡献, 或者它降低了价格.

11:40.060 --> 11:42.490
这也可能是这样的情况或其他类似的事情｡ 

11:42.490 --> 11:47.140
也许一个神经元把所有这四个参数组合起来｡ 

11:47.140 --> 11:54.880
如你所见, 这些神经元,

11:54.880 --> 12:04.150
这整个隐藏层的情况可以让你增加你的神经网络的灵活性, 让你真正地去寻找, 让神经网络去寻找非常具体的东西｡

12:04.150 --> 12:08.170
然后结合起来, 这就是力量的来源｡ 

12:08.170 --> 12:09.570
这就像蚂蚁的例子, 对吧？

12:09.580 --> 12:12.430
就像一只蚂蚁自己不能建造一个蚁丘｡ 

12:12.430 --> 12:16.840
但是当你有1000或100,000个加法时, 它们可以一起建造一个蚁丘｡ 

12:17.050 --> 12:18.540
这就是这里的情况｡ 

12:18.550 --> 12:25.990
这些神经元中的每一个本身都不能预测价格, 但它们合在一起就有了超能力, 可以预测价格｡

12:25.990 --> 12:30.010
如果训练得当, 设置得当, 他们可以做得相当准确｡ 

12:30.490 --> 12:35.200
这就是这门课要讲的, 如何利用它们｡ 

12:35.200 --> 12:35.650
我们走吧｡ 

12:35.650 --> 12:42.210
这是一个循序渐进的例子, 它演示了神经网络的工作原理｡ 

12:42.220 --> 12:45.490
我希望你喜欢今天的教程, 我迫不及待地想看到你下一次｡ 

12:45.490 --> 12:47.470
在此之前, 请尽情享受深度学习｡ 
