WEBVTT

00:00.390 --> 00:02.720
Xin chào và chào mừng bạn trở lại khóa học về Học sâu.

00:02.730 --> 00:06.060
Hôm nay chúng ta cuối cùng đã ở bước số bốn, kết nối đầy đủ.

00:06.060 --> 00:08.110
Vì vậy, tất cả các bước này là gì?

00:08.130 --> 00:16.920
Chà, trong bước này, chúng tôi đang thêm toàn bộ mạng nơ-ron nhân tạo vào mạng nơ-ron tích tụ của chúng tôi.

00:16.920 --> 00:23.010
Vì vậy, đối với tất cả những thứ mà chúng tôi đã làm cho đến nay, đó là gộp chập và làm phẳng bây giờ chúng tôi

00:23.010 --> 00:24.780
đang thêm một thứ hoàn toàn mới.

00:24.810 --> 00:28.920
Và sau đó, ở mặt sau của điều đó, mức độ dữ dội như thế nào?

00:28.920 --> 00:32.310
Đó chỉ là đó là một cái gì đó chắc chắn là một cái gì đó.

00:32.310 --> 00:37.140
Và ở đây chúng ta có lớp đầu vào, lớp đầu ra mạng LAN được kết nối đầy đủ.

00:37.140 --> 00:42.960
Và nhân tiện, lớp được kết nối đầy đủ trong mạng nơ-ron nhân tạo, chúng tôi thường gọi chúng là các lớp ẩn và ở đây

00:42.960 --> 00:47.280
chúng tôi gọi chúng là các lớp được kết nối đầy đủ vì chúng là các lớp ẩn.

00:47.280 --> 00:52.740
Nhưng đồng thời chúng là một loại lớp ẩn cụ thể hơn, là lớp được kết nối đầy đủ trong

00:52.740 --> 00:54.060
mạng nơ-ron nhân tạo.

00:55.440 --> 00:59.910
Các lớp ẩn không nhất thiết phải được kết nối đầy đủ, trong khi trong mạng nơ-ron phức hợp, chúng ta sẽ

00:59.910 --> 01:05.400
sử dụng các lớp được kết nối đầy đủ và đó là lý do tại sao chúng thường được gọi là các lớp được kết nối đầy đủ.

01:05.490 --> 01:11.550
Và về cơ bản, toàn bộ cột hoặc vectơ đầu ra mà chúng ta có sau khi làm phẳng, chúng ta đang chuyển nó

01:11.550 --> 01:12.570
vào lớp đầu vào.

01:12.570 --> 01:20.310
Và ở đây chúng ta có một ví dụ rất đơn giản, chỉ nhằm mục đích minh họa và mục đích chính của mạng

01:20.310 --> 01:27.720
nơ-ron nhân tạo là gì, là kết hợp các tính năng của chúng ta thành nhiều thuộc tính hơn để dự đoán các

01:27.720 --> 01:28.890
lớp tốt hơn.

01:28.890 --> 01:37.800
Vì vậy, chúng tôi đã có vector kết quả đầu ra của chúng tôi ở độ phẳng và kết quả được làm phẳng từ những gì chúng tôi đã làm.

01:37.800 --> 01:44.010
Chúng tôi có một số tính năng được mã hóa bằng các con số trong vectơ đó và chúng có thể

01:44.010 --> 01:51.810
đã thực hiện khá tốt công việc dự đoán chúng ta đang xem lớp gì, cho dù đó là chó hay mèo, đó là khối u

01:51.810 --> 01:53.640
hay không, và như thế.

01:53.640 --> 01:59.310
Nhưng đồng thời, chúng ta biết rằng chúng ta có cấu trúc này được gọi là mạng

01:59.310 --> 02:07.290
nơ-ron nhân tạo, được thiết kế với mục đích xử lý các thuộc tính và xử lý các tính năng và tạo ra các

02:07.290 --> 02:15.690
thuộc tính mới và kết hợp các thuộc tính với nhau để đồng đều dự đoán tốt hơn những điều mà chúng tôi đang cố gắng

02:15.690 --> 02:16.620
dự đoán.

02:16.620 --> 02:18.600
Và chúng ta đã biết điều đó từ phần trước.

02:18.600 --> 02:20.160
Vậy tại sao không tận dụng điều đó?

02:20.160 --> 02:22.590
Và đó chính xác là kế hoạch ở đây.

02:22.590 --> 02:29.070
Vậy làm thế nào về việc chúng ta chuyển những giá trị đó vào một mạng nơ-ron nhân tạo và để nó tối ưu hóa hơn nữa mọi thứ mà

02:29.070 --> 02:30.180
chúng ta đang làm?

02:30.390 --> 02:31.800
Và đó là những gì chúng tôi sẽ làm.

02:31.800 --> 02:36.300
Nhưng hãy xem một ví dụ thực tế hơn vì ví dụ này hơi quá đơn giản.

02:36.300 --> 02:43.920
Vì vậy, ở đây chúng tôi có một mạng nơ-ron nhân tạo trông đẹp hơn, nơi chúng tôi có năm thuộc tính trên các đầu vào.

02:43.920 --> 02:50.970
Sau đó, chúng ta có trong lớp đầu tiên, chúng ta có sáu tế bào thần kinh trong lớp thứ hai hoặc trong lớp thứ hai được kết nối đầy đủ, chúng ta có tám

02:50.970 --> 02:55.320
tế bào thần kinh, và sau đó chúng ta có hai đầu ra, một cho chó và một cho mèo.

02:55.320 --> 03:02.130
Và một điều quan trọng cần nói ở đây là tại sao chúng ta lại có hai đầu ra?

03:02.130 --> 03:06.810
Chúng ta đã quen với việc chỉ có một đầu ra trong mạng nơ-ron nhân tạo của mình.

03:06.810 --> 03:13.830
Chà, một kết quả dành cho loại khi bạn dự đoán một giá trị số, khi bạn đang chạy một loại

03:13.830 --> 03:15.390
vấn đề hồi quy.

03:15.510 --> 03:22.680
Nhưng khi bạn đang phân loại, bạn cần một đầu ra cho mỗi lớp, ngoại trừ trường hợp ngoại lệ là khi bạn chỉ có hai lớp, giống như chúng ta có

03:22.680 --> 03:27.180
hai lớp ở đây, dog và cat và chúng ta có thể chỉ thực hiện một đầu ra và

03:27.180 --> 03:32.280
biến nó thành tệp nhị phân. đầu ra và cho biết một con là con chó và con số không là con mèo.

03:32.280 --> 03:33.990
Và điều đó sẽ hoạt động hoàn toàn tốt.

03:33.990 --> 03:38.700
Và trên thực tế, trên thực tế, bạn sẽ thấy cách thực hiện điều đó trong các hướng dẫn thực hành và đó là cách chúng được

03:38.730 --> 03:39.150
cấu trúc.

03:39.150 --> 03:45.720
Nhưng đồng thời, nếu bạn có nhiều hơn hai danh mục, chẳng hạn như chó, mèo và chim, thì bạn

03:45.720 --> 03:49.410
phải có một tế bào thần kinh cho mỗi danh mục.

03:49.410 --> 03:54.660
Và đó là lý do tại sao chúng ta sẽ thực hành với hai danh mục trong ví dụ này, để chúng ta biết

03:54.660 --> 03:57.780
điều gì sẽ xảy ra nếu chúng ta có nhiều hơn hai danh mục.

03:58.380 --> 03:59.940
Và điều gì sẽ xảy ra ở đây?

03:59.940 --> 04:04.590
Vì vậy, chúng tôi đã hoàn thành tất cả các bước cơ bản, chúng tôi đã thực hiện tích

04:04.590 --> 04:09.480
chập, chúng tôi đã thực hiện gộp và làm phẳng, và bây giờ thông tin sẽ đi qua mạng nơ-ron nhân tạo.

04:09.480 --> 04:11.970
Vì vậy, chúng ta hãy xem tất cả những điều đó xảy ra như thế nào.

04:12.030 --> 04:18.160
Có thông tin đi qua ngay từ đầu, từ thời điểm hình ảnh được xử lý, sau đó có thể được

04:18.160 --> 04:23.850
tham gia, sau đó gộp lại, làm phẳng và sau đó thông qua mạng nơ-ron nhân tạo, tất cả bốn

04:23.850 --> 04:24.420
bước.

04:24.960 --> 04:29.580
Và sau đó một dự đoán được đưa ra và chúng ta sẽ xem điều này xảy ra như thế nào trong giây lát.

04:29.580 --> 04:30.660
Nó sẽ rất, rất thú vị.

04:30.660 --> 04:32.820
Nhưng hiện tại, hãy nói rằng một dự đoán đã được đưa ra.

04:32.820 --> 04:40.470
Và ví dụ, 80% rằng đó là một con chó, nhưng nó lại là một con mèo và sau đó một lỗi được tính toán thành

04:40.470 --> 04:47.700
một giếng, cái mà chúng ta thường gọi là hàm chi phí trong mạng nơ-ron nhân tạo và chúng ta sử dụng lỗi bình

04:47.700 --> 04:51.240
phương trung bình ở đó hoặc trong mạng nơ-ron phức hợp.

04:51.240 --> 04:58.470
Nó được gọi là một hàm mất mát và chúng tôi sử dụng một hàm entropy chéo cho điều đó và chúng ta sẽ nói về entropy chéo và

04:58.470 --> 04:59.820
lỗi bình phương trung bình.

04:59.990 --> 05:02.660
Trong một hướng dẫn riêng và cách tất cả những điều đó xảy ra.

05:02.660 --> 05:08.240
Nhưng hiện tại, giả sử chúng ta có một loại chức năng bị mất cho chúng ta biết mạng của chúng ta đang hoạt động tốt như thế nào

05:08.240 --> 05:13.460
và chúng ta đang cố gắng tối ưu hóa, tối ưu hóa nó hoặc giảm thiểu chức năng đó để tối ưu hóa mạng của chúng ta.

05:13.460 --> 05:18.870
Vì vậy, chúng tôi tính toán lỗi và sau đó nó được lan truyền trở lại qua mạng giống như chúng tôi đã

05:18.890 --> 05:21.500
có trong mạng nơ-ron nhân tạo được truyền ngược trở lại.

05:21.500 --> 05:27.800
Và một số thứ được điều chỉnh trong mạng để giúp tối ưu hóa hiệu suất.

05:27.800 --> 05:31.880
Và những thứ được điều chỉnh như bình thường là trọng số trong phần mạng nơ-ron nhân tạo.

05:31.880 --> 05:34.790
Vì vậy, các đường màu xanh lam mà bạn nhìn thấy ở đây, các khớp thần kinh.

05:35.120 --> 05:41.570
Sau đó, một thứ khác cũng được điều chỉnh là các bộ phát hiện tính năng.

05:41.570 --> 05:46.070
Vì vậy, chúng tôi biết rằng chúng tôi đang tìm kiếm các tính năng, nhưng nếu chúng tôi đang tìm kiếm các tính năng sai thì sao?

05:46.070 --> 05:47.960
Điều gì sẽ xảy ra nếu điều này không thành công?

05:47.960 --> 05:49.370
Vì các tính năng không chính xác.

05:49.370 --> 05:55.940
Và do đó, các công cụ phát hiện tính năng, những công cụ này ghi nhớ những ma trận nhỏ mà chúng tôi

05:55.940 --> 06:03.470
đã có ba ma trận ba, chúng được điều chỉnh để có thể lần sau sẽ tốt hơn và chúng ta hãy xem điều gì sẽ xảy

06:03.470 --> 06:03.800
ra.

06:03.800 --> 06:11.000
Và tất nhiên, tất cả đều được thực hiện với rất nhiều khoa học trong nền và rất nhiều toán học và tất cả đều được thực

06:11.000 --> 06:14.480
hiện thông qua một gradient, gradient descent với sự lan truyền ngược.

06:14.480 --> 06:17.870
Vì vậy, tất cả không chỉ là những nhiễu loạn ngẫu nhiên.

06:17.870 --> 06:20.780
Nó thực sự rất suy nghĩ về cách nó được thực hiện.

06:20.990 --> 06:27.560
Nhưng tuy nhiên, các bộ phát hiện tính năng được điều chỉnh, trọng lượng được điều chỉnh và toàn bộ quá trình này

06:27.560 --> 06:28.460
lại diễn ra.

06:28.550 --> 06:32.540
Và sau đó một lần nữa lỗi lại được lan truyền và điều này tiếp tục lặp đi lặp lại.

06:32.540 --> 06:35.060
Và đó là cách mạng của chúng tôi được tối ưu hóa.

06:35.060 --> 06:37.850
Đó là cách mạng của chúng tôi đào tạo trên dữ liệu.

06:37.850 --> 06:42.200
Vì vậy điều quan trọng quan trọng ở đây là dữ liệu đi qua toàn bộ

06:42.200 --> 06:45.950
mạng từ đầu đến cuối, sau đó sai số được so sánh.

06:47.180 --> 06:49.880
Vì vậy, lỗi được tính toán và sau đó được lan truyền trở lại.

06:49.880 --> 06:56.450
Câu chuyện tương tự như với mạng nơ-ron nhân tạo chỉ lâu hơn một chút vì toàn bộ điều đó trong ba bước đầu tiên

06:56.450 --> 06:57.800
mà chúng ta đã có.

06:58.820 --> 07:02.450
Và bây giờ chúng ta hãy nhìn vào phần thú vị, phần thực sự thú vị.

07:02.450 --> 07:04.760
Hai lớp này hoạt động như thế nào?

07:04.760 --> 07:07.070
Vì hay hai nơ-ron đầu ra này hoạt động như thế nào?

07:07.070 --> 07:10.400
Bởi vì trước đây chúng ta luôn có một nơ-ron đầu ra.

07:10.400 --> 07:11.750
Điều gì xảy ra khi chúng ta có hai?

07:11.750 --> 07:17.420
Tình hình phân loại hình ảnh này diễn ra như thế nào?

07:17.420 --> 07:19.460
Vâng, hãy bắt đầu với nơ-ron trên cùng trước.

07:19.460 --> 07:21.350
Chúng ta sẽ bắt đầu với con chó.

07:21.890 --> 07:28.850
Mục đích chính của chúng ta như thế nào, điều chúng ta cần làm trước tiên là chúng ta cần hiểu khối lượng nào

07:28.850 --> 07:36.650
cần gán cho tất cả các khớp thần kinh này kết nối với con chó để chúng ta biết được neuron trước đó thực sự quan trọng đối

07:36.650 --> 07:37.760
với con chó.

07:37.760 --> 07:38.840
Và chúng ta hãy xem làm thế nào điều đó được thực hiện.

07:38.840 --> 07:46.250
Vì vậy, giả thuyết rằng, chúng ta có những con số này trong lớp trước của chúng ta, được kết nối đầy đủ trước đó trong lớp được kết

07:46.430 --> 07:47.870
nối đầy đủ cuối cùng.

07:47.870 --> 07:50.900
Và một lần nữa, những con số này hoàn toàn có thể là bất cứ điều gì.

07:50.900 --> 07:53.780
Chúng không nhất thiết phải là bất kỳ con số nào.

07:53.780 --> 08:00.740
Nhưng chỉ vì lý do tranh luận, chúng ta sẽ đồng ý rằng chúng ta đang xem xét cụ thể các con số từ

08:00.740 --> 08:01.730
0 đến 1.

08:02.210 --> 08:05.090
Vì vậy, chúng ta dễ dàng tranh luận và hiểu những điều này hơn.

08:05.450 --> 08:11.360
Và một điều có nghĩa là nơ-ron đó rất tự tin rằng nó đã tìm thấy một đặc điểm nào đó.

08:11.360 --> 08:15.980
Và số 0 sẽ có nghĩa là nơ-ron đó không tìm thấy một tính năng đang tìm kiếm.

08:15.980 --> 08:23.540
Vì vậy, bởi vì vào cuối ngày, những tế bào thần kinh này giống như bất kỳ thứ gì khác từ phía bên trái này chỉ nhìn vào các

08:23.540 --> 08:25.280
đặc điểm của một hình ảnh.

08:25.280 --> 08:30.500
Điều này đã được xử lý rất, rất nhiều, nhưng nó vẫn phát hiện một tính năng nhất định hoặc kết hợp

08:30.500 --> 08:31.970
các tính năng trên hình ảnh.

08:31.970 --> 08:36.860
Ngay trước khi thực hiện bước điều khiển, chúng ta đã có một số đặc điểm dễ nhận biết trong bước gộp.

08:36.860 --> 08:41.240
Chúng ít được nhận ra hơn, sau đó chúng thậm chí còn trở nên khó nhận biết hơn trong hình ảnh phẳng và sau đó chúng

08:41.240 --> 08:42.410
được kết hợp với nhau, v.v.

08:42.410 --> 08:48.140
Nhưng tuy nhiên, điều chúng ta đang nói ở đây, một số tính năng nhất định là hình ảnh hiện tại hoặc sự kết hợp

08:48.140 --> 08:48.650
của chúng.

08:48.650 --> 08:54.440
Vì vậy, một cái đang bị tạm dừng và cái này quan trọng sẽ được truyền cho cả chó và mèo cùng

08:54.440 --> 08:56.900
một lúc tới cả các nơ-ron đầu ra.

08:56.900 --> 09:05.030
Vì vậy, một có nghĩa là đối với chúng tôi, đối với lập luận của chúng tôi, nó có nghĩa là tế bào thần kinh này đang kích hoạt.

09:05.030 --> 09:08.360
Nó thực sự nhanh chóng phát hiện tính năng đó.

09:08.360 --> 09:10.100
Đó có thể là lông mày.

09:10.100 --> 09:15.080
Nó có thể phát hiện ra lông mày này một lần nữa, vì đơn giản, nó đang phát hiện ra lông mày này.

09:15.080 --> 09:17.300
Và nó đang giao tiếp điều đó với tế bào thần kinh của chó.

09:17.330 --> 09:20.270
Đối với thần kinh mèo mà nói, tôi có thể nhìn thấy lông mày của tôi, tôi có thể nhìn thấy lông mày của tôi.

09:20.270 --> 09:25.100
Và sau đó, tế bào thần kinh của chó và mèo phải hiểu điều đó có ý nghĩa gì đối với chúng.

09:25.100 --> 09:25.640
Đúng.

09:25.640 --> 09:28.370
Và trong trường hợp này, tế bào thần kinh nào đang kích hoạt?

09:28.370 --> 09:30.530
Ba tế bào thần kinh này đang bắn lên lông mày.

09:30.530 --> 09:36.020
Và giả sử cái mũi đang nói, tôi có thể thấy tôi có thể thấy một cái mũi to và tôi có thể thấy một đôi tai mềm.

09:36.020 --> 09:40.460
Vì vậy, nó đang nói điều đó với con chó và con mèo và sau đó là con chó.

09:40.460 --> 09:43.280
Và sau đó những gì xảy ra là chúng ta biết rằng đây là một con chó.

09:43.280 --> 09:49.880
Vì vậy, tế bào thần kinh của con chó biết rằng câu trả lời là nó thực sự là một con chó bởi vì cuối cùng chúng ta

09:49.880 --> 09:53.570
so sánh với hình ảnh hoặc nhãn trên bức tranh và nó biết con chó.

09:53.570 --> 09:58.610
Vì vậy, về cơ bản, tế bào thần kinh của chó sẽ nói, aha, vì vậy tôi nên được kích hoạt trong trường hợp này.

09:58.610 --> 09:59.540
Vì vậy, đây là.

09:59.650 --> 10:00.370
Tế bào thần kinh của tôi.

10:00.370 --> 10:06.190
Họ đang nói tín hiệu rằng họ đang gửi cho cả tôi, cho con chó và con mèo thực sự là một

10:06.190 --> 10:08.920
dấu hiệu cho tôi rằng đó là một con chó.

10:08.920 --> 10:13.540
Và trong suốt rất nhiều và rất nhiều và rất nhiều lần lặp đi lặp lại này, nếu điều này xảy

10:13.540 --> 10:19.450
ra nhiều lần, con chó sẽ biết rằng những tế bào thần kinh này thực sự kích hoạt khi tính năng đó thuộc về một con chó.

10:19.480 --> 10:24.100
Mặt khác, nơ-ron của mèo sẽ biết rằng đó không phải là mèo và nó sẽ biết rằng đặc điểm

10:24.100 --> 10:28.480
này đang kích hoạt và nơ-ron này nói với tôi rằng nó có thể nhìn thấy tai mềm, tai

10:28.480 --> 10:30.970
mềm, tai mềm, nhưng đồng thời thì không. con mèo.

10:30.970 --> 10:35.740
Vì vậy, về cơ bản đối với tôi đó là một tín hiệu mà tôi nên bỏ qua tế bào thần kinh này.

10:35.740 --> 10:40.960
Và điều đó càng xảy ra, tế bào thần kinh của mèo sẽ càng bỏ qua tế bào thần kinh này về đôi

10:40.960 --> 10:41.440
tai mềm.

10:42.160 --> 10:49.000
Và về cơ bản, đó là cách trải qua rất nhiều và rất nhiều lần lặp lại nếu điều này xảy ra thường xuyên.

10:49.000 --> 10:50.020
Vì vậy, đây chỉ là một ví dụ.

10:50.020 --> 10:54.370
Nhưng nếu điều này xảy ra thường xuyên, có thể là một, có thể là 0. 8, 0. 9, có lẽ đôi khi nó sẽ không cháy.

10:54.370 --> 10:59.410
Nhưng nhìn chung, trung bình, nơ-ron này rất thường xuyên sáng lên.

10:59.410 --> 11:05.830
Khi nó thực sự là một con chó, tế bào thần kinh của chó sẽ bắt đầu gán tầm quan trọng cao hơn cho tế bào thần kinh này.

11:05.830 --> 11:06.520
Và vậy là xong.

11:06.520 --> 11:08.290
Đó là cách chúng ta sẽ ký hiệu nó.

11:08.320 --> 11:14.200
Chúng ta sẽ nói rằng ba tế bào thần kinh này, thông qua quá trình lặp đi lặp lại này với rất nhiều, rất nhiều,

11:14.200 --> 11:16.810
rất nhiều mẫu và rất nhiều kỷ nguyên, hãy nhớ.

11:16.810 --> 11:22.630
Vì vậy, mẫu là một hàng trong tập dữ liệu của bạn và kỷ nguyên là khi bạn xem đi xem lại toàn bộ tập dữ liệu

11:22.630 --> 11:23.170
của mình.

11:23.170 --> 11:25.000
Có rất nhiều và rất nhiều lần lặp lại.

11:25.000 --> 11:34.090
Tế bào thần kinh của loài chó này đã học được rằng tế bào thần kinh lông mày này, tế bào thần kinh mũi to và tế bào thần

11:34.090 --> 11:42.970
kinh tai mềm này, tất cả chúng dường như thực sự đóng góp rất tốt vào việc phân loại thứ mà nó đang tìm kiếm và đâu là

11:42.970 --> 11:43.690
loài chó.

11:44.320 --> 11:45.520
Vì vậy, đó là cách nó hoạt động.

11:45.520 --> 11:55.060
Và một lần nữa, đôi tai, mũi và lông mày này, đó là những ví dụ rất, rất gần đúng hoặc giống như những ví dụ được tìm nạp rất xa

11:55.060 --> 12:01.570
bởi vì ở giai đoạn này, trong toàn bộ mạng nơ-ron tích chập này, nó hoàn toàn không thể nhận ra,

12:01.570 --> 12:03.490
những gì họ đang tìm kiếm.

12:03.490 --> 12:08.890
Nhưng đồng thời, nó là một cái gì đó trong các đặc điểm của chó, mèo hoặc bất cứ thứ gì bạn đang phân loại.

12:09.190 --> 12:11.140
Và sau đó chúng ta hãy chuyển sang phần tiếp theo.

12:11.140 --> 12:15.610
Bây giờ chúng ta sẽ xem xét tế bào thần kinh của mèo, nhưng chúng ta sẽ nhớ rằng những trọng lượng này là chúng

12:15.940 --> 12:17.830
mà chúng ta đã phân loại ra khỏi con chó.

12:17.830 --> 12:21.130
Vì vậy, con chó khá giống như bỏ qua tất cả các tế bào thần kinh khác.

12:21.130 --> 12:22.570
Một hai ba bốn năm.

12:22.570 --> 12:26.140
Nhưng nó thực sự chú ý đến những gì ba tế bào thần kinh này đang nói.

12:26.290 --> 12:28.240
Bây giờ, con mèo đang nghe gì?

12:28.240 --> 12:31.480
Chà, bất cứ khi nào nó thực sự là một con mèo, phải không.

12:32.500 --> 12:35.500
Đây là một ví dụ về một tình huống khi nó thực sự là một con mèo.

12:35.500 --> 12:42.460
Vì vậy, bạn sẽ thấy rằng ba tế bào thần kinh này, 0. 9, 0. 9 và một, họ đang nói điều gì đó.

12:42.460 --> 12:44.530
Họ đang nói điều gì đó với cả con chó và con mèo.

12:44.530 --> 12:45.730
Và điều này, một lần nữa, quan trọng cần nhớ.

12:45.730 --> 12:48.520
Vì vậy, tín hiệu đầu ra này đi theo cả hai cách.

12:48.520 --> 12:49.450
Nó giống nhau, phải không?

12:49.450 --> 12:54.190
Nó đang nói một người với con chó đang nói một người với con mèo, nhưng sau đó

12:54.190 --> 13:00.070
tùy thuộc vào con chó và con mèo để quyết định xem có tính đến tín hiệu đó và rút kinh nghiệm hay không.

13:00.280 --> 13:04.000
Và cả con chó và con mèo đều có thể nhận ra rằng đây là một bức ảnh.

13:04.030 --> 13:07.000
Lẽ ra, tôi nên đặt một bức ảnh của một con mèo ở đây, nhưng về cơ bản hãy tưởng tượng một bức ảnh của một con mèo.

13:07.000 --> 13:09.910
Cả con chó và con mèo đều có thể nhận ra rằng đây thực sự là một con mèo.

13:09.910 --> 13:18.970
Vì vậy, về cơ bản con chó giống như, Ồ, được rồi, vậy những chiếc râu này và đôi tai hình tam giác nhọn và kích thước nhỏ này,

13:18.970 --> 13:26.320
tôi đoán, hoặc ồ, có thể là kiểu này, bạn biết mèo có những thứ này như thế nào trong mắt không?

13:26.320 --> 13:28.240
Đôi mắt của họ giống như một chút.

13:28.240 --> 13:32.110
Chúng không phải là những vòng tròn, những đường thẳng của chúng hay những thứ tương tự.

13:32.110 --> 13:33.280
Giống như mắt mèo.

13:33.280 --> 13:37.390
Về cơ bản, đôi mắt mèo này, chúng chắc chắn không có tác dụng với tôi.

13:37.390 --> 13:42.880
Họ không giúp tôi dự đoán bởi vì mỗi khi những tế bào thần kinh này sáng lên, dự đoán không phải là những gì

13:42.910 --> 13:43.990
tôi đang tìm kiếm.

13:44.020 --> 13:46.810
Mặt khác, con mèo giống như, Hmm, điều đó thật thú vị.

13:46.810 --> 13:51.430
Mỗi khi cái này sáng lên, nó hoặc hầu hết thời gian nó sáng lên.

13:51.430 --> 13:53.800
Nó phù hợp với mong đợi của tôi.

13:53.800 --> 13:55.210
Nó phù hợp với những gì tôi đang tìm kiếm.

13:55.240 --> 13:55.540
Được chứ.

13:55.540 --> 13:57.970
Tôi sẽ lắng nghe anh chàng này nhiều hơn sau đó là điều này.

13:57.970 --> 13:58.870
Điều này, điều tương tự.

13:58.870 --> 14:01.840
Mỗi khi nó sáng lên hoặc hầu hết các lần nó sáng lên.

14:02.620 --> 14:09.040
Tôi tình cờ nhận được một điều tốt Tôi tình cờ được thưởng cho dự đoán của tôi bởi vì tôi làm đúng.

14:09.040 --> 14:09.670
Nó là con mèo.

14:09.670 --> 14:11.230
Được rồi, vì vậy tôi sẽ lắng nghe anh ấy nhiều hơn.

14:11.230 --> 14:16.060
Bạn biết đấy, điều này vô dụng với tôi bởi vì anh ấy thực sự không giống như anh ấy.

14:17.020 --> 14:17.980
Anh ấy thậm chí còn không sáng lên.

14:17.980 --> 14:19.870
Đó là một con mèo, nhưng nó không sáng lên.

14:19.870 --> 14:20.950
Vì vậy, điều ngược lại đang xảy ra.

14:20.950 --> 14:22.000
Và cả cái này nữa.

14:22.000 --> 14:23.410
Đó là một con mèo, nhưng nó không sáng lên.

14:23.410 --> 14:24.340
Vì vậy, tôi sẽ không nghe anh ta.

14:24.340 --> 14:27.520
Nhưng cái này, khi anh ấy khi nào đây là cái gì?

14:27.520 --> 14:27.940
Đôi mắt.

14:27.940 --> 14:29.350
Mắt mèo sáng lên.

14:29.590 --> 14:31.780
Chúng ta có thể thấy Tôi có thể thấy rằng đó là một con mèo.

14:31.780 --> 14:33.220
Nó phù hợp với hầu hết thời gian.

14:33.220 --> 14:38.650
Vì vậy, tôi sẽ học hỏi từ điều đó và tôi sẽ nghe ba người này thường xuyên hơn không.

14:38.650 --> 14:42.940
Và về cơ bản, con mèo đang nghe ba cái này và nó phớt lờ năm cái còn lại.

14:42.940 --> 14:53.620
Và đó là cách những tế bào thần kinh cuối cùng này học những tế bào thần kinh nào ở lớp cuối cùng, được kết nối đầy đủ để lắng nghe.

14:53.620 --> 14:58.330
Vì vậy, các tế bào thần kinh đầu ra học cái nào trong số các tế bào đầy đủ hoặc cái nào trong số các tế bào cuối cùng được kết nối hoàn toàn.

14:58.640 --> 14:59.990
Tế bào thần kinh của họ để lắng nghe.

14:59.990 --> 15:02.360
Và đó là cách họ hiểu.

15:02.720 --> 15:08.720
Về cơ bản, đó là cách các tính năng được truyền thông qua mạng và chuyển tải đến đầu ra.

15:08.720 --> 15:13.820
Và vì vậy, mặc dù những đặc điểm này, tất nhiên, không có nhiều ý nghĩa đối với

15:13.820 --> 15:21.050
chúng, như tai mềm hay râu, đồng thời, chúng có một số điểm đặc biệt, chúng là một đặc điểm nổi bật của lớp cụ

15:21.050 --> 15:21.770
thể đó.

15:21.770 --> 15:26.810
Và đó là cách mạng được đào tạo, bởi vì chúng tôi cũng ghi nhớ trong quá trình lan truyền ngược,

15:26.810 --> 15:29.660
chúng tôi cũng điều chỉnh các bộ phát hiện tính năng.

15:29.660 --> 15:36.410
Vì vậy, nếu một tính năng vô dụng đối với đầu ra, nó sẽ có thể bị bỏ qua vì điều này không xảy ra

15:36.410 --> 15:40.790
trong một hoặc hai ngày, nó chỉ xảy ra qua một nghìn hàng nghìn lần lặp.

15:40.790 --> 15:46.250
Vì vậy, theo thời gian, một tính năng vô dụng đối với mạng sẽ bị bỏ qua và thay thế bằng tính

15:46.250 --> 15:47.120
năng hữu ích.

15:47.120 --> 15:53.510
Và như vậy vào cuối ngày, trong lớp tế bào thần kinh cuối cùng này, bạn có thể có rất nhiều đặc

15:53.510 --> 16:00.080
điểm hoặc sự kết hợp các đặc điểm từ hình ảnh thực sự là đại diện hoặc mô tả về chó và

16:00.080 --> 16:00.620
mèo.

16:01.460 --> 16:06.560
Và sau đó khi mạng của bạn được đào tạo, thì đây là cách nó được áp dụng.

16:06.560 --> 16:08.540
Vì vậy, đây là bước tiếp theo, giống như chúng tôi đã đào tạo về nó.

16:08.540 --> 16:12.950
Vì vậy, chúng ta hãy xem điều gì sẽ xảy ra khi mạng này được áp dụng.

16:12.950 --> 16:15.170
Vì vậy, giả sử chúng ta truyền lại một hình ảnh của một con chó.

16:16.280 --> 16:20.300
Các giá trị được truyền qua mạng, chúng tôi nhận được các giá trị nhất định.

16:20.300 --> 16:24.860
Và vì vậy lần này tế bào thần kinh của chó và mèo không biết.

16:24.860 --> 16:26.660
Họ không có hình ảnh của con chó ở đây.

16:26.660 --> 16:28.370
Họ không biết rằng đó là một con chó hay một con mèo.

16:28.370 --> 16:35.570
Họ không biết nó là gì, nhưng họ đã học cách lắng nghe những gì được trình bày ở đây, phải không?

16:35.570 --> 16:39.980
Chúng đã học cách lắng nghe nơ-ron con chó, nghe ba nơ-ron này, nơ-ron mèo lắng nghe ba

16:39.980 --> 16:40.670
nơ-ron này.

16:40.670 --> 16:44.690
Và vì vậy tế bào thần kinh của chó nhìn vào 1 đến 3 và nói, Aha, chúng khá cao.

16:44.690 --> 16:47.570
Vì vậy, khả năng cao đó là một con chó.

16:47.600 --> 16:52.550
Con mèo thần kinh nhìn ba cái này và nói, được rồi, cái này, cái này khá cao, nhưng cái

16:52.550 --> 16:53.450
này khá thấp.

16:53.450 --> 16:54.230
Thú vị.

16:54.230 --> 16:56.870
Vì vậy, xác suất của tôi sẽ là 0. 05.

16:56.870 --> 17:00.020
Và sau đó và đó và đó là nơi bạn nhận được dự đoán của mình.

17:00.020 --> 17:05.600
Vì vậy, lựa chọn đầu tiên của bạn cho mạng nơ-ron này là chó, lựa chọn thứ hai là mèo.

17:05.600 --> 17:06.830
Và đó là khá nhiều.

17:06.830 --> 17:08.030
Vì vậy, câu trả lời là con chó.

17:08.150 --> 17:14.780
Và điều tương tự cũng xảy ra khi bạn chuyển qua hình ảnh một con mèo, bạn nhận được các giá trị mới và bạn có thể thấy rằng mặc dù giá trị

17:14.780 --> 17:16.520
này cao nhưng giá trị này lại thấp.

17:16.520 --> 17:20.450
Và đối với con mèo, con này cao hơn, con này cao và con này hơi thấp.

17:20.450 --> 17:23.870
Vì vậy, xác suất ở đây có thể không lớn như trước đây.

17:23.870 --> 17:26.720
Nhưng bạn vẫn có thể thấy rằng đó là một con mèo của 79%.

17:26.720 --> 17:30.080
Và do đó, mạng lưới thần kinh sẽ bỏ phiếu rằng đó là một con mèo.

17:30.080 --> 17:33.140
Và về cơ bản, tất cả mạng nơ-ron sẽ kết luận rằng đó là một con mèo.

17:33.140 --> 17:36.230
Bỏ phiếu là một thuật ngữ được sử dụng cho những người này.

17:36.230 --> 17:42.650
Vì vậy, những tế bào thần kinh này trong lớp được kết nối đầy đủ cuối cùng, chúng được biểu quyết và đây là những biểu quyết của chúng.

17:42.650 --> 17:47.120
Và một lần nữa, chúng tôi chỉ vì lợi ích của đối số, đặt các giá trị từ 0 đến 1 ở đây.

17:47.120 --> 17:54.110
Đây có thể là bất kỳ giá trị nào, nhưng họ có quyền bỏ phiếu và sau đó những trọng số này là tầm quan trọng của lá phiếu của

17:54.110 --> 17:54.410
họ.

17:54.410 --> 18:00.470
Vì vậy, đây là những quả cân màu tím này là cách nơ-ron của chó xem phiếu bầu của chúng.

18:00.470 --> 18:04.730
Mức độ quan trọng mà nó gán cho những tế bào thần kinh này và những phiếu bầu đó?

18:04.730 --> 18:12.650
Và đây là mức độ quan trọng mà tế bào thần kinh mèo gán cho chúng đối với các phiếu bầu của các tế bào thần kinh này.

18:12.650 --> 18:16.580
Và do đó, những tế bào thần kinh này bầu chọn con chó và con mèo dựa trên trọng lượng đã học của chúng.

18:16.580 --> 18:20.840
Họ quyết định nghe ai và sau đó họ đưa ra dự đoán của họ và sau đó nắm giữ.

18:20.840 --> 18:24.350
Mạng lưới thần kinh kết luận rằng đây là, trong trường hợp này, là một con mèo.

18:24.350 --> 18:26.870
Và sau đó và sau đó là kết luận của bạn.

18:26.870 --> 18:34.700
Và đó là cách bạn có được những hình ảnh như thế này, nơi bạn có một con báo gêpa và sau đó bạn có một lớp

18:34.700 --> 18:36.740
báo gêpa với xác suất rất cao.

18:36.740 --> 18:39.830
Vì vậy, đây là xác suất mà nhà mạng đã dự đoán.

18:39.830 --> 18:43.880
Và đây là những mức thấp, nhưng chúng vẫn tồn tại bởi vì chúng vẫn giống như một cơ hội nhỏ.

18:43.880 --> 18:48.740
Các tế bào thần kinh khác cũng đang lắng nghe cử tri của họ và họ nói, Ồ, có lẽ đó thực sự là một

18:48.740 --> 18:49.220
con báo.

18:49.220 --> 18:51.600
Và tàu cao tốc rất, rất có thể xảy ra ở đây.

18:51.650 --> 18:57.440
Scissors, bạn biết đấy, cái này, một nút pangloss đã ở rất gần thứ hai và sau đó là ống nghe bởi

18:57.440 --> 19:03.020
vì bạn có thể nhìn thấy như những người này, nơ-ron này, nơ-ron kéo, đầu ra, nơ-ron này lắng nghe

19:03.020 --> 19:09.350
cử tri của nó và nó có tỷ lệ bỏ phiếu chiếm ưu thế. , nhưng sau đó bóng tay cũng có kết quả

19:09.350 --> 19:09.740
tốt.

19:09.980 --> 19:10.760
Vậy là xong.

19:10.760 --> 19:14.390
Đó là cách hoạt động của kết nối đầy đủ và đây là cách thức hoạt động.

19:14.390 --> 19:16.400
Tất cả điều này diễn ra cùng nhau.

19:16.400 --> 19:18.620
Tôi hy vọng bạn thích hướng dẫn ngày hôm nay.

19:18.620 --> 19:22.730
Chúng tôi cũng sẽ tóm tắt tất cả những điều này trong phần tóm tắt và hẹn gặp lại bạn vào lần sau.

19:22.730 --> 19:24.800
Cho đến lúc đó, hãy tận hưởng việc học sâu.
