WEBVTT

00:01.720 --> 00:04.360
Xin chào và chào mừng bạn trở lại với khóa học về Học sâu ngày hôm nay.

00:04.360 --> 00:06.850
Chúng ta sẽ kết thúc với việc nhân giống ngược.

00:07.150 --> 00:07.480
Được rồi.

00:07.480 --> 00:11.950
Vì vậy, chúng ta đã biết khá nhiều thứ chúng ta cần biết về những gì xảy ra trong mạng nơ-ron.

00:11.950 --> 00:18.250
Chúng ta biết rằng có một quá trình được gọi là lan truyền chuyển tiếp trong đó thông tin được nhập vào lớp đầu vào và sau đó

00:18.250 --> 00:23.560
nó được truyền về phía trước để nhận được mũ y của chúng ta, các giá trị đầu ra của chúng ta.

00:23.560 --> 00:31.150
Và sau đó chúng tôi so sánh những giá trị đó với giá trị thực tế mà chúng tôi có trong tập huấn luyện của mình, sau đó chúng tôi tính toán các

00:31.150 --> 00:31.780
sai số.

00:31.780 --> 00:38.830
Sau đó, các lỗi được truyền ngược lại qua mạng theo hướng ngược lại, và điều đó cho phép chúng tôi đào tạo

00:38.830 --> 00:41.350
mạng bằng cách điều chỉnh trọng số.

00:41.350 --> 00:49.570
Vì vậy, một điều quan trọng cần nhớ ở đây là truyền ngược là một thuật toán nâng cao được điều

00:49.570 --> 00:59.470
khiển bởi toán học rất thú vị và phức tạp, cho phép chúng ta điều chỉnh trọng số, tất cả chúng cùng một lúc, tất cả trọng

00:59.470 --> 01:02.290
số đều được điều chỉnh đồng thời.

01:02.290 --> 01:08.890
Vì vậy, nếu chúng tôi đang thực hiện việc này theo cách thủ công hoặc nếu chúng tôi đưa ra một loại thuật toán khác, thì

01:08.890 --> 01:14.080
ngay cả khi chúng tôi đã tính toán lỗi và sau đó chúng tôi cố gắng hiểu ảnh hưởng

01:14.080 --> 01:20.860
của từng trọng số đối với lỗi, chúng tôi sẽ phải bằng cách nào đó điều chỉnh từng trọng số thành độc lập hoặc riêng lẻ.

01:21.900 --> 01:28.770
Lợi thế to lớn của lan truyền ngược và đây là điều quan trọng cần nhớ,

01:28.770 --> 01:35.910
đó là trong quá trình lan truyền ngược, đơn giản là do cách cấu trúc của thuật toán.

01:36.720 --> 01:43.080
Bạn có thể điều chỉnh tất cả các trọng số cùng một lúc, vì vậy về cơ bản bạn biết phần nào

01:43.080 --> 01:47.070
lỗi mà mỗi trọng số của bạn trong mạng nơ-ron chịu trách nhiệm.

01:47.100 --> 01:57.990
Bây giờ, đó là nguyên tắc cơ bản, quan trọng của việc lan truyền ngược, và đây là lý do tại sao nó được phát triển

01:57.990 --> 02:00.600
nhanh chóng vào những năm 1980.

02:00.600 --> 02:02.540
Và đây là bước đột phá lớn.

02:02.550 --> 02:08.370
Và nếu bạn muốn tìm hiểu thêm về điều đó và cách thức hoạt động chính xác của toán học trong

02:08.370 --> 02:14.700
nền, thì một bài báo hay, mà chúng tôi đã đề cập đến, là mạng nơ-ron và Học sâu thực sự là một cuốn

02:14.700 --> 02:22.080
sách của Michael Nielsen mà bạn ' Tôi sẽ tìm thấy toán học được viết ra và nó sẽ giúp bạn hiểu chính xác điều này có thể

02:22.080 --> 02:23.520
xảy ra như thế nào.

02:23.520 --> 02:29.970
Nhưng hiện tại, đối với mục đích của chúng tôi, nếu từ quan điểm trực giác, phần quan trọng là hãy

02:29.970 --> 02:33.210
nhớ rằng đó là những gì truyền ngược thực hiện.

02:33.210 --> 02:36.120
Nó điều chỉnh tất cả các trọng lượng cùng một lúc.

02:36.690 --> 02:43.230
Và bây giờ chúng ta sẽ tóm tắt mọi thứ bằng cách hướng dẫn từng bước về những gì xảy ra trong

02:43.230 --> 02:45.170
quá trình đào tạo mạng nơ-ron.

02:45.180 --> 02:45.570
Được rồi.

02:45.570 --> 02:50.790
Vì vậy, bước một, chúng tôi khởi tạo ngẫu nhiên các trọng số thành các số nhỏ gần bằng 0, nhưng không phải bằng không.

02:50.790 --> 02:56.550
Chúng tôi không thực sự tập trung vào việc khởi tạo các trọng số trong các bài hướng dẫn về trực giác,

02:56.550 --> 03:02.550
nhưng các trọng số phải bắt đầu từ đâu đó và chúng được khởi tạo với các giá trị ngẫu nhiên gần bằng không.

03:02.550 --> 03:08.100
Và từ đó thông qua quá trình bốn lan truyền, lan truyền ngược, các trọng số này được điều chỉnh cho

03:09.000 --> 03:13.320
đến khi sai số được giảm thiểu, cho đến khi hàm chi phí được giảm thiểu.

03:13.710 --> 03:17.560
Sau đó, bước hai nhập quan sát đầu tiên về các tập dữ liệu của bạn.

03:17.560 --> 03:21.390
Vì vậy, hàng đầu tiên vào lớp đầu vào, mỗi tính năng là một nút đầu vào.

03:21.390 --> 03:24.930
Vì vậy, về cơ bản lấy các cột và đặt chúng vào các nút đầu vào.

03:25.620 --> 03:30.720
Bước ba Đối với sự lan truyền từ trái sang phải, các tế bào thần kinh được kích hoạt theo cách mà tác động của mỗi lần kích

03:30.720 --> 03:32.760
hoạt tế bào thần kinh bị giới hạn bởi trọng lượng.

03:32.760 --> 03:39.780
Vì vậy, các trọng số về cơ bản xác định mức độ quan trọng của mỗi lần kích hoạt tế bào thần kinh, sau đó truyền các kích hoạt

03:39.780 --> 03:43.740
cho đến khi nhận được kết quả dự đoán y hat trong trường hợp này.

03:43.740 --> 03:46.590
Vì vậy, về cơ bản bạn tuyên truyền từ trái sang phải.

03:46.590 --> 03:49.890
Bạn đi tất cả các con đường cho đến khi bạn đến cuối và bạn nhận được chiếc mũ y của mình.

03:50.040 --> 03:55.950
Sau đó so sánh kết quả dự đoán với kết quả thực tế, đo lỗi được tạo ra, và sau đó bạn thực hiện lan truyền ngược

03:55.950 --> 03:58.560
từ phải sang trái, lỗi sẽ được lan truyền ngược lại.

03:58.560 --> 04:02.040
Cập nhật trọng số theo mức độ mà chúng chịu trách nhiệm cho lỗi.

04:02.040 --> 04:08.280
Một lần nữa, bạn có thể tính toán điều đó vì cách cấu trúc của thuật toán nhiễu loạn lan truyền ngược trở lại,

04:08.280 --> 04:12.570
tỷ lệ học tập quyết định bởi mức độ chúng tôi cập nhật các trọng số.

04:12.570 --> 04:17.160
Tốc độ học tập là thông số bạn có thể kiểm soát trong mạng nơ-ron của mình.

04:17.640 --> 04:22.830
Bước sáu Lặp lại các bước từ 1 đến 5 và cập nhật trọng lượng sau mỗi lần quan sát.

04:23.190 --> 04:24.810
Đó được gọi là học tăng cường.

04:24.810 --> 04:32.400
Và trong trường hợp của chúng tôi, đó là giảm độ dốc ngẫu nhiên hoặc lặp lại các bước từ 1 đến 5, nhưng chỉ cập nhật trọng số

04:32.400 --> 04:33.840
sau một đợt quan sát.

04:33.840 --> 04:39.990
Vì vậy, học theo lô, nó có thể là gốc gradient đầy đủ hoặc gốc gradient theo lô hoặc gốc chuyển màu theo

04:39.990 --> 04:40.710
lô nhỏ.

04:40.710 --> 04:45.930
Và bước bảy, khi toàn bộ tập huấn luyện đi qua mạng nơ-ron thần kinh nhân tạo khiến một

04:45.930 --> 04:48.930
kỷ nguyên được thực hiện lại nhiều kỷ nguyên hơn.

04:48.930 --> 04:54.810
Vì vậy, về cơ bản bạn chỉ cần tiếp tục làm điều đó và làm điều đó và làm điều đó và

04:54.810 --> 05:02.460
cho phép mạng thần kinh của bạn đào tạo ngày càng tốt hơn và tốt hơn và liên tục tự điều chỉnh khi bạn giảm thiểu hàm chi phí.

05:02.460 --> 05:03.870
Vậy là xong.

05:04.320 --> 05:09.720
Đó là những bước bạn cần làm để xây dựng mạng nơ-ron nhân tạo của mình và đào tạo nó.

05:09.720 --> 05:13.530
Và đây là những bước mà bạn sẽ thực hiện cùng nhau.

05:13.530 --> 05:18.570
Bạn đã học qua các bài hướng dẫn thực hành, chúc bạn gặp nhiều may mắn và tôi mong được gặp

05:18.570 --> 05:19.370
bạn lần sau.

05:19.380 --> 05:21.450
Cho đến lúc đó, hãy tận hưởng việc học sâu.
