WEBVTT

00:00.270 --> 00:02.970
Xin chào và chào mừng bạn trở lại khóa học về Học sâu.

00:02.970 --> 00:05.960
Vì vậy, chúng tôi đã học được khá nhiều điều trong phần này của khóa học.

00:05.970 --> 00:08.400
Hãy tóm tắt những gì chúng ta đã nói về.

00:08.400 --> 00:09.840
Được rồi, vậy chúng ta bắt đầu.

00:09.840 --> 00:16.170
Chúng tôi bắt đầu với một hình ảnh đầu vào mà chúng tôi đã áp dụng nhiều trình phát hiện đối tượng địa lý khác nhau hoặc còn được gọi là

00:16.170 --> 00:18.900
bộ lọc để tạo các bản đồ đối tượng địa lý này.

00:18.900 --> 00:21.330
Và điều này bao gồm lớp phức hợp của chúng ta.

00:21.330 --> 00:28.380
Sau đó, trên đầu lớp phức hợp đó, chúng tôi áp dụng đơn vị tuyến tính màu xanh lam hoặc chỉnh lưu để loại bỏ bất kỳ độ tuyến tính

00:28.380 --> 00:31.770
nào hoặc tăng độ không tuyến tính trong hình ảnh của chúng tôi.

00:31.770 --> 00:36.900
Sau đó, chúng tôi áp dụng một lớp tổng hợp cho lớp phức hợp của chúng tôi.

00:36.900 --> 00:44.880
Vì vậy, từ mỗi bản đồ đối tượng, chúng tôi đã tạo một bản đồ đối tượng tổng hợp và về cơ bản, lớp tổng hợp có rất

00:44.880 --> 00:45.810
nhiều lợi thế.

00:45.810 --> 00:54.630
Mục đích chính của lớp gộp là để đảm bảo rằng chúng ta có các bất biến không gian trong hình ảnh của mình.

00:54.630 --> 01:01.590
Vì vậy, về cơ bản nếu một cái gì đó nghiêng hoặc xoắn hoặc hơi khác so với kịch bản lý tưởng, thì chúng ta vẫn có thể

01:01.590 --> 01:02.850
chọn tính năng đó.

01:02.850 --> 01:11.280
Ngoài ra, việc gộp chung làm giảm đáng kể kích thước hình ảnh của chúng ta và việc gộp chung cũng giúp tránh bất kỳ loại trang bị quá nhiều dữ

01:11.280 --> 01:17.400
liệu hoặc mô hình của chúng ta vào dữ liệu, bởi vì nó chỉ đơn giản là loại bỏ rất nhiều dữ

01:17.400 --> 01:18.210
liệu đó.

01:18.210 --> 01:22.920
Nhưng đồng thời, việc gộp chung vẫn bảo toàn các tính năng chính mà chúng ta đang theo đuổi.

01:22.920 --> 01:26.580
Chỉ vì cách cấu trúc và cách tổng hợp chúng tôi sử dụng là tổng hợp tối đa.

01:26.670 --> 01:35.700
Sau đó, chúng tôi san phẳng tất cả các hình ảnh được gộp thành một vectơ hoặc cột dài của tất cả các giá trị này và chúng tôi nhập dữ

01:35.700 --> 01:38.070
liệu đó vào một mạng nơ-ron nhân tạo.

01:38.070 --> 01:40.050
Và đó là bước thứ ba làm phẳng.

01:40.050 --> 01:46.740
Và bước bốn là mạng nơ-ron nhân tạo được kết nối đầy đủ, nơi tất cả các tính năng này được xử lý thông

01:46.740 --> 01:47.520
qua mạng.

01:47.520 --> 01:54.510
Và sau đó chúng ta có lớp cuối cùng này, lớp được kết nối đầy đủ cuối cùng, thực hiện việc bỏ phiếu đối với các lớp mà

01:54.510 --> 01:55.980
chúng ta đang theo đuổi.

01:55.980 --> 02:02.820
Và sau đó tất cả những điều này được đào tạo thông qua quá trình lan truyền phía trước và quá trình truyền ngược và

02:02.820 --> 02:05.010
rất nhiều lần lặp lại và kỷ nguyên.

02:05.010 --> 02:09.480
Và cuối cùng, chúng ta có một mạng nơ-ron được xác định rất rõ ràng.

02:09.480 --> 02:13.710
Và một điều quan trọng khác là không chỉ các trọng số được huấn luyện

02:13.710 --> 02:21.090
trong phần mạng nơ-ron nhân tạo, mà cả các bộ phát hiện tính năng cũng được huấn luyện và điều chỉnh trong cùng một quá trình giảm độ

02:21.090 --> 02:21.720
dốc đó.

02:21.720 --> 02:23.850
Và điều đó cho phép chúng tôi đưa ra các bản đồ tính năng tốt nhất.

02:23.850 --> 02:31.020
Và cuối cùng, chúng tôi có được một mạng nơ-ron phức hợp được đào tạo đầy đủ có thể nhận dạng hình ảnh và phân loại

02:31.020 --> 02:31.470
chúng.

02:31.470 --> 02:32.310
Vậy là xong.

02:32.310 --> 02:35.370
Đó là cách hoạt động của mạng nơ-ron phức hợp.

02:35.460 --> 02:42.120
Và bây giờ bạn sẽ hoàn toàn thoải mái với khái niệm này và sẵn sàng để tiếp tục các ứng dụng thực tế.

02:42.120 --> 02:50.700
Nếu bạn muốn đọc thêm, thì có một blog tuyệt vời của Aditya Deshpande từ năm 2016.

02:51.330 --> 02:53.190
Bạn có thể xem liên kết ở đó ở phía dưới.

02:53.190 --> 02:55.890
Vì vậy, blog có tên là The Nine Deep Learning Papers.

02:55.890 --> 02:59.100
Bạn cần biết về việc hiểu Phần ba của CNN.

02:59.100 --> 03:04.800
Và blog này thực sự cung cấp cho bạn tổng quan ngắn về chín cảnh khác nhau đã được tạo

03:04.800 --> 03:10.530
ra bởi những người như Yann LeCun và những người khác, sau đó bạn có thể tiếp tục và nghiên cứu thêm.

03:10.530 --> 03:17.940
Vì vậy, sẽ có rất nhiều điều mới sẽ hoàn toàn mới đối với bạn và bạn sẽ phải xoay

03:17.940 --> 03:18.420
xở.

03:18.420 --> 03:22.440
Nhưng chỉ cần ghi nhớ blog này hoặc chín bài báo này trong tâm trí.

03:22.440 --> 03:27.240
Và ngay cả khi bạn chưa sẵn sàng để xem qua chúng ngay bây giờ, có thể sau các hướng

03:27.240 --> 03:33.210
dẫn thực hành, có thể sau khi bạn thực hiện một số đào tạo bổ sung trong không gian học sâu, từ từ sau đó bạn

03:33.210 --> 03:39.270
có thể tham khảo các tác phẩm này và lý tưởng nhất là tôi nghĩ bạn sẽ nhận được rất nhiều giá trị thông qua việc xem

03:39.270 --> 03:43.140
qua mạng nơ-ron của người khác và cách họ cấu trúc mạng phức hợp của mình.

03:43.140 --> 03:47.430
Và điều đó sẽ giúp bạn hiểu những phương pháp hay nhất là gì và tại sao mọi người lại làm những việc nhất định theo

03:47.430 --> 03:48.210
một cách nhất định.

03:48.210 --> 03:54.090
Và điều đó sẽ giúp bạn với kiến trúc của mạng nơ-ron, bởi vì mạng nơ-ron và mạng

03:54.090 --> 03:57.810
nơ-ron tích tụ trong không phải là một ngoại lệ.

03:57.810 --> 04:01.560
Chúng giống như một thách thức về kiến trúc.

04:01.560 --> 04:07.650
Bạn phải đưa ra ý tưởng và cấu trúc nó sau đó điều chỉnh và tinh chỉnh nó để có được thiết kế tốt

04:07.650 --> 04:11.340
nhất có thể và hiệu suất tốt nhất và tối ưu nhất có thể.

04:11.520 --> 04:12.420
Vậy là xong.

04:12.420 --> 04:13.320
Đó là chúng tôi của ngày hôm nay.

04:13.320 --> 04:17.580
Tôi hy vọng bạn thích hướng dẫn hôm nay và toàn bộ phần này và tôi mong được gặp bạn lần sau.

04:17.580 --> 04:19.530
Cho đến lúc đó, hãy tận hưởng việc học sâu.