WEBVTT

00:00.180 --> 00:04.420
Xin chào và chào mừng bạn đến với cấp độ cuối cùng của thử thách xe tự lái.

00:04.440 --> 00:11.220
Vì vậy, lần này mục tiêu của tôi sẽ là đánh bại xe tự lái, không phải cấp độ bốn, bởi vì

00:11.220 --> 00:18.300
tôi muốn thách thức bạn cải thiện mã, cải thiện AI hoặc có thể cải thiện chiến lược để bạn có thể tự mình

00:18.300 --> 00:19.940
vượt qua thử thách này.

00:19.950 --> 00:27.750
Vì vậy, tôi sẽ làm một con đường rất phức tạp sẽ vẫn đi từ sân bay đến trung tâm thành phố, nhưng có

00:27.750 --> 00:30.990
thể quá phức tạp để ô tô tìm đường.

00:31.020 --> 00:36.060
Vì vậy, đó sẽ là thử thách của tôi, vì vậy tôi hy vọng bạn có thể vui vẻ với bài tập đầy thử thách.

00:36.270 --> 00:37.530
Vì vậy, chúng ta hãy làm điều này.

00:37.530 --> 00:40.970
Hãy tiếp cận cấp độ bốn này.

00:40.980 --> 00:46.200
Vì vậy, chúng ta hãy chọn tất cả mọi thứ, sau đó hãy tải não.

00:46.200 --> 00:47.340
Và chúng ta bắt đầu.

00:47.340 --> 00:52.980
Bây giờ nó đang thực hiện các chuyến đi khứ hồi giữa các sân bay và trung tâm thành phố, vì vậy sẽ mất một thời gian.

00:52.980 --> 00:55.200
Vì vậy, tôi sẽ bật một số bản nhạc.

00:55.200 --> 00:57.090
Và đây chúng ta cùng đi với con đường.

01:32.220 --> 01:33.260
Và chúng ta bắt đầu.

01:33.270 --> 01:34.350
Đây là con đường.

01:34.350 --> 01:37.940
Và có thể thấy, chiếc xe dường như gặp rất nhiều sự cố.

01:37.950 --> 01:39.840
Vì vậy, đó chính xác là những gì tôi muốn.

01:39.870 --> 01:45.380
Bạn biết đấy, thực hiện những chuyến đi vòng nhỏ này trên cùng một đoạn đường.

01:45.540 --> 01:46.590
Vì vậy, đó là một vấn đề.

01:46.590 --> 01:50.160
Bây giờ nó không tìm thấy đường đến trung tâm thành phố.

01:50.280 --> 01:52.200
Vì vậy, làm thế nào chúng ta có thể sửa chữa điều này?

01:52.200 --> 01:54.600
Chúng ta có cần thay đổi chiến lược không?

01:54.600 --> 02:00.810
Chúng ta có cần thay đổi các thông số của mạng lưới thần kinh đã thay đổi các khớp thần kinh trong bộ não của ô

02:00.810 --> 02:01.530
tô không?

02:01.800 --> 02:05.130
Chúng ta có cần phải làm gì đó với phần thưởng không?

02:05.130 --> 02:12.480
Bạn biết đấy, có thể nhận được phần thưởng tệ hơn khi nó không tìm thấy mục tiêu như hiện tại?

02:12.480 --> 02:13.560
Vì thế.

02:14.440 --> 02:15.370
Vì vậy, tôi không biết.

02:15.370 --> 02:17.410
Đó là để bạn tìm hiểu.

02:17.440 --> 02:23.950
Như bạn có thể thấy, phần thưởng không quá nghiêm trọng khi nó không tìm thấy mục tiêu, bạn biết đấy, và nó không tiến gần hơn

02:23.950 --> 02:28.900
đến mục tiêu, phần thưởng chỉ là trừ 0. 2.

02:28.900 --> 02:31.660
Vì vậy, đó không phải là một phần thưởng nặng nề.

02:31.690 --> 02:39.250
Bạn có thể cố gắng giảm phần thưởng xuống nhiều hơn như đặt phần thưởng bằng trừ 0. 5.

02:39.280 --> 02:40.520
Có lẽ điều đó sẽ hiệu quả.

02:40.540 --> 02:43.420
Tôi chỉ đưa ra một số gợi ý để giúp bạn.

02:43.660 --> 02:47.020
Vì vậy, đó là một thay đổi bạn có thể thực hiện với chiến lược phần thưởng.

02:47.030 --> 02:48.910
Và tất nhiên, bạn có thể thực hiện một số.

02:50.760 --> 02:53.700
Các thay đổi khác với mạng Newell của bạn.

02:53.700 --> 02:58.590
Vì vậy, trong phần này chúng ta tạo kiến trúc của Mạng Newell.

02:58.590 --> 03:02.820
Chúng tôi chọn có 30 nơ-ron ẩn trong một lớp ẩn.

03:02.910 --> 03:09.960
Có thể bạn có thể cố gắng thay đổi kiến trúc bằng cách thử thêm một số lớp hoặc một số nơ-ron ẩn hơn.

03:09.960 --> 03:10.680
Tôi không biết.

03:10.950 --> 03:13.560
Vì vậy, đó là một gợi ý khác để cải thiện.

03:13.560 --> 03:20.220
Và sau đó, bạn cũng có thể thử thay đổi điều gì đó trong thuật toán học sâu hoặc đơn giản là bạn có

03:20.220 --> 03:24.030
thể chuyển sang khóa học và tìm hiểu về các thuật toán khác.

03:24.030 --> 03:28.380
Có thể có một cái khác sẽ xoay sở để xử lý tình huống này.

03:28.620 --> 03:29.880
Vậy thì chúc may mắn.

03:29.880 --> 03:32.310
Tôi mong muốn được nhìn thấy các giải pháp của bạn.

03:32.310 --> 03:34.260
Cố gắng vẽ cùng một con đường.

03:34.260 --> 03:35.010
Thật hoàn hảo.

03:35.010 --> 03:37.410
Điều đó thực sự khá thú vị.

03:37.410 --> 03:38.040
Bí ẩn.

03:38.040 --> 03:44.910
Và nếu bạn muốn tôi đưa ra gợi ý hoặc nếu bạn muốn tôi giải thích nhanh vấn đề là gì, thì bạn có

03:44.910 --> 03:46.980
thể xem điều đó ngay tại đây.

03:46.980 --> 03:49.350
Khi nó đạt đến điểm đó, nó sẽ quay trở lại.

03:49.500 --> 03:54.450
Và đó là bởi vì khi đạt đến điểm đó, nó đang đi rất xa mục tiêu, nơi hiện tại là

03:54.450 --> 03:55.620
trung tâm thành phố.

03:55.620 --> 04:01.920
Bạn biết đấy, khi nó đạt đến điểm đó, nếu nó đi xa hơn, thì nó sẽ càng đi xa mục

04:01.920 --> 04:02.340
tiêu.

04:02.340 --> 04:04.500
Vì vậy, đó là lý do tại sao nó quay trở lại đây.

04:04.650 --> 04:12.420
Và vì vậy bạn phải thay đổi điều gì đó trong mã, điều gì đó trong chiến lược để có thể trừng phạt nó ít hơn

04:12.420 --> 04:14.580
khi nó ngày càng xa mục tiêu.

04:14.610 --> 04:15.930
Có lẽ đó là một giải pháp.

04:15.930 --> 04:17.850
Tôi chỉ đưa ra một số gợi ý.

04:17.850 --> 04:22.920
Tôi không muốn đưa ra giải pháp quá nhanh cho bạn, nhưng đó sẽ là một bài tập thực sự

04:22.920 --> 04:28.380
tốt và đó thường là vấn đề mà các kỹ sư có thể gặp phải khi họ chế tạo xe tự lái.

04:28.380 --> 04:32.880
Nhưng dù sao, tôi nghĩ đó là một bí ẩn khá thú vị, vì vậy tôi hy vọng bạn sẽ vui vẻ.

04:32.880 --> 04:39.000
Và trước khi giải bài tập này, có thể bạn có thể làm một bài tập khác rất hiệu quả, đơn giản là cố

04:39.000 --> 04:41.220
gắng thực hiện tất cả những điều này.

04:41.220 --> 04:44.100
Tôi một lần nữa, bạn biết đấy, chỉ cần thực hiện chính xác cùng một.

04:44.100 --> 04:48.630
Đó sẽ là một thực hành tuyệt vời bởi vì cho đến nay bạn chỉ nghe những lời giải thích của tôi.

04:48.630 --> 04:54.090
Nhưng có một sự khác biệt rất lớn giữa việc lắng nghe điều gì đó và cố gắng tự mình làm điều đó.

04:54.120 --> 04:55.370
Ồ ồ.

04:55.380 --> 04:56.550
Bạn có thấy chuyện gì đã xảy ra không?

04:56.580 --> 04:57.900
Nó chỉ tìm thấy con đường của nó.

04:57.900 --> 04:58.890
Thật đáng kinh ngạc.

04:59.190 --> 05:06.450
Thật buồn cười khi nó thoát khỏi nó, nhưng tôi chắc rằng có một chiến lược tốt hơn để thoát khỏi nó hiệu quả hơn.

05:06.660 --> 05:08.190
Và bây giờ nó có vẻ là khá tốt.

05:08.190 --> 05:10.290
Có lẽ tôi đang nói quá nhanh.

05:10.290 --> 05:11.640
Có lẽ nó sẽ giải quyết được điều này.

05:11.640 --> 05:12.570
Không, chúng ta bắt đầu.

05:12.570 --> 05:14.040
Nó lại bị kẹt ở đây.

05:14.040 --> 05:16.140
Đó là một thách thức khá lớn cho chiếc xe, phải không?

05:16.230 --> 05:18.270
Nhưng tôi chắc rằng điều này có thể được giải quyết.

05:18.570 --> 05:19.680
Đó là mục tiêu của bạn.

05:19.680 --> 05:20.700
Vậy thì chúc may mắn.

05:20.700 --> 05:23.400
Và xin vui lòng cho tôi biết về các giải pháp của bạn.

05:23.700 --> 05:24.990
Cho đến lúc đó, hãy tận hưởng.

05:24.990 --> 05:25.620
TÔI.
