WEBVTT

00:00.420 --> 00:01.260
Bạn đã sẵn sàng chưa?

00:01.290 --> 00:02.300
Làm thôi nào.

00:02.310 --> 00:05.970
Hãy bắt đầu bằng cách cài đặt tất cả các phụ thuộc hệ thống cho khôn ngoan.

00:06.000 --> 00:12.510
Hãy nhấp vào nút phát này và bây giờ nó sẽ cài đặt tất cả các phụ thuộc, như bạn có thể

00:12.510 --> 00:18.150
thấy, như gối hoặc psi, pi, và một số phụ thuộc khác sẽ cần thiết để chạy thành công.

00:18.150 --> 00:22.140
Nhưng tất cả những thứ còn lại như pytorch, các mô-đun phòng tập thể dục đã được cài đặt sẵn.

00:22.140 --> 00:23.070
Vì vậy, điều đó thực sự tuyệt vời.

00:23.070 --> 00:28.800
Đó thực sự là vẻ đẹp của Google CoLab và đó là nhờ nó mà không ai trong số các bạn sẽ gặp bất kỳ vấn đề

00:29.250 --> 00:32.040
nào khi thực thi mã và hình dung kết quả cuối cùng.

00:32.430 --> 00:32.760
Được rồi.

00:32.760 --> 00:35.250
Vì vậy, điều này sẽ thực sự mất một hoặc 2 phút.

00:35.250 --> 00:40.920
Vì vậy, tôi sẽ tua đi nhanh ở đây và tôi sẽ gặp bạn rất sớm trong phần còn lại của quá trình thực

00:40.920 --> 00:41.430
thi mã.

00:42.820 --> 00:43.420
Được rồi.

00:43.420 --> 00:46.240
Chúng ta dường như đã kết thúc quá trình cài đặt hệ thống.

00:46.240 --> 00:52.210
Các phụ thuộc, như bạn có thể thấy, đó là tải chúng xuống, cài đặt chúng trong khi thu thập chúng với tất cả

00:52.210 --> 00:53.680
các yêu cầu phù hợp.

00:53.680 --> 00:58.180
Và trong vài giây, nó sẽ được thực hiện đúng.

00:58.180 --> 00:59.800
Và chúng ta hãy xem.

00:59.800 --> 01:01.360
Ba hai.

01:01.360 --> 01:02.140
Chúng ta bắt đầu.

01:02.140 --> 01:03.910
Đã cài đặt thành công mọi thứ.

01:03.910 --> 01:05.260
Đừng lo lắng về những lỗi này ở đây.

01:05.260 --> 01:11.050
Chúng sẽ không ảnh hưởng đến việc thực thi mã, nhưng mọi thứ đều được cài đặt thành công như chúng ta muốn.

01:11.050 --> 01:13.450
Được rồi, bây giờ bước tiếp theo.

01:13.450 --> 01:14.770
Rất quan trọng.

01:14.800 --> 01:16.600
Nhìn vào nút quan trọng này.

01:16.600 --> 01:22.270
Nó nói rằng sau khi cài đặt tất cả các phụ thuộc, về cơ bản sau khi thực hiện ô đầu tiên này ở đây, bạn phải

01:22.270 --> 01:24.010
khởi động lại thời gian chạy của mình.

01:24.010 --> 01:26.560
Nếu không, bạn sẽ gặp một số lỗi thực thi ở đây.

01:26.560 --> 01:27.610
Vì vậy, chúng ta hãy làm điều đó nhanh chóng.

01:27.610 --> 01:28.390
Nó rất đơn giản.

01:28.390 --> 01:33.910
Bạn chỉ cần nhấp vào thời gian chạy ở đây và sau đó khởi động lại thời gian chạy và sau đó có, được rồi.

01:33.910 --> 01:35.500
Điều này sẽ khôi phục thời gian chạy của bạn.

01:35.500 --> 01:40.480
Và bây giờ bạn có thể thực hiện tất cả các ô này bằng cách chỉ cần nhấp vào nút phát.

01:40.480 --> 01:44.800
Vì vậy, hãy làm điều này, bắt đầu với việc xử lý trước hình ảnh tệp đầu tiên này.

01:44.830 --> 01:51.370
Được rồi, trước tiên chúng ta hãy nhập các thư viện, sau đó xử lý trước các hình ảnh bằng lớp

01:51.370 --> 01:58.570
hình ảnh xử lý trước và bây giờ chúng ta đã chuyển sang triển khai phát lại trải nghiệm có nghĩa là lớp này.

01:58.570 --> 02:00.340
Được rồi, hãy làm điều này.

02:00.340 --> 02:05.140
Đầu tiên chúng tôi nhập các thư viện, sau đó chúng tôi xác định một bước của môi trường.

02:05.170 --> 02:13.210
Sau đó, chúng tôi thực hiện tiến trình trên một số bước và từng bước với lớp Step Progress giống hệt như những gì chúng tôi

02:13.210 --> 02:14.770
có trong thư mục.

02:14.830 --> 02:20.500
Và sau đó chúng tôi thực hiện phát lại trải nghiệm bằng cách xây dựng lớp bộ nhớ phát lại này.

02:20.500 --> 02:21.940
Được rồi, tất cả đều tốt.

02:21.940 --> 02:30.160
Và bây giờ chúng ta chuyển sang tệp thứ ba, tệp này tôi làm cho tôi hoặc py và trước tiên chúng ta nhập các thư viện.

02:31.100 --> 02:31.940
Sau đó.

02:31.940 --> 02:32.240
Được rồi.

02:32.240 --> 02:37.280
Vì vậy, sẽ mất một chút thời gian ở đây vì chúng tôi nhập tất cả các mô-đun ngọn đuốc, sau đó chúng tôi

02:37.280 --> 02:38.820
nhập các gói cho openai và doom.

02:38.840 --> 02:41.990
Vì vậy, với phòng tập gym và Wisdom Gym và các rapper.

02:42.320 --> 02:43.310
Vì vậy, tất cả tốt.

02:43.310 --> 02:48.800
Và sau đó chúng ta chuyển sang phần một ở đây, xây dựng AI, nơi chúng ta sẽ tạo ra bộ não, sau đó

02:48.800 --> 02:51.380
là cơ thể, và sau đó lắp ráp mọi thứ.

02:51.380 --> 02:55.610
Vì vậy, trước tiên hãy làm cho bộ não trở nên ổn định với lớp CNN.

02:55.700 --> 03:04.580
Sau đó, hãy tạo cơ thể với lớp thân tối đa mềm, và sau đó hãy tạo AI với một lớp.

03:04.730 --> 03:05.210
Được rồi.

03:05.210 --> 03:06.260
Vì vậy, tất cả tốt.

03:06.260 --> 03:10.490
Và bây giờ chúng ta đã chuyển sang phần hai, nơi chúng ta sẽ đào tạo AI,

03:10.490 --> 03:12.350
tất nhiên là học sâu, phức hợp.

03:12.590 --> 03:12.950
Được rồi.

03:12.950 --> 03:15.200
Vì vậy, chính xác giống như những gì chúng ta có ở đây.

03:15.380 --> 03:19.130
Đầu tiên, chúng tôi có được môi trường diệt vong với các mô-đun mới của chúng tôi với Tomb.

03:19.130 --> 03:20.270
Đừng lo lắng về điều này.

03:20.270 --> 03:21.560
Đây không phải là một lỗi.

03:21.650 --> 03:27.620
Sau đó, chúng ta sẽ xây dựng AI bằng cách tạo ra các đối tượng khác nhau, bộ não, CNN, các cơ quan của cơ

03:27.620 --> 03:31.010
thể tối đa và toàn bộ AI chứa bộ não và cơ thể.

03:31.010 --> 03:31.430
Được rồi.

03:31.430 --> 03:32.300
Tôi đã thực hiện điều này?

03:32.300 --> 03:32.870
Đúng.

03:33.110 --> 03:39.800
Sau đó, chúng tôi thiết lập trải nghiệm, phát lại với và các bước và bộ nhớ như một bộ nhớ phát lại khách quan, sau

03:39.800 --> 03:42.950
đó chúng tôi triển khai theo dõi tính đủ điều kiện.

03:43.220 --> 03:43.730
Được rồi.

03:43.730 --> 03:45.320
Để cải thiện hiệu suất.

03:45.620 --> 03:50.120
Sau đó, chúng tôi tạo đường trung bình động trên 100 bước với lớp MA.

03:50.120 --> 03:52.490
Và cuối cùng, các bạn của tôi, bạn đã sẵn sàng chưa?

03:52.490 --> 03:57.260
Chà, đây là lúc, bạn biết đấy, phần rất thú vị mà chúng ta sẽ đào tạo AI trong

03:57.260 --> 03:58.520
hơn 20 kỷ nguyên.

03:58.520 --> 04:01.430
Được rồi, bạn sẽ thấy rằng quá trình này sẽ hơi lâu.

04:01.430 --> 04:05.780
Bạn biết đấy, có lẽ sẽ mất một hoặc 2 giờ vì tôi tăng kích thước.

04:05.780 --> 04:09.770
Vui lòng giảm kích thước trở lại 80 x 80 nếu bạn thấy nó quá dài.

04:09.770 --> 04:13.100
Nhưng tin tôi đi, bạn sẽ có những video hay hơn nhiều với những kích thước này.

04:13.910 --> 04:15.620
Vậy bạn đã sẵn sàng chưa?

04:15.620 --> 04:20.450
Hãy làm điều này trong ba, hai, một, bắt đầu.

04:20.450 --> 04:24.140
Được rồi, vì vậy điều này sẽ thực thi mã của khóa đào tạo.

04:24.140 --> 04:29.420
Và trong vài giây nữa, chúng ta sẽ có thể thấy kỷ nguyên đầu tiên, tất nhiên, kỷ nguyên này sẽ có phần

04:29.420 --> 04:30.020
thưởng âm.

04:30.020 --> 04:36.380
Nhưng bạn sẽ thấy rằng qua các kỷ nguyên, phần thưởng sẽ tăng lên từng chút một cho đến khi đạt được phần

04:36.380 --> 04:40.220
thưởng dương và sau đó cho đến khi đạt hàng trăm phần thưởng.

04:40.220 --> 04:42.230
Thực ra thì, hãy nhắm đến điều đó.

04:42.230 --> 04:48.920
Hãy hy vọng rằng với 20 kỷ nguyên, chúng tôi sẽ có một số phần thưởng cuối cùng ở mức hàng trăm, bạn biết đấy, như 100 hoặc

04:48.920 --> 04:53.240
200 hoặc 300, bởi vì với những phần thưởng này, tôi đã thực sự thử nghiệm chúng.

04:53.240 --> 04:53.450
Đúng.

04:53.450 --> 04:56.990
Kỷ nguyên đầu tiên, phần thưởng âm, -98.

04:56.990 --> 05:02.960
Vì vậy, tôi đã nói rằng với phần thưởng vào khoảng 100, 203 trăm, chúng tôi sẽ nhận được một số kết quả tuyệt vời.

05:02.960 --> 05:07.920
Bạn biết đấy, chúng ta sẽ thấy AI quản lý để tiêu diệt một số quái vật hoặc tránh chúng hoặc, bạn

05:07.970 --> 05:10.010
biết đấy, di chuyển về phía chiếc áo quan.

05:10.700 --> 05:14.360
Vì vậy, đó là kỷ nguyên đầu tiên, kỷ nguyên một -98.

05:14.360 --> 05:18.740
Và sau đó, bạn biết đấy, chúng ta sẽ thấy kỷ nguyên số hai với phần thưởng có thể đã tốt hơn.

05:18.740 --> 05:21.620
Tuy nhiên, bạn biết đấy, tất nhiên lúc đầu AI không được đào tạo.

05:21.620 --> 05:23.510
Nó đang khám phá môi trường.

05:23.510 --> 05:23.750
Đúng.

05:23.750 --> 05:28.610
Hãy nhớ sự đánh đổi này trong học tập củng cố, khám phá và khai thác?

05:28.610 --> 05:33.170
Chà, lúc đầu, AI chỉ đơn thuần là khám phá, sau đó nó sẽ đào tạo và sau đó nó sẽ

05:33.170 --> 05:37.850
trở nên thông minh hơn và thông minh hơn, và đó là lúc nó sẽ đạt được một số phần thưởng cao.

05:37.850 --> 05:41.000
Vì vậy, hoàn toàn ổn nếu có phần thưởng tiêu cực khi bắt đầu.

05:41.000 --> 05:46.700
Có thể chúng ta sẽ đạt được điều đó trong 3/1 kỷ nguyên, nhưng sau đó bạn sẽ thấy rằng sau kỷ nguyên số

05:46.700 --> 05:53.330
bốn hoặc năm hoặc sáu, chúng ta sẽ bắt đầu đạt được những phần thưởng có thể là tích cực và sau đó hy vọng phần thưởng vào khoảng

05:53.330 --> 05:54.380
102 trăm hoặc 300.

05:55.040 --> 05:57.560
Vì vậy, sẽ mất một chút thời gian, như tôi đã nói.

05:57.560 --> 06:02.510
Vì vậy, chúng ta sẽ không ở lại đây trong 2 giờ, nếu không tôi sẽ không còn điều gì để nói.

06:02.510 --> 06:08.030
Vì vậy, những gì tôi sẽ làm là bây giờ tôi sẽ bật một bản nhạc vui nhộn hoặc thú vị.

06:08.030 --> 06:10.790
Và chúng ta bắt đầu, kỷ nguyên số hai, -62.

06:10.820 --> 06:12.200
Vì vậy, đã có một số cải tiến.

06:12.200 --> 06:12.620
Tốt đấy.

06:12.620 --> 06:18.380
Nhưng bạn sẽ thấy rằng sẽ có một số cải tiến thậm chí còn tốt hơn khi chúng ta tiến bộ hơn trong các kỷ nguyên.

06:18.980 --> 06:20.030
Vì vậy, những gì tôi đã nói?

06:20.030 --> 06:25.460
Vâng, bây giờ tôi sẽ đặt một số bản nhạc thú vị và phát bài huấn luyện ở chế độ tăng tốc.

06:25.460 --> 06:30.350
Và tất nhiên, tôi sẽ gặp bạn vào cuối khóa đào tạo để xem kết quả cuối cùng.

06:30.350 --> 06:30.980
Được rồi.

06:30.980 --> 06:32.030
Vậy là xong.

06:32.030 --> 06:35.060
Ba hai một bắt đầu.

07:20.030 --> 07:20.810
Được rồi.

07:20.810 --> 07:22.610
Và đây là lúc chúng ta kết thúc khóa đào tạo.

07:22.610 --> 07:23.600
Xin chúc mừng.

07:23.600 --> 07:29.270
Bạn đào tạo mô hình học tập phức hợp, sâu sắc trên một ứng dụng rất khó khăn, đó là chơi trò

07:29.270 --> 07:30.170
chơi diệt vong.

07:30.570 --> 07:32.130
Vậy phải nói gì trước?

07:32.130 --> 07:37.290
Vâng, như chúng tôi hy vọng, chúng tôi đã đạt được một số phần thưởng trung bình là hơn 100.

07:37.470 --> 07:43.340
Sau đó, điều quan trọng cần nói là, tất nhiên, với nhiều kỷ nguyên hơn, bạn sẽ nhận được phần thưởng cao hơn.

07:43.350 --> 07:49.470
Vì vậy, nếu bạn đã sẵn sàng, ví dụ: đào tạo mô hình này cho nhiều kỷ nguyên hơn, như 100 kỷ nguyên hoặc

07:49.470 --> 07:54.600
hơn thế nữa để đạt được phần thưởng nhiều hơn khoảng 304 trăm 500 hoặc thậm chí là 1000.

07:54.600 --> 07:55.980
Chà, cứ tự nhiên mà làm.

07:55.980 --> 08:00.570
Ví dụ: bạn có thể để chế độ này chạy vào ban đêm khi bạn ngủ và khi thức dậy vào buổi sáng,

08:00.570 --> 08:02.220
bạn sẽ đạt được kết quả tốt hơn.

08:02.250 --> 08:05.550
Lưu ý rằng bạn cũng có thể sử dụng GPU trong thời gian chạy, phải không?

08:05.550 --> 08:10.500
Nếu bạn thay đổi kiểu thời gian chạy, điều này tôi không nên làm vì nếu không nó sẽ khởi động lại sổ ghi chép.

08:10.500 --> 08:16.440
Nhưng trong trình tăng tốc phần cứng ở đây, bạn có thể chọn GPU hoặc thậm chí là CPU, nhưng đó chỉ là khi bạn muốn

08:16.830 --> 08:20.280
tối ưu hóa hiệu suất và thực hiện một số bài tập siêu chăm chỉ.

08:20.280 --> 08:25.200
Nhưng ở đây tôi chỉ sử dụng điều cổ điển vì tôi chỉ muốn chỉ cho bạn cách thực hiện tất cả những điều này.

08:25.200 --> 08:26.220
Và chúng ta bắt đầu.

08:26.220 --> 08:32.860
Bây giờ chúng ta sẽ thực thi phần còn lại của sổ làm việc với mã bổ sung này chỉ dành riêng cho sách hạt

08:32.880 --> 08:36.210
nhân này, tất nhiên, chúng ta sẽ hình dung AI hoạt động.

08:36.480 --> 08:37.440
Được rồi, hãy làm điều này.

08:37.440 --> 08:39.810
Đầu tiên hãy nhập các thư viện.

08:39.810 --> 08:40.380
Đúng.

08:40.380 --> 08:41.250
Tất cả đều tốt.

08:41.430 --> 08:46.110
Sau đó, chúng tôi sẽ in hình dạng đầu vào và một số hành động có thể.

08:46.110 --> 08:46.470
Được rồi.

08:46.470 --> 08:52.800
Vì vậy, ở đây chúng ta sẽ thực sự nhận ra rằng chúng ta có bảy hành động khả thi trong môi trường Doom Corridor.

08:52.800 --> 08:57.840
Vì vậy, đây là di chuyển về phía trước, di chuyển lùi, đi bên trái, đi bên phải, bắn.

08:57.840 --> 09:00.420
Và sau đó có thể bảo vệ bản thân hoặc bất cứ điều gì.

09:00.420 --> 09:03.570
Tôi không biết hành động cuối cùng là gì, nhưng một cái gì đó như thế.

09:03.570 --> 09:07.470
Sau đó, đây là các kích thước của khung đầu vào.

09:07.470 --> 09:09.420
Điều này tương ứng với chiều cao của khung.

09:09.420 --> 09:11.580
Nó có chiều cao 240 pixel.

09:11.610 --> 09:14.550
Điều này tương ứng với chiều rộng của khung, phải không?

09:14.550 --> 09:17.010
Nó lớn 320.

09:17.010 --> 09:22.770
Và điều này tương ứng với, bạn biết đấy, thực tế là chúng tôi làm việc với các hình ảnh có màu và ba hình ảnh ở

09:22.770 --> 09:25.580
đây tương ứng với ba yếu tố của kênh của chúng tôi.

09:25.860 --> 09:31.230
Được rồi, hãy thực hiện ô tiếp theo, hiển thị một khung của môi trường chỉ để xem nó như

09:31.230 --> 09:32.040
thế nào.

09:32.040 --> 09:37.170
Và thực sự, hãy nhớ rằng, điều đó rất hữu ích khi nhìn thấy môi trường bạn đang làm việc, phải không?

09:37.170 --> 09:43.200
Vì vậy, ở đây chúng ta thấy rằng chúng ta đang ở Doom Corridor, nhưng nếu bạn muốn thử nghiệm với

09:43.200 --> 09:48.510
một số môi trường khác ở đây, hãy nhớ chúng cũng nằm trong trang chính ở đây.

09:48.510 --> 09:48.960
Ngay tại đây.

09:48.960 --> 09:49.200
Đúng.

09:49.200 --> 09:53.280
Bạn biết đấy, bạn có tất cả danh sách các môi trường mà tôi khuyên bạn nên thử nghiệm.

09:53.280 --> 09:56.430
Vì vậy, nếu bạn muốn có một cái nhìn vào một cái khác.

09:56.430 --> 09:58.230
Bạn biết đấy, tôi có thể cho bạn thấy thực sự.

09:58.230 --> 10:02.760
Hãy lấy cái này và sau đó tôi sẽ quay trở lại hành lang diệt vong này.

10:02.790 --> 10:03.240
Đúng.

10:03.240 --> 10:06.810
Vì vậy, nếu tôi thay thế nó bằng cái này.

10:07.500 --> 10:10.290
Đúng và tôi thực hiện điều này tốt.

10:10.290 --> 10:12.290
Chúng tôi sẽ có ba hành động lần này.

10:12.300 --> 10:17.610
Tất nhiên nó là một ô đơn giản hơn, và nếu chúng ta thực thi tốt ô này, chúng ta sẽ thấy môi trường này, phải không?

10:17.610 --> 10:23.550
Vì vậy, đó chỉ là một cách để xem nhanh những gì bạn đang làm việc và để có được bản xem trước, về cơ

10:23.550 --> 10:26.190
bản, về những gì AI sẽ làm trong môi trường.

10:26.400 --> 10:26.760
Được rồi.

10:26.760 --> 10:29.220
Vì vậy, chúng ta hãy quay trở lại Hành lang Trí tuệ.

10:29.250 --> 10:34.080
Hãy thực hiện lại điều này ngay bây giờ trong trường hợp chúng ta cần nó cho các ô tiếp theo.

10:34.110 --> 10:37.230
Được rồi, hành lang diệt vong hoàn hảo.

10:37.260 --> 10:39.720
Bây giờ chúng ta hãy chuyển sang ô cuối cùng.

10:39.720 --> 10:43.620
Vì vậy, đây là một chức năng trợ giúp sẽ được sử dụng để hiển thị.

10:43.620 --> 10:48.090
Vì vậy, hãy thực thi ô này và bây giờ hãy chạy AI trên một tập.

10:48.090 --> 10:53.160
Và ở đây bạn sẽ có thể hiểu mã bởi vì, bạn biết đấy, về cơ bản nó là quá trình

10:53.550 --> 10:59.670
chạy không khí trên một tập đầy đủ, ở mỗi bước, nó ở một trạng thái cụ thể, nó sẽ thực hiện một hành động trong

10:59.670 --> 11:04.950
trạng thái đó, sau đó nó sẽ nhận được phần thưởng và sau đó đạt đến trạng thái tiếp theo, phải không?

11:04.950 --> 11:07.440
Vì vậy, đây là quá trình MDP cổ điển, phải không?

11:07.440 --> 11:09.000
Quá trình quyết định Markov.

11:09.000 --> 11:09.960
Và vậy là xong.

11:09.960 --> 11:11.580
Như vậy là xong một tập.

11:11.580 --> 11:19.620
Và cuối cùng, chúng ta sẽ nhận được video về cách chơi của AI của chúng ta, người đã được đào tạo với 20 đô la, đã có thể đạt được hơn

11:19.620 --> 11:25.380
100 phần thưởng, điều này sẽ giúp chúng ta có một số kết quả khá tốt, nhưng có thể không đạt được

11:25.380 --> 11:26.040
mục tiêu.

11:26.040 --> 11:26.880
Nhưng nó ổn mà.

11:26.880 --> 11:28.680
Bạn sẽ tự mình thử nghiệm điều đó.

11:28.680 --> 11:34.500
Và bây giờ tôi muốn bạn nhấp vào nút này hoàn toàn ở đây vì tôi sẽ muốn cho bạn thấy video được phổ biến

11:34.500 --> 11:35.340
như thế nào.

11:35.340 --> 11:41.400
Vì vậy, đây là một số thư mục chứa một số phần tử như khung, bạn biết đấy, khung của kết quả hoặc

11:41.400 --> 11:42.720
một số JS và tệp.

11:42.720 --> 11:45.600
Nhưng thực sự những gì chúng tôi sẽ quan tâm là video cuối cùng.

11:45.600 --> 11:50.970
Và để có được nó, chúng ta chỉ cần nhấp vào nút play tại đây và bạn sẽ thấy nó sẽ được điền vào

11:50.970 --> 11:52.110
thư mục chính tại đây.

11:52.110 --> 11:53.670
Đừng bỏ lỡ nó và không sao cả.

11:53.670 --> 11:57.420
Bạn biết đấy, có vẻ như ô đã được thực thi, đó là trường hợp.

11:57.420 --> 11:59.220
Nhưng bạn sẽ thấy điều đó trong vài giây.

11:59.220 --> 12:03.840
Chúng ta sẽ thấy một tệp AVI, một tệp video đang được điền ở đây.

12:03.840 --> 12:05.640
Nó sẽ xuất hiện sau 10 giây.

12:05.640 --> 12:08.010
Tôi thậm chí có thể đếm ngược nếu bạn muốn.

12:08.010 --> 12:09.150
Vì vậy, chúng ta hãy làm điều này.

12:09.150 --> 12:20.970
Và mười, chín, tám, bảy, sáu, năm, bốn, ba, hai, một, đi nào.

12:21.710 --> 12:24.050
Và bây giờ nó sẽ thực sự xuất hiện trong vài giây nữa.

12:24.050 --> 12:24.890
Vâng, chúng ta bắt đầu.

12:25.040 --> 12:25.460
Được rồi.

12:25.460 --> 12:26.570
Vì vậy, trò chơi đại lý.

12:26.570 --> 12:27.500
Chơi đi, Avi.

12:27.500 --> 12:28.400
Đó là video của bạn.

12:28.400 --> 12:36.740
Vì vậy, chúng ta hãy tải xuống và nó sẽ được tải xuống máy tính của bạn, mà tôi sẽ tìm thấy ngay tại đây.

12:36.740 --> 12:37.030
Đúng.

12:37.040 --> 12:38.810
Vì vậy, đó là trò chơi đại lý video.

12:38.810 --> 12:39.800
Đóng vai FBI.

12:39.830 --> 12:44.060
Đảm bảo mở nó bằng trình phát video có codec như VLC.

12:44.090 --> 12:44.450
Đúng.

12:44.450 --> 12:49.070
Nó sẽ không hoạt động với trình phát thời gian nhanh nếu bạn đang sử dụng máy Mac, nhưng nó chắc chắn sẽ hoạt động với VLC.

12:49.100 --> 12:52.190
Vì vậy, chúng ta hãy xem và đây là video.

12:52.190 --> 12:52.550
Được rồi.

12:52.550 --> 12:55.040
Vì vậy, hãy để tôi chỉ cần nhấn tạm dừng ở đây.

12:55.250 --> 12:55.520
Được rồi.

12:55.520 --> 12:56.210
Vì vậy, đây là video.

12:56.210 --> 13:01.460
Và như bạn có thể thấy, đây là kích thước 256 x 256 của khung.

13:01.460 --> 13:03.050
Vì vậy, như bạn có thể thấy, nó không lớn lắm.

13:03.050 --> 13:03.320
Đúng.

13:03.320 --> 13:08.210
Vì vậy, đó là lý do tại sao tôi thực sự muốn làm việc với các kích thước này thay vì 80 x 80.

13:08.630 --> 13:10.070
Vì vậy, bây giờ chúng ta hãy xem xét video.

13:10.070 --> 13:15.920
Vì vậy, đây là AI chơi trò diệt vong trong một tập và nó phải tránh những con quái vật, không bị giết.

13:15.920 --> 13:17.990
Nó phải di chuyển về phía trước để đạt được áo quan.

13:17.990 --> 13:19.400
Vì vậy, chúng ta hãy xem nó làm như thế nào.

13:19.400 --> 13:22.280
3 đến 1 đi.

13:23.920 --> 13:24.460
Được rồi.

13:24.460 --> 13:27.850
Vì vậy, đầu tiên nó bị bắn, nó sẽ di chuyển về phía trước, được không?

13:27.940 --> 13:29.920
Và sau đó nó bị giết bởi những con quái vật.

13:29.920 --> 13:31.510
Nhưng điều đó vẫn khá tốt.

13:31.510 --> 13:36.220
Bạn biết đấy, nó hiểu rằng nó phải tiến về phía trước áo vest vì phần thưởng cao nhất

13:36.220 --> 13:37.870
là đạt được chiếc áo vest.

13:38.080 --> 13:42.730
Và tất nhiên, bạn biết đấy, nếu bạn thực sự muốn xem đoạn video về mắt của bạn chạm đến áo vest

13:42.730 --> 13:48.790
và chiến thắng trong trò chơi này, về cơ bản bạn sẽ phải luyện mắt của mình trong nhiều kỷ nguyên hơn và có thể thực hiện một số loại

13:48.790 --> 13:54.190
cải tiến khác, chẳng hạn như điều chỉnh bộ não của mắt bạn hoặc thực hiện một số điều chỉnh tham số, chẳng hạn như điều chỉnh

13:54.190 --> 13:55.090
tốc độ học tập.

13:55.090 --> 14:01.060
Chà, bạn có nhiều lựa chọn nếu bất kỳ ai trong số bạn nhận được một video tuyệt vời hoặc, bạn biết đấy, video về

14:01.060 --> 14:03.820
một AI đã đạt được phần thưởng hơn 1000 chẳng hạn.

14:03.820 --> 14:06.490
Chà, vui lòng chia sẻ nó trong phần Hỏi &amp; Đáp.

14:06.490 --> 14:09.490
Tôi chắc rằng các sinh viên khác sẽ rất vui khi nhận được nó.

14:09.850 --> 14:10.420
Được rồi.

14:10.420 --> 14:14.890
Vì vậy, tôi hy vọng bạn thích triển khai mô hình học tập tích hợp, sâu sắc.

14:14.890 --> 14:19.330
Bây giờ chúng ta sẽ chuyển sang phần tiếp theo, sẽ là về việc triển khai mô hình

14:19.330 --> 14:25.000
A ba then chốt và thậm chí là mô hình tốt hơn và mạnh mẽ hơn sẽ triển khai để chơi trò chơi đột phá.

14:25.000 --> 14:26.800
Vì vậy, tôi sẽ gặp bạn trong phần tiếp theo.

14:26.800 --> 14:28.180
Và cho đến khi đó, hãy tận hưởng.

14:28.180 --> 14:28.780
TÔI.
