WEBVTT

00:00.240 --> 00:02.460
Xin chào và chào mừng đến với hướng dẫn này.

00:02.490 --> 00:07.800
Được rồi, bây giờ đã đến lúc xây dựng AI đầu tiên của chúng tôi, bởi vì hiện tại chúng tôi mới chỉ

00:07.800 --> 00:12.090
tạo sổ tay hướng dẫn với lớp AI, nhưng chúng tôi chưa tạo bất kỳ đối tượng nào.

00:12.090 --> 00:17.490
Và vì vậy chúng tôi vẫn chưa có AI thực sự, nhưng chúng tôi sắp có được nó ngay bây giờ vì chúng

00:17.490 --> 00:20.220
tôi sắp tạo ra một đối tượng của lớp AI này.

00:20.220 --> 00:25.260
Và đối tượng này sẽ không là gì khác hơn là một AI sẽ có não và cơ thể.

00:25.650 --> 00:25.980
Được rồi.

00:25.980 --> 00:26.960
Vì vậy, chúng ta hãy làm điều này.

00:26.970 --> 00:32.340
Nó thực sự rất đơn giản để làm điều đó bây giờ chúng ta đã xác định mọi thứ với các lớp.

00:32.340 --> 00:38.550
Vì vậy, về cơ bản những gì chúng ta cần làm trước tiên là tạo ra một bộ não, vì như bạn có thể thấy, khi chúng ta tạo ra

00:38.550 --> 00:42.180
một AI, chúng ta cần nhập một bộ não, nhưng chúng ta cũng nhập một cơ thể.

00:42.180 --> 00:44.040
Vì vậy, chúng ta cũng cần phải tạo ra một cơ thể.

00:44.040 --> 00:50.640
Và sau đó một khi chúng ta tạo ra một đối tượng não và một đối tượng cơ thể, chúng ta sẽ có thể tạo ra AI, nhưng đừng lo lắng,

00:50.670 --> 00:54.000
chúng ta sẽ xây dựng bộ não và cơ thể trong một chiếc đèn pin.

00:54.000 --> 00:55.620
Và thực sự, chúng ta hãy làm điều đó ngay bây giờ.

00:55.620 --> 00:57.000
Hãy bắt đầu với bộ não.

00:57.000 --> 01:02.550
Chúng ta sẽ gọi bộ não là CNN, bởi vì bộ não là một mạng nơ-ron phức tạp và

01:02.550 --> 01:05.490
nó sẽ là một đối tượng của lớp CNN.

01:05.490 --> 01:07.470
Vì vậy, nó là hợp lý để gọi nó là CNN.

01:07.590 --> 01:14.870
Vì vậy, CNN bằng và sau đó chúng tôi tham gia lớp CNN của chúng tôi lần này và chúng tôi nhập vào dấu ngoặc đơn, theo bạn.

01:14.880 --> 01:20.460
Chà, tại thời điểm này, khi chúng ta tạo một đối tượng của một lớp, những gì chúng ta phải

01:20.460 --> 01:25.710
nhập rất đơn giản là đối số của hàm init và đó là các hành động số.

01:25.710 --> 01:30.750
Và cảm ơn những gì chúng tôi đã làm trước đây khi sử dụng môi trường thu phóng,

01:30.780 --> 01:37.920
nơi chúng tôi đã có các hành động số này và do đó chúng tôi chỉ cần nhập các hành động số ở đây vào lớp CNN.

01:37.920 --> 01:38.790
Hoàn hảo.

01:38.790 --> 01:40.140
Vì vậy, bây giờ chúng ta có bộ não.

01:40.140 --> 01:42.030
Bây giờ chúng ta hãy làm bạn bè.

01:42.330 --> 01:47.370
Chúng ta sẽ tạo một đối tượng thuộc lớp self max body và chúng ta sẽ gọi đối tượng

01:47.370 --> 01:51.180
này là soft max body sẽ là phần thân của AI của chúng ta.

01:51.180 --> 01:59.970
Và đối tượng này là một đối tượng của lớp soft max buddy mà chúng ta phải nhập đối số duy nhất của hàm init của lớp soft max

01:59.970 --> 02:05.790
body, là nhiệt độ t và do đó ở đây chúng ta nhập t, nhưng chúng ta phải chỉ

02:05.910 --> 02:10.410
định giá trị bởi vì cho đến nay t chỉ là một lập luận.

02:10.410 --> 02:11.760
Vậy t bằng.

02:11.760 --> 02:17.580
Và chúng ta sẽ bắt đầu với một nhiệt độ nhỏ, nhưng điều này có thể hoạt động rất tốt.

02:17.580 --> 02:20.340
Và thực sự tôi đã biết điều này sẽ hoạt động rất tốt.

02:20.340 --> 02:23.520
Vì vậy, nhưng bạn có thể thử với các nhiệt độ khác.

02:23.520 --> 02:27.690
Bạn biết nó hoạt động như thế nào bây giờ hành động của bạn sẽ chắc chắn hơn về chính nó.

02:27.690 --> 02:32.730
Nghĩa là, hành động có giá trị Q cao nhất sẽ có xác suất được chọn cao hơn so với các

02:32.730 --> 02:37.320
hành động khác, hành động có xác suất được chọn thấp hơn và do đó sẽ ít được

02:37.320 --> 02:38.250
khám phá hơn.

02:38.250 --> 02:40.500
Nhưng dù sao đi nữa, chúng ta có thể bắt đầu với một cái.

02:40.560 --> 02:43.080
Điều này sẽ giúp chúng ta có được một cơ thể tốt.

02:43.900 --> 02:44.410
Được rồi.

02:44.410 --> 02:49.300
Vì vậy, bây giờ chúng tôi có một bộ não, chúng tôi có một người bạn, vì vậy tôi đoán đã đến lúc vào chung kết.

02:49.300 --> 02:50.610
Tôi cuối cùng.

02:50.620 --> 02:54.610
Vì vậy, bây giờ bạn sẽ thấy mọi thứ sẽ trở nên đơn giản như thế nào.

02:54.610 --> 02:56.860
Đó là khi trực giác đạt đến đỉnh cao.

02:56.860 --> 03:03.850
Để tạo ra một AI, chúng ta chỉ cần tạo một đối tượng mà chúng ta gọi là mắt, tất nhiên là mắt từ lớp mắt của chúng ta.

03:03.850 --> 03:10.180
Và vì mắt được cấu tạo bởi não và cơ thể, nên chúng ta nhập vào não, đó là

03:10.180 --> 03:17.680
mạng lưới thần kinh phức hợp của chúng ta, nhưng đối tượng và cơ thể không gì khác ngoài phần thân mềm tối đa.

03:18.700 --> 03:21.190
Vật thể từ lớp cơ thể của Mack mềm.

03:21.190 --> 03:28.750
Và hãy xem, chúng tôi đã xây dựng một AI trong một chiếc đèn pin bằng cách chỉ nhập vào bộ não và cơ thể, và bây giờ chúng tôi đã có một

03:28.750 --> 03:30.340
AI sẵn sàng được đào tạo.

03:30.340 --> 03:35.800
Vì vậy, bây giờ đã đến lúc khởi động toàn bộ quy trình học tập phức tạp, sâu sắc với kinh nghiệm, phát

03:35.800 --> 03:38.740
lại phần thưởng của dấu vết đủ điều kiện trên mười bước.

03:38.740 --> 03:43.660
Và cuối cùng, khi chúng ta có tất cả những điều này, chúng ta sẽ đào tạo AI để làm cho nó trở nên thông minh.

03:43.750 --> 03:45.820
Vì vậy, không thể chờ đợi để làm điều này.

03:45.820 --> 03:51.190
Phần tiếp theo sẽ là về thiết lập tính năng phát lại trải nghiệm, vì vậy chúng tôi sẽ không

03:51.190 --> 03:56.770
triển khai lại toàn bộ, như đối với xe tự lái, bởi vì tin tốt là chúng tôi đã triển khai nó.

03:56.770 --> 03:57.880
Vì vậy, điều đó sẽ nhanh chóng.

03:57.880 --> 04:03.280
Chúng tôi sẽ chỉ tạo một đối tượng tại lớp bộ nhớ phát lại nằm trong tệp phát lại trải nghiệm này.

04:03.280 --> 04:08.350
Vì vậy, đó là điều giúp chúng tôi rất nhiều và do đó chúng tôi sẽ nhanh chóng chuyển sang những gì mới và quan trọng

04:08.350 --> 04:09.550
nhất, đó là đào tạo.

04:09.760 --> 04:13.750
Vì vậy, chúng ta hãy tấn công điều này trong các hướng dẫn tiếp theo và cho đến khi đó, hãy tận hưởng tôi.
