WEBVTT

00:00.570 --> 00:03.340
Xin chào và chào mừng bạn trở lại khóa học về Trí tuệ nhân tạo.

00:03.360 --> 00:06.300
Trong hướng dẫn hôm nay, chúng ta sẽ nói về một phần bổ sung về điều đó.

00:06.300 --> 00:08.610
Chúng tôi sẽ triển khai thuật toán ba C của chúng tôi.

00:08.610 --> 00:12.690
Nó được gọi là trí nhớ ngắn hạn dài hạn hay ngắn hạn.

00:12.690 --> 00:20.040
Vì vậy, chúng ta hãy xem xét những gì chúng ta có cho đến nay và sau đó chúng ta sẽ thảo luận về lý do tại sao chúng ta cần LST

00:20.040 --> 00:21.000
và LSM là gì.

00:21.000 --> 00:24.480
Cho đến nay chúng ta đã thảo luận về ba thuật toán C.

00:24.480 --> 00:29.910
Chúng ta đã nói về cả ba chữ A trong A3 C và tất nhiên, chúng ta thấy rằng nó thực sự phức tạp hơn một

00:29.910 --> 00:33.300
chút, phức tạp hơn nhiều so với những gì chúng ta có trên hình ảnh này.

00:33.300 --> 00:38.250
Chúng ta thực sự có ba hoặc nhiều tác nhân đi qua môi trường và họ đang giao

00:38.250 --> 00:39.570
tiếp với nhau, v.v.

00:39.570 --> 00:44.460
Nhưng vì lý do đơn giản, đối với câu chuyện hôm nay, chúng ta sẽ chỉ minh họa mọi thứ với một tác

00:44.460 --> 00:45.570
nhân duy nhất này.

00:45.570 --> 00:47.520
Cuối cùng, chúng ta có phần diễn viên này, phần phê bình.

00:47.520 --> 00:52.770
Vì vậy, về cơ bản, một khi chúng ta có một trạng thái, trạng thái đó đối với hình ảnh này sẽ đi qua một lớp phức hợp, sau

00:52.770 --> 00:55.290
đó nó đi qua một lớp gộp, đi đến một lớp làm phẳng.

00:55.290 --> 01:02.310
Và tại thời điểm này, chúng ta có các giá trị hoặc số sau đó được truyền qua mạng và chúng đi

01:02.310 --> 01:03.960
vào các lớp ẩn.

01:03.960 --> 01:10.350
Và sau đó là đầu ra, chúng tôi nhận được chính sách hoặc phần tác nhân và họ nhận được giá trị của nhà nước

01:10.350 --> 01:12.600
hoặc chúng tôi nhận được phần phê bình.

01:12.600 --> 01:16.530
Và những gì chúng ta sẽ làm hôm nay là chúng ta sẽ nói về phần ẩn này.

01:16.530 --> 01:21.600
Vì vậy, trong các lớp ẩn, chúng tôi thực sự có thể đưa nó lên cấp độ tiếp theo và chúng tôi có thể thêm một sửa đổi.

01:21.600 --> 01:25.560
Và chúng tôi đã thấy rằng thuật toán tồn tại nhiều sửa đổi.

01:25.560 --> 01:26.250
Chúng tôi đã thấy một trong số họ.

01:26.250 --> 01:32.430
Chúng tôi nhận thấy rằng trong một số trường hợp, bạn có thể có phần chính này của mạng, phần này là riêng lẻ cho mọi

01:32.430 --> 01:35.700
đại lý hoặc bạn có thể chia sẻ phần chính này của mạng.

01:35.700 --> 01:42.000
Và đó là những gì chúng tôi thấy rằng trong những lần thử nghiệm trực giác trước đây, chúng tôi đã có một phần mạng được chia sẻ.

01:42.000 --> 01:44.100
Mạng này được chia sẻ giữa các đại lý.

01:44.100 --> 01:50.040
Và như Adlon sẽ cho bạn biết nhiều hơn trong các hướng dẫn thực tế, điều đó thực sự hữu ích với thử thách

01:50.040 --> 01:50.580
đột phá.

01:50.580 --> 01:57.690
Và có rất nhiều cách khác mà bạn có thể sửa đổi thuật toán, rất nhiều bổ sung khác

01:57.690 --> 01:59.670
có thể được thực hiện.

01:59.670 --> 02:03.120
Và một trong số chúng mà chúng ta sẽ thảo luận, bởi vì chúng ta

02:03.120 --> 02:09.720
thực sự sẽ có nó trong một bộ hướng dẫn thực tế ở đây trước khi bạn nhấn vào các lớp, mà bạn có thể thêm là một

02:09.720 --> 02:17.040
lớp lshtm, một lớp mạng thần kinh, cho phép thuật toán của bạn , điều này cho phép thuật toán có bộ nhớ, cho phép thuật toán ghi nhớ những gì

02:17.370 --> 02:18.810
đã xảy ra trước đó.

02:18.810 --> 02:20.940
Và chúng ta sẽ nói chi tiết hơn về Lshtm ngay bây giờ.

02:20.940 --> 02:26.040
Nhưng về cơ bản, bạn có thể thêm một lớp bổ sung ở đây, đó là lớp danh sách và nâng cao thuật toán của bạn với một

02:26.040 --> 02:27.870
số bộ nhớ bổ sung cho một tính năng khác.

02:27.870 --> 02:32.610
Và những gì bạn thực sự sẽ thấy trong vật liệu fractal là chúng tôi thậm chí không cần bất kỳ lớp ẩn

02:32.610 --> 02:36.030
nào sau lớp cuối cùng, vì vậy bạn sẽ thấy điều đó trước khi triển khai.

02:36.030 --> 02:38.760
Anh ấy có lớp làm phẳng ngay lập tức.

02:38.760 --> 02:40.350
Sau đó, anh ấy có lớp hệ thống.

02:40.350 --> 02:43.380
Vì vậy, về cơ bản hộp này đại diện cho lớp lshtm.

02:43.380 --> 02:45.960
Và sau đó ngay lập tức bạn đã có đầu ra.

02:45.960 --> 02:50.940
Vì vậy, anh ta thậm chí không cần bất kỳ, bất kỳ lớp ẩn nào khác sau đó, đơn giản vì đó là

02:50.940 --> 02:53.160
sức mạnh mà lớp lshtm thêm vào thuật toán.

02:53.160 --> 02:58.980
Và một lần nữa, thuật toán hoặc kiến trúc của mạng nơ-ron của bạn, đó là một thứ rất riêng lẻ.

02:58.980 --> 03:01.320
Đó là một sở thích cá nhân, đó là một thứ rất sáng tạo.

03:01.320 --> 03:07.740
Vì vậy, bạn có thể muốn có hai lớp, bạn có thể có một lớp phân tích và sau đó vài lớp như năm lớp ẩn

03:07.740 --> 03:08.730
trong danh sách.

03:08.910 --> 03:11.670
Điều đó hoàn toàn tùy thuộc vào bạn và để bạn thử nghiệm và khám phá.

03:11.670 --> 03:16.290
Nhưng đây là những gì chúng tôi nghĩ ra trong các hướng dẫn thực hành.

03:16.290 --> 03:23.070
Vì vậy, bạn sẽ thấy rằng chúng ta có một lớp phẳng, một lớp phẳng, và sau đó chúng ta có một lớp lsd1 và sau

03:23.070 --> 03:24.240
đó là đầu ra.

03:24.240 --> 03:28.590
Vì vậy, bây giờ chúng ta đã nói về lớp này rất nhiều, lớp danh sách này là gì?

03:28.590 --> 03:34.650
Vâng, lớp lshtm bổ sung bộ nhớ mang lại một tính năng như cho phép mạng nơ-ron có bộ nhớ về những gì

03:34.650 --> 03:36.810
đã xảy ra trong các lần lặp trước.

03:36.810 --> 03:43.170
Và nó thường được ký hiệu hoặc hiển thị bằng một biểu tượng giống như thế này.

03:43.170 --> 03:46.050
Đây là chúng tôi chỉ mới bắt đầu và tôi chỉ đặt nó ở đây.

03:46.050 --> 03:51.630
Tôi biết nó trông rất quanh co, nhưng tôi đặt nó ở đây để bạn có thể thấy khi chúng ta thảo luận thêm về hình ảnh này, bạn có thể

03:51.630 --> 03:52.830
thấy những gì đang xảy ra.

03:52.830 --> 04:01.500
Vì vậy, kết quả đầu ra của lớp này đi vào đây và đó là của chúng ta nên đây là toàn bộ lớp sẽ đi vào đây.

04:01.500 --> 04:02.970
Vì vậy, nó là một vectơ của các giá trị.

04:02.970 --> 04:04.920
X là một giá trị vectơ đi vào bánh sandwich.

04:04.920 --> 04:09.510
Chúng ta sẽ chỉ thảo luận về vấn đề này ngay bây giờ và sau đó như một đầu ra, bạn sẽ nhận được một vectơ khác, là đoạn nối

04:09.510 --> 04:12.150
của các cửa hàng này hoặc một số bằng cách nào đó nó liên kết với mạng.

04:12.150 --> 04:14.820
Trong trường hợp của chúng tôi với tư cách là đầu ra, bạn nhận được cái này và bạn nhận được cái này.

04:14.820 --> 04:17.280
Vì vậy, chúng ta hãy xem xét điều này một cách chi tiết hơn.

04:17.280 --> 04:18.810
Vì vậy, chúng tôi sẽ chỉ tập trung vào phần này.

04:18.940 --> 04:22.830
Trên thực tế, chúng ta sẽ, như bạn có thể nhận thấy bởi các chữ cái ở kích thước này, chúng

04:22.830 --> 04:24.270
ta sẽ lật nó sang một bên.

04:24.270 --> 04:31.590
Vì vậy, như thế và toàn bộ như mớ bòng bong này chỉ để nhắc lại thực tế rằng mặc dù trông như thế này, nhưng điều

04:31.590 --> 04:36.840
thực sự đang xảy ra là một lớp giá trị, một toàn bộ vectơ giá trị đang ở trong

04:36.840 --> 04:37.410
đây.

04:37.410 --> 04:39.780
Có điều gì đó đang xảy ra, mà chúng ta sẽ thảo luận về điều này ngay bây giờ và sau đó.

04:39.780 --> 04:41.390
Toàn bộ thung lũng vector đang diễn ra ở đây.

04:41.400 --> 04:43.170
Vì vậy, đây là lớp.

04:43.170 --> 04:47.190
Nó không chỉ là một phần tử của nó mà là chính lớp.

04:47.190 --> 04:49.320
Vì vậy, chúng ta hãy quay trở lại một lần nữa.

04:49.320 --> 04:53.550
Chỉ để nhắc lại, lớp đi vào lớp này.

04:53.550 --> 04:55.530
Có điều gì đó xảy ra, lớp xuất hiện.

04:55.530 --> 04:58.560
Vì vậy, đó là hệ thống chỉ là ở phía của nó.

04:58.560 --> 05:00.020
Vì vậy, nó chỉ dễ dàng hơn để thảo luận về điều này.

05:00.490 --> 05:02.050
Và đó là cách đại diện thông thường.

05:02.170 --> 05:02.580
Được rồi.

05:02.590 --> 05:07.770
Giờ thì chúng ta đã đồng ý tại sao lại có hình ảnh này và chúng ta sẽ tiến hành điều này như thế nào?

05:07.780 --> 05:11.430
Hãy bắt đầu đào sâu vào tình huống này hơn một chút.

05:11.440 --> 05:14.010
Vậy điều gì xảy ra bên trong lớp hơi nước?

05:14.020 --> 05:15.330
Vì vậy, đây là những gì nó trông như thế này.

05:15.340 --> 05:17.920
Và tất nhiên, điều này trông rất phức tạp.

05:17.920 --> 05:23.380
Và chúng tôi chắc chắn sẽ không xem xét tất cả những điều này ngay bây giờ đơn giản vì có khá nhiều điều để thảo luận về

05:23.380 --> 05:24.010
những điều này.

05:24.100 --> 05:32.050
Điểm là, hoạt động là một hoạt động khôn ngoan của lớp và chỉ là có rất nhiều thứ đang diễn ra hoặc rất nhiều chi tiết phức tạp

05:32.050 --> 05:37.300
mà chúng ta sẽ không đi sâu vào vì nếu không nó sẽ làm hỏng khóa học này.

05:37.300 --> 05:40.480
Và đây không phải là mục đích không nói về thân cây ở đây.

05:40.480 --> 05:42.230
Chúng tôi sẽ chỉ sử dụng từng chất đàn hồi.

05:42.340 --> 05:49.960
Và nếu bạn muốn tìm hiểu thêm về Tams, bạn có thể truy cập blog Christopher Olas tại đây.

05:50.410 --> 05:56.560
Anh ấy có một mô tả tốt về tất cả các gốc hoặc chúng tôi cũng nói về LCMS trong độ tuổi học sâu của chúng tôi.

05:56.560 --> 05:57.970
Tất nhiên bạn có thể kiểm tra nó ở đó.

05:57.970 --> 06:01.300
Chúng tôi cũng có cả một phần về mạng nơ-ron lặp lại và nguồn gốc.

06:01.300 --> 06:09.160
Vì vậy, về cơ bản đây là phần bên trong của LCM và những gì xảy ra giống như lớp đi vào.

06:09.160 --> 06:13.450
Vì vậy, chúng ta sẽ nói về vấn đề này, ở cấp độ trực quan, ở cấp độ nội bộ rất cơ bản.

06:13.450 --> 06:18.310
Chỉ là, những gì sắp xảy ra là đủ để chúng ta hiểu điều gì xảy ra, tại sao lại có trí

06:18.310 --> 06:23.260
nhớ, và để bạn cũng có thể hiểu rõ hơn về những gì Alan đang nói khi anh ấy thực hiện điều này.

06:23.260 --> 06:28.390
Vì vậy, một lớp đi vào tất cả những thứ này, một cái gì đó về cơ bản sẽ diễn ra ở đây.

06:28.420 --> 06:29.260
Lớp đi ra ngoài.

06:29.530 --> 06:36.430
Những gì chúng ta cần thực sự thấy là có những phần này, thực sự có các đầu vào bổ sung vào

06:36.430 --> 06:37.390
lớp này.

06:37.390 --> 06:42.910
Vì vậy, hãy nhớ điều này thường là bạn có đầu vào từ lớp trước, sau đó là lớp này và sau đó bạn có

06:42.910 --> 06:43.480
đầu ra.

06:43.480 --> 06:49.540
Nếu bạn nghĩ về hình ảnh mà chúng ta đã có trước đây, mạng lưới bình thường, không phải, không nằm ở phía bên của nó, giống như

06:49.540 --> 06:54.070
từ trái sang phải, không phải từ trên xuống dưới lên trên, nhưng với thân cây vani, bạn thực sự có

06:54.070 --> 06:55.120
nhiều đầu vào hơn.

06:55.120 --> 06:59.290
Vì vậy, tôi biết nó ngày càng phức tạp hơn, nhưng những điều này ít nhất chúng ta có thể hiểu được chúng.

06:59.290 --> 07:06.640
Vì vậy, đây là ô bộ nhớ của bạn, đây là chìa khóa, và đây là những gì bạn sẽ nghe Adlon nói về.

07:06.640 --> 07:11.810
Vì vậy, ô nhớ là một cái gì đó được lưu trong hệ thống.

07:11.830 --> 07:15.730
Vì vậy, những đầu vào này và những đầu ra này, chúng thực sự ở đây.

07:15.730 --> 07:18.130
Những gì bạn đang xem là trục thời gian.

07:18.130 --> 07:20.200
Vì vậy, điều này được làm sáng tỏ trong thời gian.

07:20.200 --> 07:27.610
Vì vậy, trong một lần lặp cụ thể, điều này xảy ra, nhưng sau đó giá trị này được lấy từ quá khứ và giá trị này được chuyển vào

07:27.610 --> 07:28.780
các giá trị này.

07:28.780 --> 07:33.430
Những giá trị này được lấy từ quá khứ và những giá trị này được truyền lại cho tương lai và chúng truyền tải tốt như

07:33.430 --> 07:35.350
thế nào thông qua cách hoạt động của nhóm LHS.

07:35.350 --> 07:41.320
Vì vậy, không cần quá lo lắng về những gì đang xảy ra ở đây, tất cả những gì chúng ta

07:41.350 --> 07:48.990
cần hiểu là lớp sẽ đi vào và ở đây chúng ta đã có một giá trị đến từ quá khứ, được lưu trữ bên trong lshtm.

07:49.000 --> 07:51.550
Bên trong bộ nhớ dài hạn, ngắn hạn.

07:51.880 --> 07:59.560
Chúng tôi có ô nhớ này và bất kỳ giá trị nào ở đây trước đây, nó chỉ nằm ở đây.

07:59.560 --> 08:00.010
Bạn có thể thấy.

08:00.010 --> 08:04.990
Nó chỉ đi qua nó chảy qua một cách tự do, ngoại trừ những hoạt động khôn ngoan ở điểm này, nơi nó có thể được đóng

08:04.990 --> 08:07.090
lại hoặc có thể thêm thứ gì đó vào nó.

08:07.090 --> 08:11.380
Nhưng bất kể điều đó, nó chỉ là một số giá trị tự do chảy qua.

08:11.380 --> 08:14.860
Vì vậy, về cơ bản nó được chuyển sang thời điểm tiếp theo, thời điểm tiếp theo.

08:14.860 --> 08:20.260
Vì vậy, bạn có thể nghĩ về nó như một bộ nhớ giống như ổ đĩa flash hoặc thứ gì đó tương tự

08:20.260 --> 08:21.310
như ô này có.

08:21.310 --> 08:24.280
Và vì vậy nó chỉ nhớ giá trị trước đây mà nó ở đây.

08:24.280 --> 08:29.860
Và sau đó nó có thể sử dụng điều đó để làm để thêm vào nó hoặc đọc từ giá trị đó, v.v.

08:30.160 --> 08:38.110
Và giá trị này là trạng thái ẩn, chính là như vậy, do đó chữ H và trạng thái ẩn về cơ bản là một giá trị khác đến

08:38.110 --> 08:41.950
từ quá khứ và sau đó được sử dụng bên trong hệ thống.

08:41.950 --> 08:47.890
Và như bạn có thể thấy ở phần cuối, sau khi tất cả những điều này xảy ra, những gì bạn nhận được là bạn nhận được một lớp

08:47.890 --> 08:49.240
xuất hiện và đúng như vậy.

08:49.240 --> 08:52.930
Vì vậy, bạn nhận được giá trị này xuất hiện và nó là giá trị tương tự được chuyển về phía trước.

08:52.930 --> 08:55.690
Vì vậy, về cơ bản nhóm LLS ghi nhớ hai điều.

08:55.690 --> 09:01.370
Có một giá trị không đổi giống như nằm trong lshtm có thể được thay đổi như thế này.

09:01.420 --> 09:04.660
Có một ổ đĩa flash giống như một giá trị không đổi.

09:04.660 --> 09:10.540
Vì vậy, ô bộ nhớ và vì vậy bạn có thể, bạn có thể thoải mái lưu trữ một thứ gì đó trong không gian đó, trong

09:10.540 --> 09:13.330
bộ nhớ đó, và nó sẽ được truyền lại cho tương lai.

09:13.330 --> 09:19.510
Vì vậy, bất cứ khi nào trong lần lặp tiếp theo, giống như thuật toán ở trong một môi trường, nó nhìn thấy điều gì đó, làm điều

09:19.600 --> 09:20.470
gì đó, v.v.

09:20.470 --> 09:25.630
Và sau đó trong nhóm, bạn có thể lưu trữ một giá trị nhất định và sau đó nó sẽ ghi nhớ giá trị này ngay cả khi

09:25.630 --> 09:26.740
nó ở trạng thái tiếp theo.

09:27.190 --> 09:32.080
Và giá trị khác sẽ nhớ nó sẽ nhớ kết quả trước đó của nó, nó sẽ tự động ghi nhớ

09:32.080 --> 09:33.640
kết quả trước đó của nó.

09:33.640 --> 09:35.290
Vì vậy, đầu ra đi đến đây và đi tới đây.

09:35.290 --> 09:42.070
Vì vậy, về cơ bản đó là mức rất, rất, rất cao của những gì xảy ra trong LSM.

09:42.070 --> 09:46.060
Một lần nữa, nếu bạn muốn biết thêm chi tiết, bạn có thể tìm thấy rất nhiều tài nguyên.

09:46.060 --> 09:50.920
Và ở giai đoạn này, chúng ta không cần phải đi sâu vào chi tiết về tất cả những thứ này.

09:50.920 --> 09:56.950
Chúng ta chỉ cần hiểu ô nhớ là gì, ô nhớ ẩn là gì, trạng thái ẩn là gì

09:56.950 --> 09:59.950
và chúng tạo điều kiện như thế nào.

10:00.490 --> 10:01.810
Bộ nhớ cho danh sách.

10:02.110 --> 10:09.520
Và câu hỏi đặt ra là, bây giờ chúng ta đã có một cái nhìn tổng quát về tất cả những điều này để củng

10:09.520 --> 10:17.350
cố hoặc củng cố kiến thức này hoặc đại loại là đưa ra lý do cho kiến thức này, chúng ta hãy đặt câu hỏi, tại sao

10:17.350 --> 10:19.090
chúng ta cần trí nhớ?

10:19.090 --> 10:22.960
Tại sao chúng ta cần bộ nhớ trong a3c hoặc các thuật toán khác?

10:22.960 --> 10:26.890
Vâng, hãy xem ví dụ của chúng tôi, thách thức mà chúng tôi đang thực hiện trong phần này.

10:26.890 --> 10:28.360
Vì vậy, thách thức là đột phá.

10:28.360 --> 10:29.860
Và điều gì xảy ra trong đột phá?

10:29.860 --> 10:34.900
Chà, thật tuyệt vời, bạn đã có môi trường này, những khối nhỏ mà bạn cần phải phá hủy bằng quả

10:34.900 --> 10:35.710
bóng nhỏ này.

10:35.710 --> 10:40.900
Và bạn cần đảm bảo rằng đây là loại vợt hoặc nền tảng tương tự của bạn đang di chuyển xung quanh.

10:40.900 --> 10:46.060
Và nó phải bất cứ khi nào quả bóng bay, nó phải bắt được quả bóng và nó sẽ bật ra khỏi bệ và quay trở lại và đánh

10:46.060 --> 10:49.480
nó hoặc bật ra khỏi các bức tường và quay trở lại, đánh một khối và quay trở lại.

10:49.870 --> 10:54.100
Và đó là bản chất của những gì bạn cần hoàn thành.

10:54.100 --> 11:02.260
Nhưng bây giờ chúng ta hãy nhìn vào quả bóng này giống như tưởng tượng bạn là một thuật toán an, an, a3c, bạn hoặc một tác nhân bên trong một trong những

11:02.260 --> 11:05.260
tác nhân đó bên trong a3c, bạn thấy hình ảnh này?

11:05.260 --> 11:07.480
Bạn rút ra được gì từ đây?

11:07.480 --> 11:09.070
Hành động của bạn ở đây là gì?

11:09.070 --> 11:09.490
Từ đây?

11:09.490 --> 11:11.740
Vì vậy, bạn có thể thấy quả bóng đang bay, phải không?

11:11.740 --> 11:13.540
Vì vậy, nó đã bay, phải không.

11:13.540 --> 11:15.880
Vì vậy, nó đang đi đâu đó và có thể nó đang bay về phía bạn.

11:15.880 --> 11:16.120
Đúng.

11:16.120 --> 11:17.740
Bạn có thể đưa ra kết luận này không?

11:17.740 --> 11:20.050
Bạn có thể đoán trước rằng nó đang tiến về phía bạn không?

11:20.080 --> 11:21.160
Bạn có thể có thể.

11:21.160 --> 11:23.680
Và có lẽ bạn đang ở đúng vị trí để bắt bóng.

11:23.680 --> 11:26.590
Nhưng điều gì sẽ xảy ra nếu quả bóng thực sự không bay theo hướng đó?

11:26.590 --> 11:27.310
Cái gì đang bay vậy?

11:27.310 --> 11:28.480
Điều gì sẽ xảy ra nếu nó bay theo hướng đó?

11:28.750 --> 11:34.180
Vấn đề là, từ một hình ảnh này, bạn không thể biết nó đang bay theo hướng nào bởi vì bạn không biết

11:34.180 --> 11:36.340
nó đã ở đâu trong thời điểm trước đó.

11:36.340 --> 11:39.060
Vì vậy, nếu nó ở đây, thì nó đang bay cái này.

11:39.150 --> 11:43.690
Vì vậy, nếu bạn đã có nếu bạn biết khoảnh khắc trước đó đúng lúc, nếu bạn biết rằng nó ở đây thì bạn đang ở đây,

11:43.690 --> 11:45.400
bây giờ bạn biết đấy, đây là một con người.

11:45.400 --> 11:48.640
Bạn chỉ cần vẽ một đường thẳng từ hai cái này và bạn sẽ giống như, Ồ, thật tuyệt, vì vậy nó sẽ đi theo hướng này.

11:48.640 --> 11:52.270
Nhưng nếu bạn biết nó ở đây, bạn sẽ vẽ một đường thẳng tới những khán đài này theo hướng này.

11:52.270 --> 11:54.250
Hơn nữa, hãy nhìn vào điều này.

11:54.250 --> 11:57.010
Nó có thể đã thực sự ở một nơi nào đó giống như ở đây.

11:57.010 --> 11:59.500
Có thể nó đang đi lên, có thể nó thực sự đi theo hướng đó.

11:59.500 --> 12:01.030
Vì vậy, có lẽ nó đã ở đây và tôi đã đi lên.

12:01.240 --> 12:04.540
Vì vậy, chỉ từ một hình ảnh đó là rất khó.

12:04.540 --> 12:05.860
Nó thực sự không thể.

12:05.860 --> 12:10.450
Nó giống như hình học không thể nói quả bóng đang bay theo hướng nào.

12:10.450 --> 12:17.830
Và đó là lý do tại sao lần cuối cùng bộ nhớ thực sự thực sự giúp ích cho thuật toán mà không cần bộ nhớ, bạn vẫn có

12:17.830 --> 12:22.450
thể làm tốt công việc, nhưng nó có thể giống như phỏng đoán hoặc, bạn biết đấy,

12:22.450 --> 12:27.640
hãy tìm những cách khác để hiểu về vị trí, nhưng với sự quý trọng của chỉ một kỷ niệm.

12:27.640 --> 12:33.790
Vì vậy, nếu chúng ta quay trở lại ngay cả với một giá trị đó, thì, đó là loại giống như kết quả của

12:34.150 --> 12:40.270
giá trị trước đó hoặc có thể bạn có thể lưu trữ nó ở đây hoặc dựa trên giá trị này, như dựa trên

12:40.270 --> 12:43.180
thông tin mà nó nhận được từ thời điểm trước đó.

12:43.180 --> 12:47.980
Vì vậy, hãy nói từ những gì đã xảy ra ở đây, vì vậy đó là nơi bóng của bạn trước đây.

12:47.980 --> 12:53.110
Vì vậy, bạn có thể truyền thông tin về môi trường từ thời điểm trước đó qua đây, rồi bây giờ

12:53.110 --> 12:54.100
bạn có nó.

12:54.100 --> 13:00.490
Giờ đây, bạn không chỉ có thông tin của mình từ hình ảnh, nếu chúng ta quay lại xa hơn nữa, bạn sẽ

13:00.490 --> 13:02.740
nhớ thông tin đó từ hình ảnh.

13:02.740 --> 13:07.060
Chà, đây là sự diệt vong, nhưng chúng tôi thực sự đang làm việc với thông tin đột phá từ

13:07.060 --> 13:09.910
hình ảnh đến đây, đây, đây, biến thành những giá trị phẳng này.

13:09.910 --> 13:13.240
Và đó là thông tin từ hình ảnh đi vào hệ thống.

13:13.240 --> 13:20.320
Và bây giờ đột nhiên, như bạn nhớ đến từ không phải từ đâu đó, mà là từ thời điểm

13:20.320 --> 13:21.220
trước đó.

13:21.220 --> 13:24.340
Vì vậy, đó là lý do tại sao bạn không thể thực sự chứng minh là đến từ hoàn toàn, mà là từ quả bóng và từ trái

13:24.340 --> 13:24.490
phải.

13:24.490 --> 13:28.300
Nó thực sự chỉ là nó chỉ nằm trong lớp lshtm.

13:28.300 --> 13:31.540
Bạn có thông tin đó chỉ thông qua kiến trúc của hệ thống.

13:31.540 --> 13:33.790
Bạn có thông tin về những gì đã xảy ra trước đó.

13:33.880 --> 13:41.920
Và vì vậy, chúng tôi quay trở lại rằng thông tin ở đây giúp bạn đưa ra quyết định phải làm gì, giúp thuật toán đưa ra quyết

13:41.920 --> 13:45.420
định và bây giờ đột nhiên nó biết rằng, ồ, được rồi.

13:45.430 --> 13:51.040
Vì vậy, quả bóng thực sự đang nằm trong hoặc giả sử nó đang bay theo hướng này hoặc theo hướng này.

13:51.040 --> 13:53.170
Vì vậy, tôi đang ở đúng nơi, vì vậy tôi nên gắn bó quanh đây.

13:53.170 --> 13:54.610
Quả bóng đang đến theo hướng của tôi.

13:54.610 --> 13:58.510
Hoặc nếu nó nhận ra rằng quả bóng đang bay ở đó, nó nên bắt đầu di chuyển sang trái,

13:58.510 --> 14:01.690
vì nếu nó đợi lâu hơn một chút, sẽ quá muộn và nó sẽ trượt bóng.

14:01.690 --> 14:08.560
Vì vậy, về cơ bản đó là cách lớp lshtm thực sự giúp ích trong thuật toán này và đó chính xác là những gì chúng ta

14:08.560 --> 14:12.200
sẽ thấy khi bạn thực hiện các hướng dẫn thực tế với Adland.

14:12.220 --> 14:12.940
Vậy là xong.

14:12.970 --> 14:14.260
Đó là cách hoạt động của nhóm này.

14:14.260 --> 14:20.680
Và chỉ cần một lưu ý bổ sung, như chúng tôi đã đề cập ở phần đầu, Ellis Times không cần thiết 100%.

14:20.680 --> 14:25.330
Chúng không hoàn chỉnh giống như chúng không hoàn toàn gắn liền với thuật toán này.

14:25.330 --> 14:27.910
Bạn có thể muốn có chúng trong đó, thuật toán a3c.

14:27.910 --> 14:31.030
Bạn có thể không muốn có chúng tùy thuộc vào tình huống, tùy thuộc vào kiến trúc bạn chọn.

14:31.030 --> 14:37.270
Có rất nhiều bổ sung và chúng ta đã thảo luận về việc bổ sung hoặc sửa đổi trong đó mạng nơ-ron được chia sẻ giữa

14:37.270 --> 14:40.750
các tác nhân hoặc không được chia sẻ giữa các tác nhân hay không.

14:40.750 --> 14:41.860
Bây giờ dù sao.

14:41.860 --> 14:47.830
Lshtm có một cái khác mà bạn sẽ thấy trong các hướng dẫn thực tế, nơi chúng tôi thêm entropy, được tính toán trong suốt thời gian

14:47.830 --> 14:51.010
mất chính sách và Adlon sẽ hướng dẫn bạn thực hiện điều đó.

14:51.010 --> 14:56.920
Vì vậy, về cơ bản có rất nhiều sửa đổi khác nhau có thể xảy ra trong một thuật toán.

14:57.250 --> 14:59.230
Chỉ cần nhớ rằng nó phụ thuộc vào.

14:59.380 --> 15:00.460
Những gì bạn muốn đạt được.

15:00.460 --> 15:05.650
Và đó cũng là thứ khuyến khích bạn khám phá nếu bạn định triển khai nhiều thứ

15:05.650 --> 15:08.140
này và thử các thuật toán khác nhau.

15:08.890 --> 15:14.800
Chúng tôi đã thảo luận về một số vấn đề và có thể bạn có thể tìm thấy một số sửa đổi bổ sung mà bạn có thể

15:14.800 --> 15:15.310
quan tâm.

15:15.460 --> 15:20.350
Hoặc có thể khi bạn đang xem những hướng dẫn này, có thể sau đó nhiều sửa đổi đã được đưa ra

15:20.350 --> 15:21.250
rất thú vị.

15:21.250 --> 15:27.310
Vì vậy, chắc chắn đó là thứ mà bạn có thể xem xét và điều đó có thể nâng cao hơn nữa kiến thức của bạn

15:27.310 --> 15:30.460
về trí tuệ nhân tạo và cách tạo ra các thuật toán này.

15:30.490 --> 15:34.030
Và trên lưu ý đó, tôi hy vọng bạn thích bài hướng dẫn hôm nay và tôi mong bạn sẽ được gặp bạn lần sau.

15:34.060 --> 15:35.250
Cho đến lúc đó, hãy tận hưởng.

15:35.250 --> 15:35.650
TÔI.
