WEBVTT

00:00.420 --> 00:01.260
คุณพร้อมไหม?

00:01.290 --> 00:02.300
ลงมือทำกันเถอะ.

00:02.310 --> 00:05.970
เริ่มต้นด้วยการติดตั้งการพึ่งพาระบบทั้งหมดเพื่อภูมิปัญญา

00:06.000 --> 00:12.510
คลิกปุ่มเล่นนี้ และตอนนี้มันจะติดตั้งการพึ่งพาทั้งหมด ดังที่คุณเห็น เช่น pillow หรือ

00:12.510 --> 00:18.150
psi, pi และการอ้างอิงอื่นๆ ที่จำเป็นสำหรับการเรียกใช้สิ่งนี้ให้สำเร็จ

00:18.150 --> 00:22.140
แต่ส่วนที่เหลือทั้งหมดเช่น pytorch มีการติดตั้งโมดูลยิมแล้ว

00:22.140 --> 00:23.070
มันเยี่ยมมากจริงๆ

00:23.070 --> 00:32.040
นั่นเป็นความสวยงามของ Google CoLab และนั่นก็ต้องขอบคุณการที่พวกคุณจะไม่มีปัญหาในการรันโค้ดและการแสดงภาพผลลัพธ์สุดท้าย

00:32.430 --> 00:32.760
ไม่เป็นไร.

00:32.760 --> 00:35.250
นี่จะใช้เวลาหนึ่งหรือ 2 นาทีจริงๆ

00:35.250 --> 00:41.430
ดังนั้น ฉันจะไปข้างหน้าอย่างรวดเร็วที่นี่ แล้วพบกันเร็ว ๆ นี้สำหรับการดำเนินการที่เหลือของรหัส

00:42.820 --> 00:43.420
ไม่เป็นไร.

00:43.420 --> 00:46.240
ดูเหมือนว่าเราจะสิ้นสุดการติดตั้งระบบ

00:46.240 --> 00:53.680
การพึ่งพาอาศัย อย่างที่คุณเห็น กำลังดาวน์โหลด ติดตั้งในขณะที่รวบรวมความต้องการที่เหมาะสมทั้งหมด

00:53.680 --> 00:58.180
และในเวลาไม่กี่วินาทีก็ควรทำอย่างถูกต้อง

00:58.180 --> 00:59.800
และมาดูกัน

00:59.800 --> 01:01.360
สาม สอง.

01:01.360 --> 01:02.140
เราจะไปที่นั่น.

01:02.140 --> 01:03.910
ติดตั้งทุกอย่างเรียบร้อยแล้ว

01:03.910 --> 01:05.260
ไม่ต้องกังวลกับข้อผิดพลาดเหล่านี้ที่นี่

01:05.260 --> 01:11.050
สิ่งเหล่านี้จะไม่ส่งผลกระทบต่อการทำงานของโค้ด แต่ทุกอย่างได้รับการติดตั้งสำเร็จตามที่เราต้องการ

01:11.050 --> 01:13.450
เอาล่ะ ขั้นตอนต่อไป

01:13.450 --> 01:14.770
สำคัญมาก.

01:14.800 --> 01:16.600
ดูโหนดที่สำคัญนี้

01:16.600 --> 01:24.010
มันบอกว่าหลังจากติดตั้งการพึ่งพาทั้งหมด โดยทั่วไปหลังจากดำเนินการเซลล์แรกนี้ที่นี่ คุณต้องรีสตาร์ทรันไทม์ของคุณ

01:24.010 --> 01:26.560
มิฉะนั้น คุณจะได้รับข้อผิดพลาดในการดำเนินการที่นี่

01:26.560 --> 01:27.610
เลยรีบทำกัน

01:27.610 --> 01:28.390
มันง่ายมาก

01:28.390 --> 01:33.910
คุณเพียงแค่ต้องคลิกรันไทม์ที่นี่ จากนั้นรีสตาร์ทรันไทม์ จากนั้นใช่ ตกลง

01:33.910 --> 01:35.500
การดำเนินการนี้จะคืนค่ารันไทม์ของคุณ

01:35.500 --> 01:40.480
และตอนนี้คุณก็สามารถดำเนินการเซลล์เหล่านี้ทั้งหมดได้โดยคลิกที่ปุ่มเล่น

01:40.480 --> 01:44.800
มาทำสิ่งนี้กัน เริ่มด้วยการประมวลผลภาพไฟล์แรกนี้ก่อน

01:44.830 --> 01:51.370
เอาล่ะ เรามานำเข้าไลบรารี่ก่อน จากนั้นจึงประมวลผลภาพล่วงหน้าด้วยคลาสอิมเมจพรีโพรเซส

01:51.370 --> 01:58.570
และตอนนี้เราได้ย้ายไปยังการใช้งานการเล่นซ้ำของประสบการณ์ซึ่งหมายถึงอันนี้

01:58.570 --> 02:00.340
เอาล่ะ เรามาทำกัน

02:00.340 --> 02:05.140
ก่อนอื่นเรานำเข้าไลบรารี จากนั้นเราจะกำหนดหนึ่งขั้นตอนของสภาพแวดล้อม

02:05.170 --> 02:14.770
จากนั้นเราจะสร้างความคืบหน้าในหลายขั้นตอนและขั้นตอนด้วยคลาส Step Progress เหมือนกับที่เรามีในโฟลเดอร์

02:14.830 --> 02:20.500
จากนั้นเราใช้การเล่นซ้ำของประสบการณ์โดยการสร้างคลาสหน่วยความจำเล่นซ้ำนี้

02:20.500 --> 02:21.940
ดีทุกอย่าง

02:21.940 --> 02:30.160
และตอนนี้เราไปยังไฟล์ที่สาม ไฟล์นี้ ฉันทำฉันด้วย py และเรานำเข้าไลบรารีก่อน

02:31.100 --> 02:31.940
แล้ว.

02:31.940 --> 02:32.240
ไม่เป็นไร.

02:32.240 --> 02:37.280
ดังนั้นจะใช้เวลาเล็กน้อยที่นี่ เพราะเรานำเข้าโมดูลคบเพลิงทั้งหมด จากนั้นเรานำเข้าแพ็คเกจสำหรับ

02:37.280 --> 02:38.820
openai และ doom

02:38.840 --> 02:41.990
ด้วยยิมและ Wisdom Gym และแร็ปเปอร์

02:42.320 --> 02:43.310
ดีมาก

02:43.310 --> 02:48.800
จากนั้นเราก็ไปต่อกันที่ส่วนหนึ่ง สร้าง AI ที่เราจะสร้างสมอง ต่อด้วยร่างกาย

02:48.800 --> 02:51.380
และประกอบทุกอย่าง

02:51.380 --> 02:55.610
ก่อนอื่นเรามาทำให้สมองดีกับคลาส CNN กันก่อน

02:55.700 --> 03:04.580
จากนั้นมาทำ body ด้วย soft max body class แล้วมาทำ AI กับ class กัน

03:04.730 --> 03:05.210
ไม่เป็นไร.

03:05.210 --> 03:06.260
ดีมาก

03:06.260 --> 03:12.350
และตอนนี้เราได้ไปยังส่วนที่สองแล้ว ซึ่งเราจะฝึก AI ด้วยการเรียนรู้เชิงลึกและพลิกผัน

03:12.590 --> 03:12.950
ไม่เป็นไร.

03:12.950 --> 03:15.200
เหมือนกับที่เรามีอยู่ตรงนี้

03:15.380 --> 03:19.130
อันดับแรก เราได้รับสภาพแวดล้อมของ Doom ด้วยโมดูลใหม่ของเราที่มีหลุมฝังศพ

03:19.130 --> 03:20.270
ไม่ต้องกังวลเกี่ยวกับเรื่องนี้

03:20.270 --> 03:21.560
นี่ไม่ใช่ข้อผิดพลาด

03:21.650 --> 03:27.620
จากนั้นเราจะสร้าง AI ด้วยการสร้างวัตถุต่าง ๆ สมอง CNN ร่างกายของร่างกายสูงสุด

03:27.620 --> 03:31.010
และ AI ทั้งหมดที่มีสมองและร่างกาย

03:31.010 --> 03:31.430
ไม่เป็นไร.

03:31.430 --> 03:32.300
ฉันดำเนินการนี้หรือไม่

03:32.300 --> 03:32.870
ใช่.

03:33.110 --> 03:39.800
จากนั้นเราตั้งค่าประสบการณ์ เล่นซ้ำและขั้นตอน และหน่วยความจำเป็นหน่วยความจำเล่นซ้ำตามวัตถุประสงค์

03:39.800 --> 03:42.950
จากนั้นเราใช้การติดตามคุณสมบัติ

03:43.220 --> 03:43.730
ไม่เป็นไร.

03:43.730 --> 03:45.320
เพื่อปรับปรุงประสิทธิภาพ

03:45.620 --> 03:50.120
จากนั้นเราสร้างเส้นค่าเฉลี่ยเคลื่อนที่ 100 ขั้นด้วยคลาส MA

03:50.120 --> 03:52.490
สุดท้ายนี้เพื่อนๆ พร้อมกันรึยังคะ?

03:52.490 --> 03:57.260
ตอนนี้ถึงเวลาแล้ว ในส่วนที่น่าตื่นเต้นมาก ที่เราจะฝึก AI

03:57.260 --> 03:58.520
มากกว่า 20 ยุค

03:58.520 --> 04:01.430
เอาล่ะ คุณจะเห็นว่ามันยาวไปหน่อย

04:01.430 --> 04:05.780
คุณก็รู้ มันจะใช้เวลาราวๆ 1 หรือ 2 ชั่วโมง เพราะฉันเพิ่มขนาด

04:05.780 --> 04:09.770
อย่าลังเลที่จะลดขนาดกลับเป็น 80 คูณ 80 หากคุณพบว่ามันยาวเกินไป

04:09.770 --> 04:13.100
แต่เชื่อฉันสิ คุณจะมีวิดีโอที่ดีขึ้นมากด้วยมิติข้อมูลเหล่านี้

04:13.910 --> 04:15.620
แล้วคุณล่ะพร้อมหรือยัง?

04:15.620 --> 04:20.450
ลองทำกันในสาม สอง หนึ่ง ไป

04:20.450 --> 04:24.140
เอาล่ะ นี่จะรันโค้ดของการฝึก

04:24.140 --> 04:30.020
และในไม่กี่วินาที เราก็จะสามารถเห็นยุคแรก ซึ่งแน่นอนว่าจะต้องได้รับผลตอบแทนในทางลบ

04:30.020 --> 04:36.380
แต่คุณจะเห็นว่าตลอดช่วงเวลานั้น รางวัลจะเพิ่มขึ้นทีละน้อยจนกว่าจะถึงรางวัลที่เป็นบวก

04:36.380 --> 04:40.220
จากนั้นจนกว่าจะถึงรางวัลนับร้อย

04:40.220 --> 04:42.230
เรามาตั้งเป้ากันที่จริง

04:42.230 --> 04:48.920
หวังว่าด้วย 20 epoch เราจะมีรางวัลสุดท้ายที่ระดับ 100 เช่น 100 หรือ 200 หรือ 300

04:48.920 --> 04:53.240
เพราะด้วยรางวัลเหล่านี้ ฉันได้ทดลองกับมันจริงๆ

04:53.240 --> 04:53.450
ใช่.

04:53.450 --> 04:56.990
ยุคแรก ผลตอบแทนเชิงลบ -98

04:56.990 --> 05:02.960
ฉันก็เลยบอกว่าด้วยรางวัลที่ประมาณ 100, 203 ร้อย เราจะได้ผลลัพธ์ที่ยอดเยี่ยมอยู่แล้ว

05:02.960 --> 05:10.010
คุณรู้ไหม เราจะเห็นว่า AI จัดการฆ่าสัตว์ประหลาดบางตัวหรือหลีกเลี่ยงพวกมัน หรือคุณจะรู้ว่ากำลังเคลื่อนเข้าหาเสื้อกั๊ก

05:10.700 --> 05:14.360
นั่นคือยุคแรก ยุคที่หนึ่ง -98

05:14.360 --> 05:18.740
แล้วคุณจะรู้ว่าเราจะเห็นยุคที่สองซึ่งอาจมีรางวัลที่ดีกว่าอยู่แล้ว

05:18.740 --> 05:21.620
แต่คุณรู้ไหม ในตอนแรก แน่นอนว่า AI ไม่ได้รับการฝึกฝน

05:21.620 --> 05:23.510
เป็นการสำรวจสิ่งแวดล้อม

05:23.510 --> 05:23.750
ถูกต้อง.

05:23.750 --> 05:28.610
จำการประนีประนอมในการเรียนรู้แบบเสริมกำลัง การสำรวจกับการแสวงประโยชน์ได้หรือไม่

05:28.610 --> 05:33.170
ในตอนแรก AI กำลังสำรวจอย่างหมดจด จากนั้นมันก็จะฝึกฝน จากนั้นมันก็จะฉลาดขึ้นและฉลาดขึ้น

05:33.170 --> 05:37.850
และนั่นคือตอนที่มันจะได้รับรางวัลสูง

05:37.850 --> 05:41.000
ดังนั้นจึงเป็นเรื่องปกติที่จะมีรางวัลเชิงลบในตอนเริ่มต้น

05:41.000 --> 05:46.700
บางทีเราอาจจะได้รับสิ่งนั้นในช่วง 3/1 แต่คุณจะเห็นว่าหลังจากยุคที่สี่หรือห้าหรือหก

05:46.700 --> 05:54.380
ดี เราจะเริ่มไปถึงรางวัลที่เป็นบวก และหวังว่าจะได้รางวัลที่ประมาณ 102 ร้อยหรือ 300

05:55.040 --> 05:57.560
ดังนั้นมันจะใช้เวลาสักครู่อย่างที่ฉันพูด

05:57.560 --> 06:02.510
ดังนั้นเราจะไม่อยู่ที่นี่เป็นเวลา 2 ชั่วโมงมิฉะนั้นฉันจะพูดอะไรไม่ออก

06:02.510 --> 06:08.030
สิ่งที่ฉันจะทำคือตอนนี้ฉันจะใส่เพลงที่สนุกหรือเจ๋งๆ

06:08.030 --> 06:10.790
และก็มาถึงยุคที่สอง -62

06:10.820 --> 06:12.200
ดังนั้นจึงมีการปรับปรุงบ้างแล้ว

06:12.200 --> 06:12.620
ดีแล้ว.

06:12.620 --> 06:18.380
แต่คุณจะเห็นว่าจะมีการปรับปรุงที่ดียิ่งขึ้นไปอีกเมื่อเราก้าวหน้าในยุคนั้นมากขึ้น

06:18.980 --> 06:20.030
เมื่อกี้ฉันพูดว่าอะไรนะ?

06:20.030 --> 06:25.460
ใช่ ฉันจะใส่เพลงเจ๋งๆ ตอนนี้และเล่นการฝึกในโหมดเร่งความเร็ว

06:25.460 --> 06:30.350
และแน่นอน เจอกันตอนท้ายการฝึกเพื่อดูผลสุดท้าย

06:30.350 --> 06:30.980
ไม่เป็นไร.

06:30.980 --> 06:32.030
ดังนั้นเราจึงไป

06:32.030 --> 06:35.060
สาม สอง หนึ่ง ไปเลย

07:20.030 --> 07:20.810
ไม่เป็นไร.

07:20.810 --> 07:22.610
และนี่คือช่วงสุดท้ายของการฝึก

07:22.610 --> 07:23.600
ยินดีด้วย.

07:23.600 --> 07:30.170
คุณฝึกรูปแบบการเรียนรู้ที่ลึกซึ้งและพลิกผันบนแอปพลิเคชันที่ท้าทายมาก ซึ่งก็คือการเล่นเกมแห่งการลงโทษ

07:30.570 --> 07:32.130
แล้วจะพูดอะไรเป็นอย่างแรก?

07:32.130 --> 07:37.290
อย่างที่เราหวังไว้ เราได้รางวัลโดยเฉลี่ยที่มากกว่า 100

07:37.470 --> 07:43.340
สิ่งที่สำคัญที่จะพูดก็คือ แน่นอนว่า ในยุคที่มากขึ้น คุณจะได้รับรางวัลที่สูงขึ้น

07:43.350 --> 07:49.470
ตัวอย่างเช่น หากคุณพร้อมที่จะฝึกฝนโมเดลนี้สำหรับยุคต่างๆ มากขึ้น เช่น 100 ยุคหรือมากกว่านั้น

07:49.470 --> 07:54.600
เพื่อให้ได้รางวัลมากขึ้นประมาณ 304 แสน 500 หรือแม้กระทั่ง 1,000

07:54.600 --> 07:55.980
รู้สึกอิสระที่จะทำมัน

07:55.980 --> 08:00.570
ตัวอย่างเช่น คุณสามารถปล่อยให้มันวิ่งข้ามคืนในขณะที่คุณนอนหลับ และเมื่อคุณตื่นนอนตอนเช้า

08:00.570 --> 08:02.220
คุณจะได้ผลลัพธ์ที่ดีขึ้น

08:02.250 --> 08:05.550
โปรดทราบว่าคุณสามารถใช้ GPU ในรันไทม์ได้ใช่ไหม

08:05.550 --> 08:10.500
หากคุณเปลี่ยนประเภทรันไทม์ซึ่งฉันไม่ควรทำเพราะไม่เช่นนั้นโน้ตบุ๊กจะรีสตาร์ท

08:10.500 --> 08:20.280
แต่ใน hardware accelerator คุณสามารถเลือก GPU หรือ CPU ได้ แต่นั่นก็ต่อเมื่อคุณต้องการเพิ่มประสิทธิภาพการทำงานและฝึกฝนอย่างหนัก

08:20.280 --> 08:25.200
แต่ที่นี่ฉันแค่ใช้สิ่งที่คลาสสิกเพราะฉันต้องการแสดงให้คุณเห็นถึงวิธีการดำเนินการทั้งหมดนี้

08:25.200 --> 08:26.220
และเราไปที่นั่น

08:26.220 --> 08:32.860
ตอนนี้เราจะดำเนินการส่วนที่เหลือของเวิร์กบุ๊กด้วยโค้ดพิเศษนี้เฉพาะสำหรับเคอร์เนลหนังสือนี้

08:32.880 --> 08:36.210
ซึ่งแน่นอนว่าเราจะเห็นภาพการทำงานของ AI

08:36.480 --> 08:37.440
เอาล่ะ เรามาทำกัน

08:37.440 --> 08:39.810
ขั้นแรกให้นำเข้าไลบรารี

08:39.810 --> 08:40.380
ถูกต้อง.

08:40.380 --> 08:41.250
ทั้งหมดดี.

08:41.430 --> 08:46.110
จากนั้นเราจะพิมพ์รูปร่างอินพุตและการกระทำที่เป็นไปได้จำนวนหนึ่ง

08:46.110 --> 08:46.470
ไม่เป็นไร.

08:46.470 --> 08:52.800
ดังนั้น เราจะได้รู้ว่ามีการดำเนินการที่เป็นไปได้เจ็ดอย่างในสภาพแวดล้อม Doom Corridor

08:52.800 --> 08:57.840
สิ่งเหล่านี้คือเดินหน้า ถอยหลัง ไปทางซ้าย ไปทางขวา ยิง

08:57.840 --> 09:00.420
แล้วก็อาจจะป้องกันตัวเองหรืออะไรก็ตาม

09:00.420 --> 09:03.570
ฉันไม่รู้ว่าการกระทำสุดท้ายคืออะไร แต่อะไรทำนองนั้น

09:03.570 --> 09:07.470
นี่คือขนาดของกรอบอินพุต

09:07.470 --> 09:09.420
ซึ่งสอดคล้องกับความสูงของเฟรม

09:09.420 --> 09:11.580
มีความสูง 240 พิกเซล

09:11.610 --> 09:14.550
นี้สอดคล้องกับความกว้างของกรอบใช่ไหม?

09:14.550 --> 09:17.010
มีขนาดใหญ่ 320

09:17.010 --> 09:25.580
และนั่นก็สอดคล้องกับ ความจริงที่ว่าเราทำงานกับรูปภาพที่มีสี และทั้งสามส่วนนี้สอดคล้องกับองค์ประกอบทั้งสามของช่องของเรา

09:25.860 --> 09:32.040
เอาล่ะ เรามาดำเนินการในเซลล์ถัดไป โดยแสดงกรอบของสภาพแวดล้อมเพื่อดูว่าเป็นอย่างไร

09:32.040 --> 09:37.170
และอย่าลืมว่าการดูสภาพแวดล้อมที่คุณทำงานด้วยนั้นมีประโยชน์ใช่ไหม

09:37.170 --> 09:43.200
ที่นี่เราเห็นว่าเราอยู่ใน Doom Corridor แต่ถ้าคุณต้องการทดลองกับสภาพแวดล้อมเพิ่มเติมที่นี่

09:43.200 --> 09:48.510
ที่จริงแล้ว อย่าลืมว่าสิ่งเหล่านี้ก็อยู่ในหน้าหลักที่นี่ด้วย

09:48.510 --> 09:48.960
ที่นี่.

09:48.960 --> 09:49.200
ใช่.

09:49.200 --> 09:53.280
คุณมีรายชื่อสภาพแวดล้อมทั้งหมดที่ฉันแนะนำให้ทำการทดลอง

09:53.280 --> 09:56.430
ดังนั้นหากต้องการดูอย่างอื่น

09:56.430 --> 09:58.230
คุณก็รู้ ฉันสามารถแสดงให้คุณเห็นได้จริงๆ

09:58.230 --> 10:02.760
เอาอันนี้มา แล้วฉันจะกลับไปที่ทางเดินแห่งความหายนะนี้

10:02.790 --> 10:03.240
ถูกต้อง.

10:03.240 --> 10:06.810
ดังนั้นถ้าฉันแทนที่ด้วยอันนี้

10:07.500 --> 10:10.290
ใช่และฉันทำสิ่งนี้ได้ดี

10:10.290 --> 10:12.290
เราจะได้รับสามการกระทำในครั้งนี้

10:12.300 --> 10:17.610
แน่นอนว่ามันง่ายกว่า และถ้าเราดำเนินการเซลล์นี้ได้ดี เราจะเห็นสภาพแวดล้อมนี้ใช่ไหม

10:17.610 --> 10:23.550
ดังนั้นจึงเป็นเพียงวิธีหนึ่งในการดูสิ่งที่คุณกำลังทำงานด้วยอย่างรวดเร็ว และดูตัวอย่าง โดยพื้นฐานแล้ว

10:23.550 --> 10:26.190
ว่า AI จะทำอะไรในสภาพแวดล้อม

10:26.400 --> 10:26.760
ไม่เป็นไร.

10:26.760 --> 10:29.220
กลับไปที่ Wisdom Corridor กัน

10:29.250 --> 10:34.080
มาดำเนินการนี้อีกครั้งในกรณีที่เราต้องการสำหรับเซลล์ถัดไป

10:34.110 --> 10:37.230
เอาล่ะ ทางเดินแห่งความหายนะที่สมบูรณ์แบบ

10:37.260 --> 10:39.720
ตอนนี้ไปที่เซลล์สุดท้าย

10:39.720 --> 10:43.620
นี่คือฟังก์ชันตัวช่วยที่จะใช้สำหรับการแสดงภาพ

10:43.620 --> 10:48.090
ลองใช้เซลล์นี้และเรียกใช้ AI ในตอนเดียว

10:48.090 --> 10:59.670
และที่นี่คุณจะสามารถเข้าใจโค้ดได้เพราะว่าโดยพื้นฐานแล้วมันเป็นกระบวนการออกอากาศในตอนเต็มซึ่งในแต่ละขั้นตอนจะอยู่ในสถานะเฉพาะก็จะเล่นการกระทำภายในสถานะแล้ว

10:59.670 --> 11:04.950
มันจะได้รับรางวัลแล้วไปถึงสถานะต่อไปใช่มั้ย?

11:04.950 --> 11:07.440
นี่คือกระบวนการ MDP แบบคลาสสิกใช่ไหม

11:07.440 --> 11:09.000
กระบวนการตัดสินใจของมาร์คอฟ

11:09.000 --> 11:09.960
ดังนั้นเราจึงไป

11:09.960 --> 11:11.580
จบไปหนึ่งตอน

11:11.580 --> 11:19.620
และสุดท้าย เราจะได้วิดีโอการเล่นเกมของ AI ของเรา ซึ่งได้รับการฝึกฝนมาในราคา 20 เหรียญ ได้รับรางวัลมากกว่า

11:19.620 --> 11:26.040
100 รางวัล ซึ่งจะทำให้เราได้ผลลัพธ์ที่ค่อนข้างดี แต่อาจจะไม่ถึงที่สุด

11:26.040 --> 11:26.880
แต่ก็ไม่เป็นไร

11:26.880 --> 11:28.680
คุณจะทดลองด้วยตัวเอง

11:28.680 --> 11:35.340
และตอนนี้ ฉันต้องการให้คุณคลิกปุ่มแบบเต็มที่นี่ เพราะฉันจะแสดงให้คุณเห็นว่าวิดีโอมีการบรรจุอย่างไร

11:35.340 --> 11:41.400
นี่คือโฟลเดอร์บางโฟลเดอร์ที่มีองค์ประกอบบางอย่าง เช่น เฟรม เฟรมของผลลัพธ์ หรือ

11:41.400 --> 11:42.720
JS และไฟล์บางไฟล์

11:42.720 --> 11:45.600
แต่สิ่งที่เราสนใจจริงๆ คือวิดีโอสุดท้าย

11:45.600 --> 11:52.110
และเพื่อให้ได้มันมา เราแค่ต้องคลิกปุ่มเล่นที่นี่ แล้วคุณจะพบว่ามันจะถูกใส่ลงในโฟลเดอร์หลักที่นี่

11:52.110 --> 11:53.670
อย่าพลาดและไม่เป็นไร

11:53.670 --> 11:57.420
คุณรู้ไหม ดูเหมือนว่าเซลล์จะถูกดำเนินการแล้ว ซึ่งเป็นกรณีนี้

11:57.420 --> 11:59.220
แต่คุณจะเห็นว่าในไม่กี่วินาที

11:59.220 --> 12:03.840
เราจะเห็นไฟล์ AVI ซึ่งเป็นไฟล์วิดีโอที่บรรจุอยู่ที่นี่

12:03.840 --> 12:05.640
มันจะปรากฏขึ้นใน 10 วินาที

12:05.640 --> 12:08.010
ฉันสามารถทำนับถอยหลังได้ถ้าคุณต้องการ

12:08.010 --> 12:09.150
ลองทำสิ่งนี้กัน

12:09.150 --> 12:20.970
และสิบ เก้า แปด เจ็ด หก ห้า สี่ สาม สอง หนึ่ง ไป

12:21.710 --> 12:24.050
และตอนนี้ก็ควรจะปรากฏในไม่กี่วินาที

12:24.050 --> 12:24.890
ใช่ เราไปกันเลย

12:25.040 --> 12:25.460
ไม่เป็นไร.

12:25.460 --> 12:26.570
ดังนั้นเกมตัวแทน

12:26.570 --> 12:27.500
เล่นเลยเอวี

12:27.500 --> 12:28.400
นั่นคือวิดีโอของคุณ

12:28.400 --> 12:36.740
มาดาวน์โหลดกันและมันจะถูกดาวน์โหลดลงในคอมพิวเตอร์ของคุณ ซึ่งฉันจะหาได้ที่นี่

12:36.740 --> 12:37.030
ถูกต้อง.

12:37.040 --> 12:38.810
นั่นคือวิดีโอเกมตัวแทน

12:38.810 --> 12:39.800
เล่นเอฟบีไอ

12:39.830 --> 12:44.060
อย่าลืมเปิดด้วยเครื่องเล่นวิดีโอที่มีตัวแปลงสัญญาณเช่น VLC

12:44.090 --> 12:44.450
ถูกต้อง.

12:44.450 --> 12:49.070
มันจะไม่ทำงานกับโปรแกรมเล่น Quicktime หากคุณใช้ Mac แต่จะใช้งานได้กับ VLC อย่างแน่นอน

12:49.100 --> 12:52.190
ลองมาดูและนี่คือวิดีโอ

12:52.190 --> 12:52.550
ไม่เป็นไร.

12:52.550 --> 12:55.040
ขอผมกดหยุดตรงนี้

12:55.250 --> 12:55.520
ไม่เป็นไร.

12:55.520 --> 12:56.210
นี่คือวิดีโอ

12:56.210 --> 13:01.460
และอย่างที่คุณเห็น นี่คือขนาดเฟรม 256 x 256

13:01.460 --> 13:03.050
อย่างที่คุณเห็นมันไม่ใหญ่มาก

13:03.050 --> 13:03.320
ถูกต้อง.

13:03.320 --> 13:08.210
นั่นเป็นเหตุผลที่ฉันต้องการทำงานกับมิติข้อมูลเหล่านี้แทน 80 คูณ 80

13:08.630 --> 13:10.070
ทีนี้มาดูวิดีโอกัน

13:10.070 --> 13:15.920
ดังนั้นนี่คือ AI ที่กำลังเล่น Doom ในตอนเดียวและต้องหลีกเลี่ยงมอนสเตอร์ไม่ให้ถูกฆ่า

13:15.920 --> 13:17.990
มันต้องก้าวไปข้างหน้าเพื่อไปถึงเสื้อกั๊ก

13:17.990 --> 13:19.400
เรามาดูกันว่ามันทำอย่างไร

13:19.400 --> 13:22.280
3 ต่อ 1 ไปเลย

13:23.920 --> 13:24.460
ไม่เป็นไร.

13:24.460 --> 13:27.850
อย่างแรกเลย มันโดนยิง มันเคลื่อนที่ไปข้างหน้า โอเค?

13:27.940 --> 13:29.920
แล้วมันก็โดนพวกมอนสเตอร์ฆ่า

13:29.920 --> 13:31.510
แต่นั่นก็ยังค่อนข้างดี

13:31.510 --> 13:37.870
รู้ไหม มันเข้าใจดีว่าต้องก้าวไปข้างหน้าสู่เสื้อกั๊ก เพราะรางวัลสูงสุดได้จากการไปถึงเสื้อกั๊ก

13:38.080 --> 13:42.730
และแน่นอน คุณรู้ไหม ถ้าคุณต้องการดูวิดีโอที่ดวงตาของคุณเอื้อมถึงเสื้อกั๊กและชนะในเกมนี้

13:42.730 --> 13:48.790
โดยพื้นฐานแล้ว คุณจะต้องฝึกสายตาของคุณสำหรับยุคสมัยที่มากขึ้น และอาจต้องปรับปรุงอย่างอื่นด้วย เช่น

13:48.790 --> 13:55.090
การปรับแต่ง สมองของดวงตาของคุณหรือทำการปรับพารามิเตอร์บางอย่างเช่นปรับอัตราการเรียนรู้

13:55.090 --> 14:01.060
คุณมีตัวเลือกมากมายหากคุณได้รับวิดีโอที่น่าอัศจรรย์หรือวิดีโอของ AI ที่ได้รับรางวัลมากกว่า

14:01.060 --> 14:03.820
1,000 รายการ

14:03.820 --> 14:06.490
อย่าลังเลที่จะแบ่งปันในคำถาม &amp; คำตอบ

14:06.490 --> 14:09.490
ฉันแน่ใจว่านักเรียนคนอื่นๆ จะมีความสุขมากที่ได้รับมัน

14:09.850 --> 14:10.420
ไม่เป็นไร.

14:10.420 --> 14:14.890
ดังนั้น ฉันหวังว่าคุณจะชอบการนำรูปแบบการเรียนรู้ที่ลึกซึ้งและพลิกผันไปใช้

14:14.890 --> 14:25.000
ตอนนี้เราจะไปยังส่วนถัดไป ซึ่งจะเกี่ยวกับการนำโมเดลหลักสามประการไปใช้และรูปแบบที่ดียิ่งขึ้นและมีประสิทธิภาพยิ่งขึ้นซึ่งจะนำไปใช้ในการเล่นเกมแห่งการฝ่าวงล้อม

14:25.000 --> 14:26.800
แล้วพบกันใหม่ในตอนหน้าครับ

14:26.800 --> 14:28.180
และจนกว่าจะถึงตอนนั้น เพลิดเพลิน

14:28.180 --> 14:28.780
ฉัน.