WEBVTT

00:00.390 --> 00:02.710
สวัสดีและยินดีต้อนรับสู่ Intertoto เครื่องเทศ

00:03.000 --> 00:07.800
เอาล่ะในส่วนรหัสใหม่นี้เราจะนำประสบการณ์การเล่น

00:07.920 --> 00:16.700
ดังนั้นเราจะสร้างคลาสใหม่ซึ่งเราจะเรียกใช้หน่วยความจำ replay และจะใช้ประสบการณ์ในการเล่นให้ตรงตามที่คุณเห็นในการบรรยายปรีชา

00:16.890 --> 00:21.540
แต่ก่อนอื่นเรามาเตือนความจำสั้น ๆ เกี่ยวกับสิ่งที่เล่นซ้ำ

00:21.540 --> 00:31.840
เพื่อให้คุณรู้ว่าปัญญาประดิษฐ์ทั้งหมดนี้ตั้งอยู่บนกระบวนการตัดสินใจของมาร์คอฟและกระบวนการตัดสินใจของมาร์คอฟนั้นประกอบด้วยชุดเหตุการณ์

00:32.010 --> 00:38.770
ดังนั้นคุณจึงรู้เหตุการณ์ตัวอย่างเช่นเปลี่ยนจากรัฐหนึ่งไปสู่อีกรัฐหนึ่ง

00:39.060 --> 00:44.410
แต่ถ้าเหตุการณ์เป็นอย่างนั้นตั้งแต่วันรุ่งขึ้นมันมีความสัมพันธ์กับสถานะปัจจุบันมาก

00:44.550 --> 00:46.820
ดีเครือข่ายจะไม่ทำดีมาก

00:46.980 --> 00:54.860
ดังนั้นสำหรับผู้ที่มาจากหลักสูตรการเรียนรู้ลึกนั้นเหมือนกับที่เราได้เรียนรู้อนุกรมเวลาของเราด้วยการจับเวลาเพียงครั้งเดียว

00:55.020 --> 01:03.070
มันไม่ได้เรียนรู้อะไรเลยเพราะการประทับเวลาหนึ่งครั้งไม่เพียงพอสำหรับแบบจำลองเพื่อเรียนรู้ที่จะเข้าใจความสัมพันธ์ระยะยาว

01:03.090 --> 01:07.060
นั่นคือสิ่งเดียวกันและนี่คือสาเหตุที่เราต้องนำประสบการณ์การเล่นซ้ำมาใช้

01:07.230 --> 01:08.230
มันทำงานอย่างไร

01:08.340 --> 01:14.640
มันง่ายมากแทนที่จะพิจารณาเพียงสถานะปัจจุบันที่มีเพียงสถานะเดียวในเวลา t

01:14.680 --> 01:16.830
เราจะพิจารณาเพิ่มเติมในอดีต

01:16.830 --> 01:22.560
เช่นเดียวกับลิเธียมดังนั้นชุดกิจกรรมของเราจะไม่เป็นเช่นนั้น

01:22.560 --> 01:27.450
และฉันคิดว่านี่จะเป็นตัวอย่างหนึ่งร้อยรัฐในอดีต

01:27.450 --> 01:33.770
ดังนั้น T-ลบหนึ่งร้อยแปดสิบลบ 99 ถึงลบ 1 แล้ว S-T

01:34.020 --> 01:40.830
ดังนั้นในคำอื่น ๆ

01:40.830 --> 01:49.950
เราใส่ช่วงการเปลี่ยนภาพน้อยลง 100 ในสิ่งที่เราเรียกว่าหน่วยความจำและนั่นคือเหตุผลที่เรามีหน่วยความจำระยะยาวเมื่อเทียบกับหน่วยความจำระยะสั้นหรือฉันควรจะพูดว่าหน่วยความจำทันที

01:50.310 --> 01:57.690
และเมื่อเราสร้างความทรงจำของเหตุการณ์ 100 ครั้งล่าสุดเราจะง่าย ๆ

01:57.690 --> 02:02.300
ว่ามันจะใช้เวลาช่วงแบทช์ของการเปลี่ยนผ่านเหล่านี้เพื่อทำการอัพเดทครั้งต่อไป

02:02.310 --> 02:13.450
นั่นคือการย้ายครั้งต่อไปของเราโดยการเลือกหัวข้อถัดไปดังนั้นในคลาสหน่วยความจำการเล่นซ้ำที่เรากำลังนำไปใช้เพื่อการเล่นซ้ำเราจะสร้างสามฟังก์ชั่น

02:13.530 --> 02:17.490
ก่อนอื่นฟังก์ชั่นตามปกติเป็นกรณีของคลาสใด

02:17.520 --> 02:27.210
ดังนั้นในฟังก์ชั่นนี้เราจะกำหนดตัวแปรที่จะแนบกับอินสแตนซ์ในอนาคตของคลาสที่เป็นวัตถุในอนาคตที่จะถูกสร้างขึ้นจากคลาสนี้

02:27.540 --> 02:32.790
และตัวแปรเหล่านี้ก็คือความทรงจำของการเปลี่ยน 100 ครั้งเป็น 100 เหตุการณ์

02:32.970 --> 02:39.550
และความจุที่เป็น 100 จำนวนคุณจะยินดีที่จะลองหน่วยความจำอีกต่อไปโดยการเพิ่มความจุ

02:39.780 --> 02:46.170
นั่นคือฟังก์ชั่นแรกในฟังก์ชั่นนั้นจากนั้นเราจะสร้างอีกสองฟังก์ชั่นหนึ่งฟังก์ชั่นการกดหนึ่งครั้งเพื่อให้แน่ใจว่าหน่วยความจำไม่ได้มีการเปลี่ยนมากกว่า 100

02:46.500 --> 02:51.050
ครั้ง

02:51.180 --> 02:57.150
และสำหรับสิ่งนี้เราจะใช้ความสามารถโดยการทำเงื่อนไขง่ายๆเพียงอย่างเดียวจากนั้นในที่สุดเราก็จะทำให้ฟังก์ชั่นง่าย ๆ

02:57.360 --> 03:05.060
และแน่นอนว่าจะต้องลองตัวอย่างการเปลี่ยนในหน่วยความจำของการเปลี่ยน 100 ครั้งล่าสุด

03:05.520 --> 03:08.440
เอาล่ะเริ่มกันด้วยการแนะนำคลาส

03:08.520 --> 03:17.460
ดังนั้นเมื่อคุณรู้ว่าเราเริ่มด้วยคลาสแล้วเราให้พวกมันเข้าคลาสเราเรียกมันว่า replay memory และในวงเล็บเราใส่วัตถุจากนั้น

03:17.460 --> 03:25.500
Cullin แล้วเราไปเริ่มด้วยฟังก์ชันแรก

03:25.560 --> 03:26.860
จุดจบคือฟังก์ชั่น

03:27.150 --> 03:30.730
นั่นเหมือนกับก่อนที่เราจะเริ่มด้วยความตาย

03:30.870 --> 03:36.750
จากนั้นสองขีดในนั้นสองขีดอีกครั้งและจากนั้นตัวแปร

03:36.750 --> 03:42.750
แน่นอนว่ามีตัวตนเองซึ่งเป็นตัวแปรที่แนบมากับอินสแตนซ์ในอนาคตของคลาสของวัตถุในอนาคตและจากนั้นเราจะมีตัวแปรอีกตัวสำหรับคุณที่จะลองประสบการณ์อื่น

03:42.750 --> 03:52.950
ๆ เป็นกำลังการผลิต

03:52.950 --> 04:00.960
ดังนั้นความสามารถนี้จะเป็นหมายเลขหนึ่งร้อยเพียงเพราะเราจะสร้างประสบการณ์ในการเล่นกับช่วงการเปลี่ยนภาพที่น้อยกว่าหนึ่งร้อย

04:00.960 --> 04:03.910
เอาล่ะแล้วก็ Collon และไปเลย

04:03.930 --> 04:10.430
ลองเข้าไปข้างในฟังก์ชั่นและกำหนดตัวแปรของวัตถุหน่วยความจำรีเพลย์ของเรา

04:10.440 --> 04:24.690
ดังนั้นสิ่งแรกคือความสามารถในการเรียนรู้ด้วยตนเองและอย่างที่คุณอาจเข้าใจว่านี่คือความสามารถที่เป็นจำนวนการเปลี่ยนผ่านสูงสุดที่เราต้องการในหน่วยความจำของเหตุการณ์

04:24.830 --> 04:34.530
และนี่จะเท่ากับอาร์กิวเมนต์ที่จะป้อนเมื่อสร้างออบเจ็กต์ของคลาสหน่วยความจำการเล่นซ้ำ

04:34.550 --> 04:36.480
นั่นคืออาร์กิวเมนต์ของฟังก์ชั่น init

04:36.660 --> 04:38.180
ดังนั้นความจุ

04:38.180 --> 04:52.670
ดังนั้นอีกครั้งที่จะไม่สับสนตัวเองว่าความจุเป็นชื่อของตัวแปรที่แนบมากับวัตถุและความสามารถที่นี่คืออาร์กิวเมนต์ที่จะใส่เมื่อสร้างวัตถุของหน่วยความจำระดับการเล่นซ้ำ

04:52.810 --> 04:53.620
เอาล่ะ

04:53.830 --> 04:55.880
แล้วเรามี voivode ที่สอง

04:56.170 --> 04:57.890
นั่นเป็นความทรงจำที่แน่นอน

04:58.000 --> 05:01.620
ดังนั้นตัวเองจึงสอน Nemec

05:01.760 --> 05:02.650
เอาล่ะ

05:02.800 --> 05:05.730
และ Voivode หน่วยความจำนี้จะเป็นอย่างไร

05:05.990 --> 05:13.950
หน่วยความจำนี้ควรจะมี 100 เหตุการณ์ล่าสุดดังนั้นจึงควรเป็นการทดสอบอย่างง่าย

05:14.100 --> 05:20.850
คุณทราบรายการซึ่งจะมี 100 เหตุการณ์ล่าสุดการเปลี่ยน 100 ครั้งล่าสุดและเริ่มต้นรายการ

05:20.870 --> 05:24.620
ไม่มีอะไรที่ง่ายไปกว่านี้อีกแล้วเราแค่เพิ่มวงเล็บบางอย่างเข้าไป

05:24.740 --> 05:26.040
และที่นี่เราไป

05:26.060 --> 05:36.430
หน่วยความจำของเราได้รับการเริ่มต้นดังนั้นแน่นอนในช่วงเริ่มต้นของการทดสอบหรือแม่นยำมากขึ้นจุดเริ่มต้นของการสำรวจหน่วยความจำจะเป็นรายการว่างเปล่า

05:36.500 --> 05:38.350
ทุกครั้งที่เราไปถึงสถานะในอนาคต

05:38.600 --> 05:44.720
และการพูดถึงสิ่งนั้นคือสิ่งที่เราจะทำกับฟังก์ชั่นถัดไปที่เราจะเรียกว่าฟังก์ชั่นพุช

05:44.790 --> 05:51.380
เราจะทำให้ฟังก์ชั่นการกดนี้เพื่อสร้างเหตุการณ์ในรายการหน่วยความจำนี้จากนั้นเราจะใช้ความสามารถเพื่อให้แน่ใจว่ารายการหน่วยความจำนี้มี 100

05:51.620 --> 05:57.170
เหตุการณ์เสมอ

05:57.500 --> 05:59.660
เอาล่ะเรามาทำสิ่งต่อไปกันดีกว่า

05:59.690 --> 06:01.250
และจนกว่าจะถึงตอนนั้น
