WEBVTT

00:00.610 --> 00:03.190
สวัสดีและยินดีต้อนรับสู่การสอน Python นี้

00:03.190 --> 00:11.900
ลองทำอันนี้กันทำนี่เพื่อวนรอบเริ่มจากด้านขวาและไปทางซ้ายและเพื่อทำสิ่งนี้เราจะเพิ่มสี่ตัว

00:11.920 --> 00:17.980
นี่คือซ้ำ VAR จะเป็นขั้นตอนของเราเพราะเราจะไปจากขั้นตอนสุดท้ายจนถึงขั้นตอนแรกของการเปลี่ยนชุดและอื่น

00:17.980 --> 00:21.590
ๆ

00:21.960 --> 00:29.850
แล้วเคล็ดลับที่จะไปจากทางขวาไปทางซ้ายคือใช้สำหรับขั้นตอนในการกลับด้านที่ตรงกันข้าม

00:30.160 --> 00:35.300
และตอนนี้เราแค่ต้องป้อนลำดับและลำดับนี้จะเป็นชุดของเรา

00:35.380 --> 00:41.790
ดังนั้นเราสามารถใส่ซีรี่ส์ของเรา แต่อย่างที่คุณเห็นในกระดาษเราเริ่มจาก T ลบ 1 เพื่อเริ่ม

00:41.950 --> 00:50.380
ดังนั้นเราไม่ได้ไปจากขั้นตอนสุดท้ายนั่นคือขั้นตอนเทอร์มินัล แต่ขั้นตอนก่อนหน้านั้นคือการลบหนึ่ง แต่เพื่อเริ่มต้นนั่นคือขั้นตอนแรก

00:50.430 --> 00:59.090
จากตรงนี้ไม่ต้องทำตามขั้นตอนนั้นก่อนที่เราจะต้องใส่คอลัมน์ในวงเล็บลบ

00:59.380 --> 01:04.270
ฉันแน่ใจว่าสำหรับพวกคุณที่ติดตามการเรียนรู้ของเครื่องจักรในหลักสูตรที่ลึกกว่านี้คุณรู้ว่ากลวิธีนี้

01:04.560 --> 01:14.740
Kollin ลบหนึ่งหมายความว่าคุณจะขึ้นไปยังองค์ประกอบก่อนองค์ประกอบสุดท้าย แต่ไม่ถึงองค์ประกอบสุดท้าย ลำดับที่เราต้องการ

01:14.860 --> 01:23.900
นั่นคือสิ่งที่เราจะไปจากองค์ประกอบก่อนองค์ประกอบสุดท้ายถึงองค์ประกอบแรกและเราทำสิ่งที่ตรงกันข้ามเพื่อไปจากขวาไปซ้าย

01:24.160 --> 01:26.810
เอาล่ะเราพร้อมที่จะเข้าสู่ for loop

01:27.170 --> 01:29.740
ดังนั้นภายในนี้เพื่อวนสิ่งที่เราจะทำ

01:29.780 --> 01:32.870
พวกเราจะไปทำอะไรตรงตามในหนังสือพิมพ์

01:32.900 --> 01:42.500
เราจะอัปเดตรางวัลสะสมโดยการคูณโดยกานาและเพิ่มคำที่บรรลุในขั้นตอนปัจจุบันที่อยู่ในขั้นตอนของการติดตาม

01:42.670 --> 01:45.450
เอาล่ะทีนี้กลับไปที่ Python กันดีกว่า

01:45.590 --> 01:57.780
และเราต้องการอัปเดตสะสมของเราเราทำงานด้วยวิธีต่อไปนี้โดยคูณมันด้วยแกมม่าก่อน

01:57.780 --> 01:58.580
เราจะไปที่นั่น.

01:58.660 --> 02:09.420
ที่นี่เราคูณมันด้วยแกมม่าแล้วเราต้องการเพิ่มรางวัลของสิ่งที่เราสามารถเข้าถึงด้วยวิธีนี้ด้วยโครงสร้างพิเศษ

02:09.450 --> 02:13.120
จำไว้ว่าคำนั้นเป็นคุณสมบัติของวัตถุ

02:13.130 --> 02:15.910
แน่นอนว่าที่นี่เราเพิ่มเครื่องหมายบวก

02:16.020 --> 02:17.330
เอาล่ะมันเป็นรางวัลสะสม

02:17.450 --> 02:19.310
เท่ากับเราต้องการขั้นตอนนี้

02:19.370 --> 02:25.620
เราอยู่ในขณะนี้ลูปบวกกาฮันนาคูณรางวัลก่อนหน้านี้ก่อนที่มันจะเป็น

02:26.150 --> 02:26.870
สมบูรณ์

02:26.870 --> 02:28.190
ดังนั้นตอนนี้ฉันคิดว่าเราดี

02:28.220 --> 02:30.180
เรากำลังติดตามอัลกอริทึมอย่างละเอียด

02:30.500 --> 02:32.600
และตอนนี้ถึงเวลาสำหรับขั้นตอนต่อไป

02:32.840 --> 02:35.090
ตอนนี้มันจะกลายเป็นเรื่องง่าย

02:35.090 --> 02:44.010
เรากลับไปที่การติดตามครั้งแรกเพราะนี่คือการวนซ้ำเพื่อคำนวณรางวัลสะสมที่ไม่ได้ไปจากทางขวาไปทางซ้ายโดยการอัพเดทด้วยวิธีนี้

02:44.030 --> 02:55.950
การติดตามอัลกอริทึมและในขณะที่คุณจำได้ว่าเป้าหมายของการทำเช่นนี้คือการทำให้ข้อมูลของเราพร้อมและเป้าหมายของเราพร้อมเพื่อให้เราสามารถลดความแตกต่างกำลังสองระหว่างสองสำหรับการฝึกอบรม

02:55.950 --> 03:01.020
และตอนนี้สิ่งเดียวที่เราต้องทำนั่นคือทำให้อินพุตและห้องน้ำพร้อมใช้งาน

03:01.220 --> 03:08.410
ลองทำสิ่งแรกที่เราต้องทำคือเพิ่มวันแรกของซีรีย์ในรายการชิ้นส่วน

03:08.510 --> 03:11.460
จนถึงขณะนี้สถานะนี้อยู่ในส่วนนี้ของเป้าหมายของเรา

03:11.480 --> 03:14.100
นั่นเป็นเพียงการคำนวณผลลัพธ์

03:14.270 --> 03:21.320
ดังนั้นเราจะได้สถานะอินพุตของขั้นตอนแรกแยกจากกันเพราะนั่นคือสิ่งที่เราต้องเกิดขึ้นในรายการของเรา

03:21.380 --> 03:23.340
งั้นมาแยกอันนี้กัน

03:23.360 --> 03:25.910
ดังนั้นเราจะเรียกมันว่าสถานะ

03:26.000 --> 03:38.300
และเหมือนกับที่นี่เราสามารถหาได้ด้วยวิธีนี้โดยใช้ดัชนีแรกของซีรีส์ที่มีการเปลี่ยนครั้งแรกแล้วเพิ่มสถานะนั้นเพื่อรับสถานะการเปลี่ยนแปลงครั้งแรก

03:38.330 --> 03:46.830
นั่นคือเว็บไซต์ที่เราต้องการแล้วบอกว่าเราจะแยกเป้าหมายที่เกี่ยวข้องกับขั้นตอนการป้อนข้อมูลของการเปลี่ยนแปลง

03:46.880 --> 03:53.450
ดังนั้นตัวแปรใหม่ที่น่าสนใจตรงนี้จึงเป็นเป้าหมายซึ่งจะเท่ากับมูลค่าของขั้นตอนแรก

03:53.540 --> 03:59.990
และเนื่องจากค่า Q

04:00.070 --> 04:07.370
ถูกส่งคืนโดยเครือข่ายประสาทและเนื้อหาและผลลัพธ์และเนื่องจากเอาต์พุตเป็นเอาต์พุตที่เกี่ยวข้องกับอินพุตนี้ซึ่งมีการเปลี่ยนแปลงแรกที่ดีเราจึงสามารถรับค่า q นี้ของวันแรกโดยเพียงแค่เอาผลลัพธ์ที่นี่

04:07.370 --> 04:12.830
เอาดัชนีเป็นศูนย์

04:13.100 --> 04:22.310
จากนั้นเราก็เพิ่มข้อมูลที่จะทำให้เราได้ค่า Q ของสถานะอินพุตของการเปลี่ยนแปลงครั้งแรกและนั่นคือเวลา

04:22.320 --> 04:35.680
ถามดังนั้นวิธีที่เราใช้เราจะอัปเดตตัวแปรเป้าหมายนี้ แต่เฉพาะสำหรับการกระทำที่เลือกในขั้นตอนแรกของซีรีส์และเข้าถึงขั้นตอนแรกของซีรีส์นี้

04:35.870 --> 04:42.710
ทีนี้เราต้องใช้ชุดแรก 0 เพราะนี่เป็นขั้นตอนแรกของชุด 3

04:42.970 --> 04:58.900
และในการเข้าถึงการกระทำที่สอดคล้องกับขั้นตอนแรกของซีรีย์นี้เราต้องเพิ่มการกระทำนั้นอีกครั้งนั่นคือโครงสร้างของแอททริบิวที่เราใช้คุณรู้ว่าการกระทำเป็นคุณสมบัติของขั้นตอนแรกของซีรีส์

04:58.900 --> 05:14.150
นั่นคือการเปลี่ยนแปลงครั้งแรกของซีรีส์เพราะการเปลี่ยนแต่ละซีรีส์มีโครงสร้างการกระทำคำต่อไปนี้และการกระทำที่นี่แอ็คชั่นแอ็ตทริบิวต์ที่นี่หมายความว่า

05:14.330 --> 05:22.850
ดังนั้นเป้าหมายสำหรับการดำเนินการที่เฉพาะเจาะจงของขั้นตอนแรกจึงเป็นสิ่งที่ชุมชนของโลกต้องการได้รับการปรับปรุง

05:22.850 --> 05:29.490
โดยพื้นฐานแล้วที่นี่เราแค่เขียนเป้าหมายที่เกี่ยวข้องกับการกระทำที่เล่น

05:29.630 --> 05:35.810
ขั้นตอนแรกของซีรีส์คือรางวัลสะสมนี้ที่เราเพิ่งคำนวณ

05:36.130 --> 05:46.770
เอาล่ะและตอนนี้เราก็พร้อมที่จะอัปเดตข้อมูลของเราโดยผนวกท้ายการเข้าพักครั้งแรกที่นี่และครั้งแรกจะอยู่ที่นี่ในชั่วโมงแรก

05:46.970 --> 05:53.090
เราจำเป็นต้องอัปเดตขั้นตอนแรกของซีรีส์เพราะคุณรู้ว่าเราฝึก AI ใน 10

05:53.090 --> 05:56.000
ขั้นตอนดังนั้นการป้อนข้อมูลจึงเป็นขั้นตอนแรกของสิบขั้นตอน

05:56.180 --> 06:01.400
และเรายังได้รับเป้าหมายในขั้นตอนแรกนี้ แต่จากนั้นเราไม่ได้รับอินพุตหรือห้องน้ำใด ๆ ในขั้นตอนต่อไปของ 10

06:01.400 --> 06:06.310
ขั้นตอนเพราะโดยทั่วไปแล้วการเรียนรู้จะเกิดขึ้น 10 ขั้นหลังจากนั้น

06:06.500 --> 06:11.380
นั่นเป็นเหตุผลที่ตอนนี้เราเพียงได้รับรัฐและเป้าหมายของขั้นตอนแรกของซีรีส์

06:11.840 --> 06:20.590
ดังนั้นจึงเป็นสิ่งสำคัญที่จะเข้าใจว่าและดังนั้นหากเราเข้าใจว่าตอนนี้เราเข้าใจว่าเราต้องป้อนข้อมูลเหล่านั้นในรายการอินพุตและรายการเป้าหมายของเรา

06:20.660 --> 06:21.560
ลองทำสิ่งนี้กัน

06:21.560 --> 06:25.140
ก่อนอื่นให้ผนวกสถานะเข้ากับอินพุตของเรา

06:25.190 --> 06:49.460
ดังนั้นเราจึงใช้รายการอินพุตของเราและเราใช้ฟังก์ชั่นผนวกเพื่อเพิ่มสถานะที่จดจำสถานะอินพุตของขั้นตอนแรกของซีรีส์จากนั้นเราจะผนวกเป้าหมายเข้าไปในขั้นตอนแรกในรายการเป้าหมายของเรา เราใช้รายการเป้าหมายและบอกว่าเราใช้ฟังก์ชั่นผนวกเพื่อผนวกเป้าหมายแรกนี้

06:49.490 --> 06:50.360
เราจะไปที่นั่น.

06:50.540 --> 07:01.760
เกือบเสร็จแล้วและตอนนี้เราต้องคืนสิ่งสุดท้ายซึ่งแน่นอนว่าเป็นสิ่งที่เราจำเป็นต้องทำตามที่เราได้กล่าวไว้ในตอนต้นของบทช่วยสอนนี้อินพุตและเป้าหมายที่ได้รับการปรับปรุงแล้ว

07:02.090 --> 07:07.580
ดังนั้นเราจะเพิ่มที่นี่ทุกเทิร์นและเราจะได้อินพุตของเราก่อน

07:07.580 --> 07:14.660
แต่นั่นคือสิ่งที่เราต้องแปลงให้เป็นอาเรย์ตัวเลขก่อนจากนั้นทำการแปลงรูปแบบเพื่อให้แน่ใจว่า คุณเท่ากับและนั่นลอย

07:14.660 --> 07:21.710
32 เหมือนกัน

07:21.890 --> 07:29.540
แล้วเราแปลงมันเป็นเทนเซอร์คบเพลิงเพราะแน่นอนว่าเรากำลังทำงานกับคบเพลิงที่บังคับทั้งหมด

07:29.570 --> 07:36.040
ดังนั้นฉันจึงใช้ไฟฉายจากฟังก์ชั่นที่ไม่ใช่ภาษาไทยอีกครั้ง

07:37.180 --> 07:39.000
และนั่นทำให้เราได้รับข้อมูลของเรา

07:39.130 --> 07:39.590
สมบูรณ์

07:39.590 --> 07:42.460
และตอนนี้เราทำเช่นเดียวกันกับเป้าหมาย

07:42.520 --> 07:44.620
ตอนนี้เราสามารถใช้เคล็ดลับนี้ได้เร็วขึ้น

07:44.710 --> 07:57.230
เราจะรวมกลุ่มเป้าหมายเข้าด้วยกันและเพื่อทำสิ่งนี้เราต้องทำห้องสมุดคบเพลิงแห่งแรกของเราเพราะเราจะใช้ฟังก์ชั่นกองซ้อนโดยคบเพลิงในการจัดกลุ่มเป้าหมาย

07:57.250 --> 07:57.550
เอาล่ะ

07:57.550 --> 08:07.100
ดังนั้นรหัสบรรทัดนี้จึงส่งกลับอินพุตและห้องส้วมที่เพิ่งได้รับการอัพเดตผ่านอัลกอริธึมการติดตาม Sarsour

08:07.180 --> 08:10.710
หรือเราสามารถเรียกมันและเข้ามาและส่งคำแสดงความยินดีของเรา

08:10.780 --> 08:20.950
เราพร้อมที่จะทำการฝึกครั้งสุดท้ายเพราะโดยทั่วไปแล้วการฝึกอบรมประกอบด้วยการลดความแตกต่างระหว่างการคาดการณ์ปัจจัยการผลิตและห้องน้ำของเราให้น้อยที่สุด

08:21.160 --> 08:22.870
ดังนั้นขอให้ดวงตาของเราฉลาด

08:22.870 --> 08:25.150
มันจะกลายเป็นสมาร์ทและต่อไป

08:25.210 --> 08:26.980
และเช่นนั้นจนกระทั่งเพลิดเพลินกับ AI
