WEBVTT

00:00.330 --> 00:08.540
สวัสดีและยินดีต้อนรับสู่บทช่วยสอนนี้ของเล่นพิเศษนี้จะน่าตื่นเต้นสุด ๆ เพราะเราเข้าใกล้ก. มากขึ้น

00:08.540 --> 00:08.540
เอส ซี ขั้นตอนวิธี

00:08.700 --> 00:14.190
คุณจะเห็นว่าสิ่งที่เรากำลังจะนำไปใช้และที่เรียกว่าการมีสิทธิ์ติดตามหรือ

00:14.520 --> 00:20.380
Sarsour เป็นอัลกอริทึมของอัลกอริทึมตัวแทนนักวิจารณ์เชิงวิจารณ์แบบซิงโครนัส

00:20.380 --> 00:25.290
และเราเห็นเพราะเรายังคงมีตัวแทนเพียงหนึ่ง

00:25.290 --> 00:32.010
แต่คุณก็ยังจะเห็นว่าสิ่งที่เรากำลังจะนำไปใช้นั้นจริง ๆ แล้วนำมาจากบทความต่อไปนี้ซึ่งเป็นบทความนี้เป็นวิธีการซิงโครนัส

00:32.130 --> 00:40.840
ในบทความนี้คุณจะพบอัลกอริทึม A-3 ที่เราจะนำไปใช้เป็นโบนัสสุดท้ายของหลักสูตรนี้

00:41.010 --> 00:47.580
แต่อย่างที่ฉันบอกว่าเราเข้าใกล้มันมากเพราะแบบจำลองที่จะนำมาใช้จริงตอนนี้อันนี้เป็นแบบซิงโครนัสและทางโลกนั่นคือแบบที่เกือบ A3

00:48.420 --> 00:55.620
C ซึ่งทำหลังจากนั้น

00:55.620 --> 01:03.490
สิ่งนี้และขั้นตอน Cunanan เราจะเรียนรู้ที่จะสะสมรางวัลและเรียนรู้เป้าหมายสะสมในขั้นตอนสุดท้ายแทนที่จะเป็นขั้นตอนเดียวเช่น

01:03.490 --> 01:09.520
Priestley

01:09.690 --> 01:15.250
และนั่นคือสิ่งที่จะทำให้การฝึกอบรมมีประสิทธิภาพมากขึ้นและดังนั้นจึงมีประสิทธิภาพมากขึ้น

01:15.300 --> 01:21.080
ดังนั้นเราจึงมีรหัสหลอกสำหรับอัลกอริทึมนี้เป็นอัลกอริทึมนี้ตรงนี้

01:21.180 --> 01:23.230
ดังนั้นให้คลิกที่มันและเราไปที่นั่น

01:23.250 --> 01:25.740
นั่นคืออัลกอริทึมที่เรากำลังจะนำไปใช้

01:25.890 --> 01:30.960
แต่จำไว้ว่ามีเพียงตัวแทนเดียวความแตกต่างคือที่นี่พวกเขาดำเนินการ

01:30.990 --> 01:38.020
80 ตามนโยบายของประธานาธิบดี Greely ตามค่า q สำหรับสถานะปัจจุบันและการดำเนินการที่เล่น

01:38.190 --> 01:42.050
แต่ในกรณีของเราเราไม่ได้ใช้นโยบายสีเขียวที่ยอดเยี่ยม

01:42.090 --> 01:43.770
เราปรับใช้ soft max

01:43.890 --> 01:46.110
แต่ส่วนที่เหลือก็เหมือนกับที่คุณเห็น

01:46.110 --> 01:50.210
เราจะคำนวณการสะสมที่เราทำและขั้นตอนจริง ๆ 10 ขั้นตอน

01:50.220 --> 01:52.340
โปรดจำไว้ว่าขั้นตอนเท่ากับ 10

01:52.440 --> 01:58.170
ดังนั้นเราจะใช้โค้ดบรรทัดนี้ในอัลกอริทึมของเราที่เรากำลังจะนำไปใช้ในตอนนี้

01:58.170 --> 01:59.010
เราจะได้สิ่งนี้

01:59.010 --> 02:02.150
และส่วนใหญ่เราจะใช้สิ่งนี้เช่นกัน

02:02.160 --> 02:08.820
คุณจะเห็นว่าเราจะได้รับค่า q สูงสุดสำหรับสถานะปัจจุบันและการกระทำปัจจุบันใน theta นี้

02:08.820 --> 02:11.150
นี่เป็นเพียงพารามิเตอร์เป้าหมาย

02:11.430 --> 02:15.350
ลองทำสิ่งนี้กันเถอะโจมตีอัลกอริทึมนี้

02:15.360 --> 02:18.730
อันนี้เรียกว่าการเรียนรู้แบบซิงโครนัสและแบบแท่ง

02:18.900 --> 02:24.490
แต่เราไม่มีสิทธิ์ที่จะพูดแบบซิงโครนัสเท่าที่เรากังวลเพราะเรามีเพียงหนึ่งเครื่องยนต์

02:24.670 --> 02:29.830
แต่ด้วยเหตุนี้เราจึงสามารถเรียกมันและเรียนรู้ร่องรอยคุณสมบัติหรือแม้กระทั่งซาร์ซาร์

02:30.270 --> 02:31.780
เอาล่ะทำสิ่งนี้กัน

02:31.800 --> 02:33.080
มันจะสนุกดี

02:33.090 --> 02:37.460
โดยทั่วไปเราสามารถติดตามรหัสได้ที่นี่และนั่นคือสิ่งที่เรากำลังจะทำ

02:37.460 --> 02:43.980
และอย่างที่คุณเห็นพารามิเตอร์ที่เราต้องการนั้นคือพารามิเตอร์ที่เป็นพารามิเตอร์การสลายอีกครั้งดังนั้นเราจะเริ่มต้นด้วยการแนะนำตัวแปรสำหรับพารามิเตอร์

02:44.280 --> 02:50.820
Gahanna นี้และเลือกพวกเขา

02:50.820 --> 02:51.840
ลองทำสิ่งนี้กัน

02:51.900 --> 03:01.830
จริง ๆ แล้วเราไม่ต้องการห้องเรียนขนาดใหญ่เราสามารถใช้สิ่งนี้กับฟังก์ชั่นได้เพราะคุณรู้ว่าเราไม่จำเป็นต้องสร้างวัตถุสำหรับสิ่งนี้เพื่อติดตามแบบจำลองฟังก์ชั่นจะเพียงพอเพราะโดยทั่วไปสิ่งที่เราต้องการคือ

03:02.190 --> 03:14.460
คืนอินพุตและเป้าหมายดังนั้นในภายหลังเมื่อฝึกอบรม AI เราพร้อมที่จะลดระยะห่างระหว่างการทำนายและเป้าหมายและเพื่อให้ได้การคาดการณ์ที่เราต้องการปัจจัยการผลิตเพราะเราจะใช้สมองของเรากับอินพุตเพื่อให้ได้ผลลัพธ์

03:14.470 --> 03:21.300
สัญญาณที่จะเป็นคำทำนายของเรา

03:21.300 --> 03:26.730
จากนั้นเมื่อเรามีการทำนายและเป้าหมายของเราแล้วเราจะพร้อมฝึก AI

03:26.730 --> 03:30.680
โดยพยายามลดระยะห่างที่ยอดเยี่ยมระหว่างการทำนายและห้องน้ำ

03:30.690 --> 03:32.780
นั่นคือจุดรวมของการทำเช่นนี้ในตอนนี้

03:32.880 --> 03:43.010
เรากำลังใช้งานฟังก์ชั่นนี้เพื่อให้สามารถคืนค่าอินพุตเหล่านี้ในโซเวียตเพื่อให้เราพร้อมสำหรับการฝึกอบรมเพื่อลดการทำนายระยะห่างกำลังสองที่จัดการห้องน้ำ

03:43.020 --> 03:46.400
เอาล่ะเรามาทำสิ่งนี้ตามที่เราบอกว่าเราต้องการใช้ฟังก์ชั่น

03:46.410 --> 03:47.910
เราเริ่มต้นด้วยสิ่งนี้

03:47.940 --> 03:52.680
สิ่งนี้เราจะเรียกมันว่าการมีสิทธิ์อยู่นั้นเป็นการขีดเส้นใต้

03:52.860 --> 03:54.210
คุณสามารถเรียกมันว่า Sarsour

03:54.240 --> 04:00.660
คุณสามารถเรียกมันว่าเป็นขั้นตอนเพื่อโทรหาสิ่งที่คุณต้องการ แต่ลองเรียกมันว่าการมีสิทธิ์ติดตามและฟังก์ชั่นนี้จะใช้อาร์กิวเมนต์หนึ่งซึ่งจะเป็นแบทช์และสาเหตุที่เป็นเพราะเราจะได้รับอินพุตและเป้าหมายบางอย่าง

04:00.660 --> 04:07.530
เราจะฝึก AI

04:07.530 --> 04:13.460
บนแบตช์

04:13.530 --> 04:25.090
ดังนั้นอินพุตและเป้าหมายจะอยู่ภายในแบตช์ดังนั้นอาร์กิวเมนต์อินพุตที่นี่คือแบทช์นี้ที่จะมีอินพุตหลายชุดจากนั้นเป้าหมายหลายอย่างที่จะคำนวณ

04:25.500 --> 04:26.730
ดังนั้นเราไปกันเลย

04:26.730 --> 04:28.310
นั่นเป็นเหตุผลเดียวที่เราต้องการ

04:28.500 --> 04:32.280
ทีนี้ลองเข้าไปในฟังก์ชั่นและนิยามว่าเราต้องทำอะไร

04:32.370 --> 04:45.390
ดังที่เราเห็นในมหาวิหารของกระดาษเราต้องการพารามิเตอร์อีกครั้งดังที่เรากล่าวว่าเราเริ่มต้นด้วยการแนะนำพารามิเตอร์แกมมากึ่งใกล้และเราสามารถถอดรหัสค่าได้

04:45.450 --> 04:51.780
และเราจะเลือกสี่จุดเก้าสิบเก้านั่นเป็นคุณค่าที่คลาสสิกสำหรับกานาและ Norreys

04:51.780 --> 04:55.640
ฉันตรวจสอบว่านี่เป็นสิ่งที่คุ้มค่าสำหรับ AI ของเรา

04:55.650 --> 05:05.260
เอาล่ะขั้นตอนต่อไปขั้นตอนต่อไปคือการเตรียมข้อมูลของเราและเป้าหมายของเราเพราะนั่นคือสิ่งที่เราต้องการกลับมา

05:05.260 --> 05:08.980
เราต้องการคืนค่าข้อมูลเข้าสู่เป้าหมายเพื่อเตรียมการฝึกอบรม

05:08.980 --> 05:25.000
และเพื่อให้เราสามารถเริ่มต้นรายการเหล่านั้นด้วยรายการเปล่าเพราะแน่นอนว่าอินพุตเหล่านี้ภายในที่ดีที่สุดที่เราจะมีหลายอินพุตทั้งหมดในรายการและนั่นคือเมื่อเริ่มต้นอินพุตเป็นรายการเช่นเดียวกับเป้าหมายที่เราไป

05:25.000 --> 05:33.320
ดังนั้นเราจึงเริ่มต้นและใส่เป้าหมายของเราและในที่สุดฟังก์ชั่นการติดตามคุณสมบัตินี้จะคืนค่าอินพุตเหล่านี้อย่างแน่นอน

05:33.330 --> 05:36.180
และใช่เหล่านี้แน่นอน Filton

05:36.290 --> 05:42.300
เรามีหลายอินพุตและเป้าหมายหลายอย่างที่เกี่ยวข้องในสิ่งที่จะถูกส่งกลับโดยฟังก์ชั่น

05:42.300 --> 05:50.290
เอาล่ะขั้นตอนต่อไปคือเริ่มลูปและนั่นเป็นเพราะเรากำลังติดตามโค้ดช้าของกระดาษ

05:50.290 --> 05:51.400
รหัสประเภทนี้

05:51.490 --> 05:58.420
และอย่างที่คุณเห็นนั่นคือส่วนของรหัสซ้ำและวนซ้ำเต็มจำนวนในรหัส

05:58.470 --> 06:03.870
พวกเรากำลังจะคำนวณรางวัลสะสมที่นี่สะสมใน 10 ขั้นตอน

06:03.940 --> 06:05.130
และมันคำนวณอย่างไร

06:05.290 --> 06:13.070
ในแต่ละขั้นตอนที่ไม่ได้เป็นขั้นตอนสุดท้ายเราจะได้ค่าสูงสุดของค่าหลักของสกุลเงินที่เราอยู่ในระหว่างการดำเนินการและขั้นตอนนี้

06:13.240 --> 06:17.790
และถ้าเราไปถึงสถานะสุดท้ายของ 10 ขั้นตอนได้ดีจะเท่ากับศูนย์

06:17.890 --> 06:19.810
นั่นคือเราไม่ต้องการทำอีกต่อไป

06:20.080 --> 06:23.320
แล้วเรามีนี่สำหรับลูปซึ่งจะเพิ่มขึ้นอีก

06:23.470 --> 06:28.390
พวกเขาไม่ได้พูดซ้ำที่นี่ แต่นั่นก็เหมือนกันมันจะเป็นลูปเต็มสองในอัลกอริทึมของเรา

06:28.600 --> 06:35.660
ทีนี้เราจะได้ว่าเรามีวิธีนี้โดยการคูณมันด้วยแกมม่าพารามิเตอร์การสลายตัวและเพิ่มคำ

06:36.010 --> 06:41.510
ลองทำสิ่งนี้กันเถอะกลับไปที่ Python และเริ่มเต็มของเรา

06:41.980 --> 06:44.920
และสิ่งที่จะเป็นตัวแปรซ้ำ

06:45.070 --> 06:47.820
นั่นคือชุด 10 ก้าวของเรา

06:47.890 --> 06:55.510
คุณรู้ว่าชุดของการเปลี่ยนแปลง 10 ครั้งดังนั้นเราจะเรียกชุดตัวแปรนี้ที่เป็นตัวแทนของชุดของการเปลี่ยน 10 เช่นลำดับ

06:55.600 --> 06:58.820
10 การเปลี่ยน

06:58.860 --> 07:00.910
ดังนั้นสำหรับซีรีส์ใน

07:01.210 --> 07:02.400
แล้วคุณคิดยังไง

07:02.620 --> 07:05.570
ชุดของเราจะลงไปที่ชุดของเรา

07:05.680 --> 07:12.040
มีแบทช์ที่จะทำการฝึกอบรม AI และอื่น ๆ ในแบทช์นั่นคือสำหรับซีรีย์ทั้งหมดของการเปลี่ยน 10

07:12.040 --> 07:14.540
รายการในแบทช์อินพุทของเรา

07:14.800 --> 07:26.560
เราจะทำอย่างไรดีเพื่อให้ได้รับรางวัลสะสมคุณจะเห็นในซิลิกาว่าเราต้องการสถานะการเปลี่ยนผ่านครั้งแรกของซีรีส์และสถานะของการเปลี่ยนผ่านชุด

07:26.740 --> 07:39.380
ดังนั้นสิ่งที่เราต้องทำตอนนี้คือรับสถานะอินพุทเหล่านี้และเราจะทำให้ทั้งสองสถานะเข้ากันได้ที่จะเรียกอินพุตและเราจะได้สถานะอินพุททั้งสองนี้

07:39.400 --> 07:46.590
หนึ่งในซีรีย์แรกและอันสุดท้ายที่เราจะใส่ลงในอาร์เรย์ที่ไม่ใช่นักบิน

07:46.800 --> 07:56.930
แต่ไม่ต้องกังวลกับสิ่งนี้และแอมปุตราจะแปลงเป็นที่น่ากลัว แต่ขั้นตอนแรกคือการใส่สองคนนี้ ระบุคนแรกในคนสุดท้ายเข้าสู่อาณาจักร

07:57.240 --> 08:25.660
และที่นี่ในอาร์เรย์นี้เราเพิ่มอินพุตแรกซึ่งเป็นขั้นตอนการป้อนข้อมูลของการเปลี่ยนแปลงครั้งแรกของซีรีส์และนั่นคือซีรีส์จากนั้นจึงนำมาใช้สำหรับการเปลี่ยนแปลงเราใช้ดัชนีศูนย์ของซีรีส์ เราสามารถเข้าถึงได้โดยการใช้คุณสมบัติของมันซึ่งเป็นสถานะและนั่นเป็นเพราะในไฟล์ประสบการณ์การเล่นซ้ำของเราเราได้พบโครงสร้างพิเศษสำหรับการเปลี่ยนแปลงแต่ละครั้งและคุณรู้ว่าโครงสร้าง

08:25.730 --> 08:29.380
การเปลี่ยนแปลงแต่ละครั้งจะประกอบด้วยคำว่าการกระทำ

08:29.570 --> 08:39.250
แต่แล้วองค์ประกอบสุดท้ายที่ทำเพื่อโครงสร้างพิเศษนี้ที่เราได้รับอนุญาตให้ใช้ในตอนนี้มาจากวิธีที่เรากำหนดการเปลี่ยนผ่านและการเล่นซ้ำ

08:39.290 --> 08:48.640
เอาล่ะด้วยสิ่งนี้เราจะได้รับสถานะอินพุตของการเปลี่ยนแปลงครั้งแรกและตอนนี้เราจะได้รับสถานะอินพุตของการเปลี่ยนแปลงล่าสุดของซีรีส์

08:48.800 --> 09:07.420
และการทำเช่นนี้คือการบอกว่าเราสามารถคัดลอกและวางมันและแทนที่เมื่อคุณอยู่ที่นี่โดยดัชนีล่าสุดของซีรีส์ซึ่งเราสามารถเข้าถึงได้ด้วยเล่ห์เหลี่ยมนี้ลบหนึ่งซีรีส์ การเปลี่ยนแปลงของซีรีส์

09:08.210 --> 09:26.140
เอาล่ะเราต้องใส่องค์ประกอบทั้งสองเข้าไปในวงเล็บสี่เหลี่ยมเพราะนั่นคือสิ่งที่ผู้ตัดสินคาดหวังจากฟังก์ชั่นและสิ่งสำคัญที่ต้องทำเพราะเราจะแปลงมันให้เป็นคำตอบคบเพลิงในตัวแปรไฟฉาย

09:26.330 --> 09:31.810
โปรดจำไว้ว่าเทนเซอร์คบเพลิงโดยนิยามอาเรย์พิเศษที่มีประเภทเดียว

09:31.940 --> 09:34.640
ดังนั้นเราจำเป็นต้องบังคับให้มีประเภทเดียว

09:34.760 --> 09:42.020
และตามปกติเราจะเลือกประเภทลอยและเพิ่มพารามิเตอร์นี้ที่นี่ D ประเภทเท่ากับและ P

09:42.750 --> 09:45.030
ที่ลอย

09:45.320 --> 09:52.380
เพื่อที่คุณจะได้อันนี้และตอนนี้เราสามารถแปลงมันเป็นเทนเซอร์คบเพลิงในคบเพลิงวอยซ์

09:52.550 --> 09:54.640
ลองทำอันนี้กัน

09:54.770 --> 09:57.470
ก่อนอื่นเรามาแปลงมันเป็นเซ็นเซอร์คบเพลิง

09:57.590 --> 10:06.880
และจำไว้ว่าเราสามารถใช้

10:06.900 --> 10:18.230
torche ที่ไม่ใช่แบบเฉพาะที่เราไปและเราใส่อาร์เรย์ทั้งหมดของสถานะอินพุตสองอันในนักเต้นคบเพลิงนี้ด้วยไฟฉายจากพวกเขาโดยฟังก์ชั่นที่สมบูรณ์แบบที่จะแปลงอาร์เรย์เหล่านี้ของสถานะอินพุตทั้งสองเป็นไฟฉาย เซ็นเซอร์

10:18.420 --> 10:28.400
และตอนนี้เราได้นำคบเพลิงนี้ตอบไปในคบเพลิงเป็นอย่างดีโดยใช้คลาสตัวแปรดังนั้นอินพุตจะเป็นวัตถุของคลาสที่มีค่า

10:28.480 --> 10:36.680
และในความเป็นจริงในขณะที่คุณเข้าใจคลาสตัวแปรนี้จะใช้ทั้งหมดนี้เป็นอาร์กิวเมนต์

10:36.680 --> 10:38.420
เอาล่ะตอนนี้เราน่าจะดี

10:38.450 --> 10:41.000
เรามีสองปัจจัยที่เราต้องการ

10:41.000 --> 10:45.440
นั่นคือสถานะอินพุตของการเปลี่ยนแปลงแรกจากนั้นอินพุตบอกว่าการเปลี่ยนแปลงครั้งล่าสุด

10:45.770 --> 10:52.560
และตอนนี้เรามีอินพุตแล้วเราจะได้อะไรเราจะได้รับสัญญาณเอาท์พุทของสมองของ AI

10:52.640 --> 10:56.160
นั่นคือการทำนายที่เราจะเรียกมันว่าเอาท์พุต

10:56.630 --> 10:57.950
นั่นคือสัญญาณขาออก

10:58.130 --> 10:59.280
และเพื่อให้ได้ผลลัพธ์

10:59.330 --> 11:05.330
ทีนี้มันง่ายมากเพราะเรามีสมองที่สร้างขึ้นซึ่งเป็นโครงข่ายประสาทเทียมของเรา

11:05.570 --> 11:16.650
และเราก็สามารถนำสมองซีเอ็นเอ็นของเราไปประยุกต์ใช้กับอินพุตซึ่งจะคืนค่าการทำนายว่าเอาต์พุตจะง่ายเหมือน

11:16.820 --> 11:19.510
และตอนนี้เราก็พร้อมแล้วที่จะก้าวต่อไปในขั้นตอนต่อไป

11:20.730 --> 11:24.890
และขั้นตอนต่อไปคือเริ่มคำนวณชุมชนนี้ถ้าคุณต้องการ

11:25.090 --> 11:32.300
ดังนั้นตอนนี้เราจะทำเช่นเดียวกับอัลกอริทึมของ Sarsour หรือเราควรเรียกมันและขั้นตอนในการเรียนรู้

11:32.290 --> 11:46.000
เราจะแนะนำตัวแปรรางวัลสะสมซึ่งจะเป็นรางวัลสะสมลองกลับไปที่กระดาษอย่างที่คุณเห็นในตอนนี้สิ่งที่เราต้องทำเพื่อรับรางวัลชุมชนนี้ซึ่งเป็นของเราที่นี่

11:46.170 --> 11:53.160
ทีนี้และในแต่ละขั้นตอนของการวิ่ง

11:53.160 --> 12:03.410
10 ขั้นตอนเราจำเป็นต้องอัปเดตโดยการเพิ่มศูนย์ให้กับชุมชนนี้ถ้าเราเป็นถ้าเรามาถึงขั้นตอนสุดท้ายของซีรีส์หรือสูงสุดของค่านิยมหลัก ชุดที่สำหรับสถิตยศาสตร์ทั้งหมดที่กินเวลา

12:03.750 --> 12:05.890
นั่นเป็นเพียงแค่โบนันซ่า

12:06.000 --> 12:07.580
กลับไปที่ Piscean กันเถอะ

12:07.650 --> 12:23.070
ดังนั้นรางวัลชุมชนนี้ที่เราเพิ่งเห็นจะเท่ากับศูนย์จุดศูนย์ถ้าเราไปถึงสถานะสุดท้ายและเราสามารถเขียนเงื่อนไขนี้แบบนี้ถ้าชุดของดัชนีลบ 1

12:23.070 --> 12:25.940
นั่นคือการเปลี่ยนแปลงครั้งสุดท้ายของซีรีส์

12:26.250 --> 12:38.400
จากนั้นเราเพิ่มที่ทำเพราะทำจริงเป็นคุณลักษณะของคุณรู้ว่าโครงสร้างเฉพาะกาลที่เรากำหนดไว้ในประสบการณ์ที่เราเล่นประสบการณ์ของเราเล่นซ้ำเหม็นและสิ่งนี้ทำมาจากโครงสร้างเปิดจริงเพราะถ้าเราไปที่เว็บไซต์ Allergan เปิดที่เหมาะสม

12:38.400 --> 12:45.240
ที่นี่ฉันเตรียมไว้

12:45.280 --> 12:47.160
นั่นคือการทำดีหรือขุนนางผู้ใหญ่ในอินเดีย

12:47.340 --> 12:52.300
และถ้าเราไปที่เอกสารแล้วถ้าเรา

12:52.380 --> 12:55.240
นั่นคือบทเรียนที่ฉันขอแนะนำให้คุณดู

12:55.470 --> 13:04.690
คุณสามารถเรียกใช้สภาพแวดล้อมที่ Knowsley คุณจะเห็นว่าการสังเกตของเราว่าการเปลี่ยนแปลงเหล่านี้ถูกกำหนดโดยการสังเกต

13:04.790 --> 13:12.150
เราต้องการทำสิ่งนี้ที่นี่และสิ่งที่ทำเสร็จแล้วหมายความว่าการเปลี่ยนแปลงหรือขั้นตอนสิ้นสุดลงแล้ว

13:12.150 --> 13:15.440
และเราจะใช้สิ่งนี้ทำตรงนี้กับเงื่อนไข IF ของเรา

13:15.610 --> 13:23.460
ดังนั้นความบ้าคลั่งของ iSeries เมื่อทำเช่นนั้นหมายความว่าถ้าการเปลี่ยนชุดสุดท้ายเสร็จสิ้น

13:23.730 --> 13:29.290
และดังนั้นรางวัลสะสมนี้จะเท่ากับศูนย์ถ้าการเปลี่ยนชุดสุดท้ายเสร็จสิ้น

13:29.330 --> 13:40.950
มิฉะนั้นหากเรายังไม่ถึงช่วงการเปลี่ยนภาพสะสมของรางวัลล่าสุดจะได้รับการอัปเดตด้วยเนื่องจากเราได้กล่าวถึงจำนวนสูงสุดของค่าคีย์

13:41.220 --> 13:47.460
และเนื่องจากเอาท์พุทนี่ตรงนี้เป็นเอาท์พุทของสมองนั่นคือการทำนายของโครงข่ายประสาท

13:47.520 --> 13:55.040
และอย่างที่คุณทราบการทำนายของโครงข่ายประสาทเทียมนั้นเป็นค่าที่ทำนายไว้เอาท์พุทนี้มีค่าอยู่

13:55.110 --> 14:01.130
และเนื่องจากเราจำเป็นต้องใช้ค่า q

14:01.130 --> 14:04.620
สูงสุดเราต้องเพิ่มดัชนีนี้ก่อนเนื่องจากโครงสร้างนี้มีค่าคีย์สองค่าและค่าถัดไป

14:04.620 --> 14:07.830
จากนั้นเราต้องเพิ่มข้อมูลเพื่อเข้าถึงข้อมูล

14:07.830 --> 14:12.150
โครงสร้างเอาท์พุทนี้คุณรู้ว่ามันมีโครงสร้างพิเศษของไฟฉายวอยซ์

14:12.270 --> 14:20.470
ดังนั้นด้วยสิ่งนี้เราจึงได้ค่านิยมหลักของเราจากนั้นเราต้องการใช้ค่าคิวสูงสุดของเราและเราจึงเพิ่มค่าสูงสุดนั้น

14:20.490 --> 14:30.240
และตอนนี้เราได้สิ่งที่เราต้องการอย่างแท้จริงในกระดาษค่าสูงสุดของคิวบ์นี้สำหรับสถานะที่ไม่ใช่ขั้วเพื่อให้สมบูรณ์แบบ

14:30.280 --> 14:33.460
ทีนี้สิ่งที่เรากำลังจะทำคือทำทบครั้งที่สอง

14:33.930 --> 14:40.830
นั่นคือสำหรับ 10 ขั้นตอนของซีรีส์เราจะอัปเดตการสะสมแบบนี้โดยการคูณครั้งแรกโดย Gamma

14:40.830 --> 14:46.170
พารามิเตอร์การสลายตัวที่เรามีอยู่แล้วเพิ่มคำ B

14:46.410 --> 14:47.540
ลองทำสิ่งนี้กัน

14:47.610 --> 14:52.970
เรากำลังจะทำสิ่งเดียวกันกับใน pseudocode อย่างที่คุณเห็นว่าพวกเขาเริ่มจากด้านขวา

14:53.040 --> 14:59.010
ดังนั้นพวกเขาไม่ได้เริ่มต้นด้วยขั้นตอนแรกและเข้าสู่การทดสอบครั้งสุดท้ายที่พวกเขาเริ่มต้นด้วยขั้นตอนสุดท้าย

14:59.040 --> 15:02.280
T-ลบ 1 ถึงขั้นตอนแรกเพื่อเริ่มต้น

15:02.340 --> 15:06.520
นั่นคือสิ่งที่เรากำลังจะทำและนั่นเป็นเพราะเราต้องการที่จะได้รับรางวัลสะสมในท้ายที่สุดเท่ากับเท่ากับของเราหรือศูนย์บวกแกมม่าหรือ 1

15:06.610 --> 15:15.840
บวกแกมม่ากำลังสองหรือสองบวกที่เพิ่มบวกแกมม่าที่พลังงาน 10 หรือ 10 ที่ คือ

15:15.840 --> 15:25.580
1 หรือ 2 ที่มี 10 คำที่ได้รับในแต่ละขั้นตอนของซีรีส์

15:25.590 --> 15:29.870
งั้นลองหยุดพักอย่างรวดเร็วก่อนที่จะวนเต็มครั้งที่สองและฉันจะเห็นคุณในบทช่วยสอนต่อไป

15:30.030 --> 15:31.530
จนกว่าจะสนุกกับ AI
