WEBVTT

00:00.630 --> 00:03.170
สวัสดีและยินดีต้อนรับสู่การสอน Python นี้

00:03.170 --> 00:03.500
เอาล่ะ

00:03.510 --> 00:11.470
ตอนนี้ในฟังก์ชั่นถัดไปที่เรากำลังนำไปใช้เราจะฝึกอบรมโครงข่ายประสาทเทียมที่อยู่ภายในปัญญาประดิษฐ์ของเรา

00:11.490 --> 00:16.980
โดยพื้นฐานแล้วเราจะทำกระบวนการทั้งหมดเพื่อการแพร่กระจาย

00:16.980 --> 00:19.140
ดังนั้นเราจะได้ผลลัพธ์ของเรา

00:19.200 --> 00:20.850
เราจะได้รับเป้าหมาย

00:20.890 --> 00:28.410
เราจะเปรียบเทียบผลลัพธ์ของเป้าหมายเพื่อคำนวณข้อผิดพลาดล่าสุดจากนั้นเราจะกลับไปเผยแพร่ข้อผิดพลาดล่าสุดนี้ในเครือข่ายใหม่

00:28.680 --> 00:34.780
และการใช้การไล่ระดับสีที่แนะนำที่จะต้องรอตามจำนวนที่พวกเขามีส่วนในข้อผิดพลาด

00:35.190 --> 00:39.030
งั้นลองทำทั้งหมดนี้เพื่อคนที่มาจากนาวิกโยธินที่ลึก

00:39.030 --> 00:43.850
นี่จะเป็นสิ่งที่ดี แต่สำหรับคนอื่นไม่ต้องห่วงฉันจะขยายมันอีก

00:44.160 --> 00:51.630
ดังนั้นเราจะเรียกฟังก์ชั่นใหม่นี้เรียนรู้และเรียนรู้ฟังก์ชั่นจะใช้การขัดแย้งหลายประการ

00:51.630 --> 00:57.350
ตนเองคนแรกของหลักสูตรซึ่งจะหมายถึงวัตถุของการศึกษาระดับปริญญาในชั้นเรียน

00:57.510 --> 01:15.570
จากนั้นเราจะใช้สถานะแบตช์ของเราสำหรับสถานะปัจจุบันจากนั้นสถานะถัดไปของแบทช์ของเราก็จะเป็นรางวัลนั้นและในที่สุดก็ดำเนินการ Arbat

01:15.590 --> 01:16.960
แล้วทำไมเราถึงรับสิ่งนี้

01:16.970 --> 01:19.770
คุณอาจจำได้ว่าชุดนี้คืออะไร

01:19.880 --> 01:26.350
แน่นอนว่าเป็นช่วงการเปลี่ยนภาพการเปลี่ยนแปลงของกระบวนการตัดสินใจตลาดที่เป็นพื้นฐาน

01:26.360 --> 01:27.440
คุณได้เรียนรู้

01:27.500 --> 01:30.420
และทำไมเราทุกคนพาพวกเขาไปเป็นกลุ่ม

01:30.560 --> 01:39.630
นั่นเป็นเพราะคุณรู้ว่าจำเราไม่ได้พิจารณาการเปลี่ยนแปลงโดยชุดของรัฐชั้นนำหรือสถานะปัจจุบันต่อไปรัฐรางวัลปัจจุบันและการกระทำในปัจจุบัน

01:39.650 --> 01:44.050
เราสร้างแบทช์ง่าย ๆ ที่นี่ด้วยฟังก์ชั่นที่เรียบง่าย

01:44.210 --> 01:48.430
ทรานซิชันของเราอยู่ในรูปของแบทช์แรกสำหรับสถานะนี้

01:48.500 --> 01:53.520
ชุดที่สองสำหรับวันถัดไปที่ชุดสำหรับรางวัลและชุดสำหรับการดำเนินการ

01:53.510 --> 02:04.150
นั่นคือรูปแบบของการเปลี่ยนแปลงของเราในตอนนี้และพวกเขาทั้งหมดสอดคล้องกับความเคารพต่อเวลาด้วยการต่อข้อมูลที่เราทำไว้ที่นี่ด้วยมิติแรก

02:04.160 --> 02:15.400
ดังนั้นประเด็นคือตอนนี้เรามีการเปลี่ยนแปลงของแบทช์หนึ่งชุดสำหรับแต่ละรัฐในวันถัดไปที่เราดูมันในการดำเนินการและเราทำทั้งหมดนี้เพราะเราใช้เคล็ดลับการเล่นซ้ำประสบการณ์นี้

02:15.530 --> 02:18.580
นั่นคือเครือข่ายประสาทลึกของเราสามารถเรียนรู้บางสิ่งได้

02:18.590 --> 02:24.190
จำไว้ว่าถ้าคุณมีการเปลี่ยนแปลงด้วยตัวเองสิ่งที่มันจะเป็นการเรียนรู้แบบทันที

02:24.260 --> 02:28.930
หรือถ้าคุณต้องการเรียนรู้ความจำสั้น ๆ ดังนั้นไฝจะไม่เรียนรู้อะไร

02:29.180 --> 02:45.620
ดังนั้นเราต้องเอาแบทช์เหล่านี้ออกจากหน่วยความจำซึ่งกลายเป็นช่วงการเปลี่ยนภาพของเราและในที่สุดเราก็จะได้ผลลัพธ์ที่แตกต่างกันสำหรับแต่ละสถานะของอินพุตฯ เพื่อคำนวณการสูญเสีย

02:45.680 --> 02:51.860
ไม่ช้าฉันจะเตือนสมการสมดุลที่เป็นหัวใจของอัลกอริทึมการเรียนรู้

02:51.860 --> 02:57.120
ตอนนี้เราจะไปที่ฟังก์ชั่นก่อนอื่นมารับผลสถานะของกล่อง

02:57.170 --> 03:07.670
ดังนั้นฉันจะเรียกผลลัพธ์ที่มีศักยภาพก่อนแล้วเราจะพูดแน่นอนการพูดด้วยตนเองของเราไม่ใช่การเริ่มต้นด้วยตนเอง

03:07.740 --> 03:14.160
ไม่เพราะเราต้องการรับเอาท์พุทโมเดลของเราจากสถานะอินพุตของรัฐ

03:14.510 --> 03:19.110
และเนื่องจากโมเดลของเราคาดหวังว่าจะมีสถานะอินพุตเป็นกลุ่ม

03:19.310 --> 03:25.330
ทีนี้เราก็สามารถใส่สถานะนั้นได้ในตอนนี้สำหรับอินพุตของพวกเขาทั้งหมด

03:25.340 --> 03:35.080
นั่นคือวิธีที่เราเริ่มต้นสถานะที่เข้าสู่เครือข่ายด้วยคำตอบการทรมานด้วยมิติที่คลุมเครือสำหรับชุดที่สมบูรณ์แบบนี้

03:35.180 --> 03:37.720
ตอนนี้เราได้รับผลลัพธ์ของพวกเขาทั้งหมด

03:37.880 --> 03:45.680
แต่แล้วก็มีเคล็ดลับทางเทคนิคอื่นถ้าเราขายโมเดลรุ่นนั้นให้ดีเราจะได้ผลลัพธ์จากการกระทำที่เป็นไปได้ทั้งหมดที่คุณรู้จัก 0 1 และ

03:45.860 --> 03:50.980
2 แต่นั่นไม่ใช่สิ่งที่เราต้องการ

03:50.990 --> 03:54.580
เราสนใจเฉพาะการกระทำที่ถูกเลือก

03:54.740 --> 04:09.320
การกระทำที่ตัดสินใจโดยเครือข่ายในการเล่นในแต่ละครั้งและเพื่อให้ได้รับความสนใจจริง ๆ นั่นคือการกระทำที่เล่นได้ดีเราต้องใช้ฟังก์ชั่นการรวบรวมที่เราป้อนข้อมูลเพราะเราต้องการการกระทำที่เลือก

04:09.320 --> 04:16.840
เราเพิ่มการกระทำนั้นกับอันนี้

04:16.880 --> 04:24.560
และในส่วนนั้นเราจะรวบรวมการกระทำที่ดีที่สุดในการเล่นสำหรับแต่ละสถานะอินพุตของรัฐ

04:24.830 --> 04:31.770
เราไม่ต้องการให้มีการกระทำที่เล่นการกระทำที่เลือกและเราได้รับสิ่งนี้ด้วยการรวบรวมการกระทำนั้น

04:32.130 --> 04:33.390
แต่ก็ต้องระวัง

04:33.450 --> 04:40.190
รัฐที่นี่มีเพชรปลอมและจาระบีลงในชุดและส่วนนั้นไม่ได้

04:40.190 --> 04:46.190
Backstay มีเพราะเราเคยชินกับ Unsworth

04:46.430 --> 04:52.880
ด้วยที่นี่ แต่เราไม่ได้ใช้การบีบแขนสำหรับการกระทำดังนั้นเราต้องเพิ่มที่นี่เพื่อให้การกระทำของ Bache นั้นมีมิติเดียวกับรัฐ

04:53.150 --> 05:09.120
ดังนั้นเราจะเพิ่มจุดแล้วบีบคุณตรงนี้และที่จริงนี่ไม่ใช่ศูนย์ แต่อย่างใดอย่างหนึ่งเพราะศูนย์การตอบสนองต่อศรัทธาไม่ใช่รัฐและคนหนึ่งจะสอดคล้องกับการตรวจสอบการกระทำ

05:09.370 --> 05:16.540
และในที่สุดสิ่งสุดท้ายที่เราต้องทำที่นี่คือเราต้องฆ่าชุดปลอมด้วยการบีบ

05:16.600 --> 05:18.010
ทำไมเราต้องทำเช่นนั้น

05:18.130 --> 05:20.130
เพราะตอนนี้เราอยู่นอกเครือข่ายประสาท

05:20.200 --> 05:22.820
เรามีผลงานของเรา แต่เราไม่ต้องการให้มันกลับมา

05:22.900 --> 05:24.080
เราต้องการพวกเขา

05:24.190 --> 05:26.260
และคำตอบง่ายๆคือเวกเตอร์อย่างง่าย

05:26.260 --> 05:34.880
เวกเตอร์ของเอาท์พุตของแบตช์เมื่อเราทำงานในโครงข่ายประสาทเนื่องจากโครงข่ายประสาทคาดว่ารูปแบบของเซ็นเซอร์จะเป็นแบทช์

05:34.990 --> 05:41.530
แต่ตอนนี้เรามีผลลัพธ์ของเราและในสมการ baluns ถัดไปของการเรียนรู้อย่างลึกล้ำ

05:41.530 --> 05:48.130
ดังนั้นฉันจะฆ่ามันที่นี่และฆ่ามิติความศรัทธาเพื่อให้ได้ผลลัพธ์ที่เรียบง่ายของเรา

05:48.160 --> 05:56.120
ดังนั้นฉันแค่เพิ่มที่นี่จุดแล้วบีบแล้วเพราะฉันต้องการที่จะฆ่าเคลือบปลอมที่สอดคล้องกับด้านหลังของการกระทำ

05:56.250 --> 06:01.430
เนื่องจากเอ็นจิ้นกาลอวกาศมีดัชนีหนึ่งที่ฉันเพิ่มเข้าไป

06:01.560 --> 06:02.050
เอาล่ะ

06:02.100 --> 06:05.480
และตอนนี้เราไปที่นั่นเรามีผลงานของเรา

06:05.490 --> 06:05.910
ตกลง.

06:06.000 --> 06:11.100
เรามีการเตือนเล็กน้อยว่าเอาต์พุตของตัวแปรโลคัลถูกกำหนดไว้ แต่ไม่เคยใช้

06:11.190 --> 06:11.860
ไม่เป็นไร.

06:11.880 --> 06:13.510
เราจะใช้มันอย่างรวดเร็ว

06:13.920 --> 06:15.540
นั่นคือผลลัพธ์ของเรา

06:15.600 --> 06:23.660
และตอนนี้เราต้องการรับ outwits ต่อไปของเราดังนั้นตอนนี้คุณอาจคิดว่าทำไมเราถึงต้องการเอาท์พุทถัดไป

06:23.840 --> 06:31.670
เพื่อที่จะเข้าใจสิ่งนี้เราต้องย้อนกลับไปยังอัลกอริทึมการเรียนรู้อย่างลึกซึ้งซึ่งอยู่ที่นี่ซึ่งเป็นส่วนหนึ่งของคู่มือการตกปลา

06:31.850 --> 06:33.820
นั่นคือกระบวนการแพร่กระจายทั้งหมด

06:33.860 --> 06:39.180
ในตอนแรกเราเริ่มต้นค่าคีย์ทั้งหมดแล้วในแต่ละครั้ง

06:39.440 --> 06:44.770
เราไปที่นั่นแล้วเราเลือกการกระทำด้วยแม็กซ์ soughed นั่นคือสิ่งที่เราทำกับฟังก์ชั่นการเลือก

06:44.870 --> 06:52.120
จากนั้นเราเปิดช่วงการเปลี่ยนภาพแล้วคุณจะเห็นว่าเราได้รับการทำนายว่าเราได้รับเป้าหมาย

06:52.190 --> 06:54.330
เหตุใดเราจึงต้องการเอาต์พุตต่อไปเช่นกัน

06:54.350 --> 07:06.060
นั่นเป็นเพราะเป้าหมายเป้าหมายเท่ากับกานาคูณผลลัพธ์ถัดไปบวกกับที่เราต้องการและเราจะคำนวณเป้าหมายทันทีหลังจากนั้นเนื่องจากเราต้องการผลลัพธ์ถัดไปของเป้าหมาย

07:06.200 --> 07:07.790
ลองคำนวณสิ่งนี้ก่อน

07:07.820 --> 07:19.180
ดังนั้นอีกครั้งเพื่อรับการปรับปรุงต่อไปง่ายมากผลลัพธ์ต่อไปจะเป็นผลมาจากเครือข่ายประสาทของเราเมื่อสถานะถัดไปเป็นแบทช์ป้อนเข้าไป

07:19.190 --> 07:33.020
เพียงแค่เราเอาแบบจำลองของเรานั่นคือโครงข่ายประสาทของเราแล้วคราวนี้การป้อนข้อมูลของโครงข่ายใยประสาทจะเป็นสถานะถัดไปเป็นกลุ่มที่เป็นชุดถัดไป

07:33.200 --> 07:41.290
แต่ตอนนี้จำได้ว่าถ้าเรากลับไปที่อัลกอริธึมเร็วคุณจะเห็นว่าผลลัพธ์ต่อไปคือค่า q

07:41.290 --> 07:45.530
สูงสุดสำหรับสถานะถัดไปที่เกี่ยวกับการกระทำ

07:45.730 --> 07:52.720
ตอนนี้เพื่อให้ได้ผลลัพธ์ต่อไปเราต้องได้ค่า q สูงสุดนี้แล้วผมจะทำที่นี่

07:52.840 --> 08:07.620
แยกออกคุณรู้เพื่อแยกเอาท์พุททั้งหมดของแบบจำลองเพราะเรามีหลายสถานะในชุดถัดไปนี้นั่นคือชุดของสถานะถัดไปทั้งหมดในช่วงการเปลี่ยนภาพทั้งหมดที่นำมาจากตัวอย่างแบบสุ่มของหน่วยความจำของเรา

08:07.840 --> 08:15.250
ดังนั้นฉันจึงแยกพวกมันทั้งหมดออกโดยใช้ฟังก์ชั่น detach จากนั้นฉันก็เอาค่าสองค่านี้

08:15.340 --> 08:23.080
และเนื่องจากเราใช้ค่าสูงสุดทั้งสองค่านี้ด้วยความเคารพต่อการกระทำเราต้องระบุว่ามันเกี่ยวกับการกระทำ

08:23.080 --> 08:26.310
และเนื่องจากการกระทำจะถูกแสดงโดยดัชนีหนึ่ง

08:26.530 --> 08:32.770
ทีนี้เราต้องใส่อันถัดไปตรงนี้แล้วเราต้องระบุว่าเรารับค่าคิวเป็น T บวก

08:33.290 --> 08:41.140
1 นั่นคือสเตจถัดไปและสถานะถัดไปแทน 0 เพราะดัชนีศูนย์สอดคล้องกับรัฐ

08:41.380 --> 08:47.370
ดังนั้นที่นี่เราจำเป็นต้องเพิ่มวงเล็บด้วยดัชนี 0

08:47.770 --> 09:01.490
ด้วยวิธีนี้เราจะได้รับค่าคีย์สูงสุดของสถานะถัดไปที่แสดงโดยศูนย์ถัดไปตามการกระทำทั้งหมดที่แสดงโดยดัชนีหนึ่งและตอนนี้สมบูรณ์แบบที่เราได้รับผลลัพธ์ถัดไปของเรา

09:01.570 --> 09:02.860
เหล่านี้เป็นชุดใหม่

09:02.870 --> 09:04.320
นั่นคือเมื่อเรามีคำเตือน

09:04.320 --> 09:05.050
แต่ก็ไม่เป็นไร

09:05.080 --> 09:07.950
เราจะใช้มันตอนนี้เพื่อคำนวณเป้าหมาย

09:08.470 --> 09:12.510
และการพูดถึงเป้าหมายนั่นคือขั้นตอนต่อไปของฟังก์ชั่นที่รู้จักนี้

09:12.520 --> 09:13.210
ดังนั้นเราไปกันเลย

09:13.220 --> 09:15.460
เป้าหมายเท่ากับ

09:15.670 --> 09:18.220
ตอนนี้ขอกลับไปที่คู่มือ AI AI ของเรา

09:18.400 --> 09:25.710
เป้าหมายเท่ากับคำบวกแกมมาคูณผลลัพธ์ถัดไปคือค่าคิวบ์สูงสุดของวันถัดไป

09:25.930 --> 09:29.290
ตามการกระทำที่เราสามารถคำนวณได้

09:29.340 --> 09:35.590
นั่นก็เท่ากับตัวเองว่าแกมม่าและตัวเองที่แกมม่าถูกกำหนดค่าเริ่มต้น

09:35.590 --> 09:45.100
ที่นี่มีการแนะนำว่าเป็นตัวแปรที่ Virgin Q

09:45.100 --> 09:49.910
ตัววัตถุได้รับผลคูณถัดไปตามที่เราเพิ่งพูดไปและเราต้องการสิ่งที่ดีที่สุด

09:49.940 --> 09:57.400
เรากำลังทำงานกับแบทช์ที่นี่ดังนั้นบวกแบทช์ที่เราต้องการและนั่นคือเป้าหมาย

09:57.520 --> 10:03.820
ในตัวอย่างหนึ่งของแกมมาหน่วยความจำคูณด้วยผลลัพธ์ต่อไป

10:03.900 --> 10:04.480
เอาล่ะ

10:04.480 --> 10:05.080
สมบูรณ์

10:05.110 --> 10:07.100
ดังนั้นตอนนี้เรามีผลลัพธ์ของเรา

10:07.180 --> 10:14.260
เรามีเป้าหมายของเราและดังนั้นเราสามารถคำนวณการสูญเสียความสูญเสียที่แสดงถึงความผิดพลาดของการทำนาย

10:14.500 --> 10:21.000
งั้นเราเรียกสิ่งนี้ว่าสิ่งสุดท้ายสิ่งสุดท้ายคือความแตกต่างชั่วคราว

10:21.040 --> 10:28.720
นั่นคือหัวใจของการเรียนรู้ Q อีกครั้งและ tiddy นี้เราจะเท่ากับการเปิดตัวที่ปรับปรุง Cunanan

10:28.720 --> 10:30.330
ให้ดีขึ้นมาก

10:30.520 --> 10:34.730
นั่นคือฟังก์ชั่นสุดท้ายที่เราจะเลือกสำหรับปัญญาประดิษฐ์ของเรา

10:34.800 --> 10:38.640
สำหรับพวกคุณที่มาจากสนามกรีนกรีนนี่เป็นหลักสูตรสุดท้ายที่ฉันแนะนำ

10:38.680 --> 10:43.280
หากคุณต้องการใช้ Coonerty และเราจะได้รับสิ่งนี้

10:43.510 --> 10:50.380
อีกครั้งเราจะใช้ฟังก์ชั่นจากโมดูลการทำงานที่แสดงโดย F ดังนั้นที่นี่ฉันจะใช้โมดูลการทำงานของเรา

10:50.380 --> 10:57.970
f เป็ดและฮับเบิลที่เราสามารถได้รับด้วยฟังก์ชั่น Smoots L-1

10:57.970 --> 11:02.420
รักอย่างนั้น

11:02.420 --> 11:03.850
ดังนั้นกด Enter

11:03.850 --> 11:07.910
และนั่นคือฟังก์ชั่นการสูญเสียที่ดีที่สุดที่ฉันแนะนำสำหรับการเรียนรู้ลึก

11:07.930 --> 11:09.680
มันช่วยปรับปรุง Culin

11:09.820 --> 11:12.670
แต่นี่คือฟังก์ชั่นดังนั้นฉันจึงเพิ่มวงเล็บ

11:12.850 --> 11:14.740
และตอนนี้ไม่มีอะไรง่ายขึ้น

11:14.830 --> 11:19.340
ข้อโต้แย้งที่เราต้องใส่คือการคาดการณ์และเป้าหมาย

11:19.420 --> 11:24.010
ดังนั้นการทำนายแน่นอนคือผลลัพธ์เพราะนั่นคือผลลัพธ์ของโครงข่ายประสาท

11:24.190 --> 11:27.600
ไม่มีผลลัพธ์ของโครงข่ายประสาทเทียมคือสิ่งที่เครือข่ายประสาทคาดการณ์

11:27.730 --> 11:29.030
นั่นคือคำทำนาย

11:29.260 --> 11:35.900
อาร์กิวเมนต์แรกที่นี่คือผลลัพธ์แล้วอาร์กิวเมนต์ที่สองคือเป้าหมายแน่นอน

11:36.100 --> 11:40.110
สิ่งที่เราพยายามได้มาและมันก็คำนวณได้อย่างสมบูรณ์แบบแล้ว

11:40.150 --> 11:43.150
เราสามารถป้อนเป้าหมายโดยตรง

11:43.150 --> 11:43.630
สมบูรณ์

11:43.650 --> 11:48.200
ตอนนี้เราได้บอกกับเราแล้วว่าเรามีชานิดหน่อยที่นี่

11:48.220 --> 11:48.760
เราจะไปที่นั่น.

11:48.760 --> 11:50.470
ตอนนี้คำเตือนควรหายไป

11:50.890 --> 11:51.420
ใช่.

11:51.430 --> 11:52.110
สมบูรณ์

11:52.180 --> 12:03.230
และตอนนี้เรามีข้อผิดพลาดครั้งล่าสุดที่เราสามารถย้อนกลับข้อผิดพลาดของผู้เผยแพร่กลับเข้าไปในเครือข่ายเพื่ออัปเดตน้ำหนักด้วยการไล่ระดับสีแบบสุ่มและนั่นคือสิ่งที่เรากำลังจะทำในขั้นตอนต่อไป

12:03.490 --> 12:14.850
ดังนั้นแน่นอนตอนนี้สิ่งที่เราต้องทำตามที่คุณอาจคาดเดาคือการเพิ่มประสิทธิภาพเครื่องมือเพิ่มประสิทธิภาพของเราซึ่งเราแนะนำให้คุณเริ่มต้นมันอีกครั้ง

12:15.030 --> 12:23.720
และนั่นคือเครื่องมือเพิ่มประสิทธิภาพอะตอมซึ่งจริงๆแล้วเป็นวัตถุของคลาส Atom และได้ติดตั้งพารามิเตอร์ของแบบจำลองของเราไว้แล้ว

12:23.810 --> 12:31.480
และเราเลือกอัตราการเรียนรู้เป็น 0 อยู่แล้ว 1

12:31.480 --> 12:37.150
เปอร์เซ็นต์เพื่อเพิ่มประสิทธิภาพเครื่องมือเพิ่มประสิทธิภาพของเราพร้อมแล้ว แต่ตอนนี้เราจำเป็นต้องเล่นกับข้อผิดพลาดล่าสุดเพื่อใช้งานตารางสุ่มในน้ำหนักและข้อมูล

12:37.180 --> 12:44.150
ดังนั้นเมื่อทำงานกับนักสู้สิ่งแรกที่เราต้องทำคือเริ่มต้นใหม่อีกครั้งในการวนซ้ำแต่ละรอบ

12:44.200 --> 12:53.310
เราต้องเริ่มต้นเครื่องมือเพิ่มประสิทธิภาพอีกครั้งจากการโต้ตอบหนึ่งไปยังอีกการโต้ตอบหนึ่งในวงนี้เพื่อรับกริดในชุด

12:53.350 --> 12:54.820
และแต่ละรอบของการวนซ้ำ

12:55.200 --> 12:59.410
ทีนี้เราจะใช้วิธีต่อไปนี้ซึ่งเป็นศูนย์

12:59.940 --> 13:00.400
ไปเลย.

13:00.410 --> 13:05.180
การไล่เฉดศูนย์จะเริ่มต้นเครื่องมือเพิ่มประสิทธิภาพใหม่อีกครั้งในแต่ละการวนซ้ำของลูป

13:05.230 --> 13:07.300
งั้นอย่าลืมวงเล็บ

13:07.390 --> 13:08.180
สมบูรณ์

13:08.200 --> 13:14.850
และตอนนี้มันเริ่มต้นใหม่เราสามารถทำการแพร่กระจายย้อนหลังด้วยเครื่องมือเพิ่มประสิทธิภาพของเรา

13:15.190 --> 13:16.380
และเราจะทำอย่างไร

13:16.540 --> 13:24.330
ทีนี้เราก็ทำตามกฏหมายแล้วเราจะกลับไปเผยแพร่มันกลับเข้าไปในเครือข่ายและเพื่อแพร่กระจายกลับสู่เครือข่าย

13:24.460 --> 13:37.180
เราจำเป็นต้องใช้ฟังก์ชั่นย้อนกลับและภายในฟังก์ชั่นย้อนหลังนี้ฉันขอแนะนำให้อินพุตเก็บรักษาตัวแปรขีดล่างและตั้งค่าให้เท่ากับจริง

13:37.240 --> 13:40.990
ฉันแนะนำให้ทำเช่นนี้เพราะจะปรับปรุงการเผยแพร่กลับ

13:41.200 --> 13:52.730
การใช้ตัวแปรเขียนเท่ากับจริงคือการเพิ่มหน่วยความจำบางส่วนและเราจำเป็นต้องเพิ่มหน่วยความจำเพราะเราจะไปหลายครั้งในช่วงสุดท้ายเพื่อที่จะปรับปรุงประสิทธิภาพการฝึกอบรมอย่างแน่นอน

13:52.900 --> 13:58.980
และในที่สุดขั้นตอนสุดท้ายของฟังก์ชั่นที่เรียนรู้นี้คือการมีน้ำหนักของข้อมูลตามการขยายพันธุ์ด้านหลัง

13:58.980 --> 14:02.570
นั่นเป็นไปตามน้ำหนักที่มีส่วนร่วมในข้อผิดพลาด

14:02.800 --> 14:17.560
และเพื่อทำสิ่งนี้เราใช้เครื่องมือเพิ่มประสิทธิภาพของเราอีกครั้งซึ่งเริ่มต้นในการเริ่มต้นใหม่และเราใช้ฟังก์ชั่นขั้นตอนและเพียงแค่กับบรรทัดของรหัสนี้โดยใช้ฟังก์ชั่นขั้นตอน

14:17.560 --> 14:19.450
นี่จะเป็นการอัปเดตน้ำหนัก

14:19.480 --> 14:21.860
นั่นคือบรรทัดของรหัสนี้ที่ปรับปรุงน้ำหนัก

14:21.910 --> 14:31.510
บรรทัดของรหัสนี้ที่แพร่กระจายข้อผิดพลาดไปยังเครือข่ายประสาทและรหัสบรรทัดนี้ใช้เครื่องมือเพิ่มประสิทธิภาพเพื่อปรับปรุงน้ำหนัก

14:31.510 --> 14:36.800
เรามีเครือข่ายการเรียนรู้ที่ถูกต้องขอแสดงความยินดี

14:36.840 --> 14:42.320
นี่อาจเป็นส่วนทางเทคนิคและยากที่สุดของข้อพิพาทหรือพรุ่งนี้ทั้งหมด

14:42.450 --> 14:56.580
ฉันรู้ว่าคบเพลิงของฉันอาจเป็นเรื่องยากในบางครั้งได้อย่างง่ายดายและบีบและบีบ แต่ในที่สุดฉันสัญญาว่าคุณจะได้รับเครือข่ายประสาทที่ทำงานได้ดีมากและดังนั้นจึงเป็นแบบจำลองที่แปลกประหลาด

14:56.580 --> 15:03.150
ดังนั้นตอนนี้เราจะไปยังขั้นตอนต่อไปหรือครูและรุ่นซึ่งจะเป็นฟังก์ชั่นการอัพเดทที่ชัดเจนว่าจะอัพเดทเมื่อ AI

15:03.210 --> 15:07.170
จะค้นพบสถานะใหม่

15:07.170 --> 15:11.420
ดังนั้นคุณจะรู้ว่ามันจะค้นพบรัฐใหม่แล้วมันจะได้รับรางวัล

15:11.520 --> 15:19.510
ขึ้นอยู่กับการกระทำที่ปรากฏขึ้นและสถานะใหม่นี้จะดูแลสิ่งนี้ด้วยฟังก์ชั่นอัพเดทและจะทำเช่นนี้ในบทช่วยสอนถัดไป

15:19.710 --> 15:21.000
จนกว่าจะสนุกแล้ว

15:21.020 --> 15:21.300
ผม.