WEBVTT

00:00.240 --> 00:06.600
สวัสดีและยินดีต้อนรับสู่การสอน Python นี้ใน Statoil

00:06.630 --> 00:08.270
เราจะทำให้ขั้นตอนแรกในการใช้แบบจำลองทฤษฎีเชิงลึก

00:08.280 --> 00:13.590
ดังนั้นโดยพื้นฐานแล้วเรากำลังจะใช้กระบวนการทั้งหมดของอัลกอริธึมการแพร่

00:13.830 --> 00:16.580
ดังนั้นเราจะใช้สิ่งที่เราสร้างมาก่อน

00:16.590 --> 00:24.180
นั่นคือสถาปัตยกรรมของโครงข่ายประสาทเทียมที่จะเล่นซ้ำหน่วยความจำเพื่อรวมสิ่งนี้เข้ากับกระบวนการเรียนรู้แบบถอนพิษทั้งหมด

00:24.180 --> 00:28.320
และอัลกอริทึมการเรียนรู้ทั้งหมดนี้จะเข้ากับชั้นเรียนเดียว

00:28.380 --> 00:32.340
นั่นคือสิ่งสุดท้ายที่เรากำลังทำเพื่อใช้ปัญญาประดิษฐ์

00:32.340 --> 00:35.650
และคลาสนี้ก็จะมีฟังก์ชั่นที่แตกต่างกัน

00:35.700 --> 00:48.450
ดังนั้นเราจะมีฟังก์ชั่นในนั้นซึ่งจะสร้างและเริ่มต้นตัวแปรทั้งหมดที่แนบมากับวัตถุทางอ้อมในอนาคตของเราซึ่งจะเป็นตัวแทนของรูปแบบตัวเองและพวกเขาจะมีฟังก์ชั่นอื่น ๆ

00:48.510 --> 00:52.830
หนึ่งในนั้นคือการเลือกการกระทำที่ถูกต้องในแต่ละครั้ง

00:52.950 --> 01:01.030
นอกจากนี้เรายังจะมีฟังก์ชั่นการอัพเดทฟังก์ชั่นหลักเพื่อรับแกนนี้และมีความคิดว่าการเรียนรู้จะเป็นอย่างไรถ้ามันเป็นไปด้วยดี

01:01.090 --> 01:12.430
หากการสำรวจดำเนินไปได้ด้วยดีและหากสามารถดำเนินต่อไปสู่การเอารัดเอาเปรียบจากนั้นเราจะมีฟังก์ชั่นที่ปลอดภัยในการบันทึกในวันพรุ่งนี้นั่นก็เพื่อช่วยสมองของรถ

01:12.480 --> 01:14.590
ดังนั้นเราจึงมีฟังก์ชั่นให้ทำสองสามอย่าง

01:14.640 --> 01:17.440
เราจะทำฟังก์ชันเดียวสำหรับแต่ละคนที่ทำงานหนัก

01:17.490 --> 01:22.820
และวันนี้เราจะเริ่มต้นด้วยฟังก์ชั่นสุดท้ายตามปกติเมื่อเราทำการเรียน

01:23.010 --> 01:30.040
แต่ก่อนอื่นอย่าลืมแนะนำคลาสดังนั้นเราจะเรียกมันว่าดี

01:30.200 --> 01:35.970
ถามสำหรับเครือข่ายของคุณแล้ววงเล็บบางอันก็เรียกเข้า

01:36.030 --> 01:39.440
จากนั้นเราไปกับฟังก์ชั่นแรกของเรา

01:39.500 --> 01:47.910
งั้นลองทำ def นี่ก่อนแล้วค่อยขีดเส้นใต้สองขีด

01:48.170 --> 01:53.530
ตามที่คุณเข้าใจในฟังก์ชันนี้เราจะแนะนำตัวแปรที่แนบกับวัตถุ

01:53.570 --> 02:03.530
ดังนั้นเราจะมีคู่ของบรรทัดเริ่มต้นด้วยตนเองและโดยทั่วไปเราจะสร้างและเริ่มต้นตัวแปรทั้งหมดที่จำเป็นในการใช้เครือข่าย D2

02:03.530 --> 02:12.190
ตัวอย่างเช่นเราจะสร้างวัตถุหรือเครือข่ายเพราะแน่นอนว่าเราต้องการโครงข่ายประสาทเทียมที่ลึกล้ำของเรา

02:12.300 --> 02:14.630
เราจะสร้างตัวแปรอีกตัวสำหรับหน่วยความจำ

02:14.740 --> 02:20.430
ดังนั้นเราจะมีหน่วยความจำที่แตกต่างกันในตัวเอง แต่นั่นไม่ใช่ทั้งหมดที่เราจะต้องสร้างเช่นกัน

02:20.480 --> 02:22.390
ตัวแปรบางอย่างสำหรับวันสุดท้าย

02:22.490 --> 02:24.820
การกระทำสุดท้ายและคำสุดท้าย

02:24.920 --> 02:30.520
แน่นอนว่าคุณรู้ตัวแปรที่คุณเห็นในอัลกอริธึมการกระจาย

02:30.920 --> 02:31.830
แล้วมีอะไรอีก

02:31.940 --> 02:42.170
นอกจากนี้เรายังต้องการเครื่องมือเพิ่มประสิทธิภาพที่คุณรู้จักเพื่อใช้งานสโตแกติกกริดในแง่ของน้ำหนักข้อมูลตามจำนวนที่พวกเขาจะมีส่วนร่วมกับข้อผิดพลาด

02:42.320 --> 02:50.230
เมื่อ AI ทำผิดและจากนั้นฉันคิดว่านั่นเป็นตัวแปรที่เราต้องสร้างและเริ่มต้น

02:50.510 --> 03:00.190
แต่ในฟังก์ชั่นเริ่มต้นนี้เราจะใส่ข้อโต้แย้งสองสามข้อเป็นตัวตนปกติซึ่งเป็นข้อโต้แย้งที่อ้างถึงวัตถุ

03:00.200 --> 03:05.210
จากนั้นเมื่อคุณรู้ว่าเรากำลังจะสร้างวัตถุของคลาสเครือข่าย

03:05.390 --> 03:13.740
เนื่องจากคลาสเครือข่ายใช้เป็นอาร์กิวเมนต์ในขนาดอินพุตของฟังก์ชัน init และการดำเนินการนั่นก็เหมือนกันที่นี่

03:13.850 --> 03:20.180
เมื่อสร้างวัตถุของคลาสเครือข่ายเราจะต้องเลือกอาร์กิวเมนต์ขนาดอินพุตและอาร์กิวเมนต์จริง

03:20.180 --> 03:27.520
ดังนั้นเราสามารถคัดลอกพวกเขาที่นี่และที่เราไป

03:27.710 --> 03:30.450
ดังนั้นข้อโต้แย้งเหล่านี้จะกลายเป็น

03:30.560 --> 03:33.160
ข้อโต้แย้งบางอย่างก็ไม่สามารถอยู่ได้

03:33.170 --> 03:46.330
เมื่อใดก็ตามที่เราสร้างวัตถุในอนาคตของคลาสที่แตกต่างกันซึ่งแบบจำลองบทบาทสมมุติในอนาคตเราจะต้องระบุขนาดอินพุตที่ฉันเตือนคือจำนวนมิติในเวกเตอร์

03:46.370 --> 03:52.940
อินพุตของคุณระบุและจำนวนของการกระทำซึ่งเป็นจำนวนของการกระทำที่เป็นไปได้ที่รถสามารถทำได้

03:53.150 --> 03:54.000
ดังนั้นฉันเตือนคุณ

03:54.110 --> 03:57.830
สิ่งเหล่านี้อาจไปทางซ้ายหรือทางขวา

03:58.190 --> 03:59.270
โอเคสมบูรณ์แบบ

03:59.270 --> 04:10.680
จากนั้นคุณก็รู้ว่าคุณจะสร้างวัตถุใหม่ของคลาสหน่วยความจำการเล่นซ้ำเพื่อสร้างวัตถุหน่วยความจำเพื่อรับหน่วยความจำของการเปลี่ยนแปลงและในข้อมูลที่เรามีอาร์กิวเมนต์ความจุ

04:10.850 --> 04:16.640
แต่เนื่องจากเราจะใช้เพียงครั้งเดียวจริง ๆ

04:16.640 --> 04:20.000
แล้วเมื่อเราสร้างหน่วยความจำและไม่ได้หลังจากนั้นเราก็ไม่จำเป็นต้องระบุอาร์กิวเมนต์ความจุ

04:20.030 --> 04:25.330
เราสามารถทำสิ่งนี้ได้ แต่จะป้อนจำนวนการเปลี่ยนแปลงที่เราต้องการให้หน่วยความจำของเรามีโดยตรง

04:26.150 --> 04:32.390
แต่เราต้องการอาร์กิวเมนต์สุดท้ายอันหนึ่งเพื่อรับพารามิเตอร์ในโมเดลครู

04:32.480 --> 04:35.470
โปรดจำไว้ว่าพารามิเตอร์แกมมานี้คือความล่าช้า

04:35.750 --> 04:42.920
และนั่นคือพารามิเตอร์ของสมการดังนั้นเราจะใส่ตรงนี้เพราะเราจะใช้มันหลังจากนั้นหลายครั้ง

04:43.160 --> 04:44.990
งั้นลองใส่มันที่นี่

04:45.070 --> 04:47.140
เราจะเรียกมันว่าแกมม่า

04:47.150 --> 04:53.740
เพื่อให้มันเป็นเพียงชื่อของการโต้แย้งแล้วเราไปว่าข้อโต้แย้งทั้งหมดที่คุณจะต้องใช้ในการทำงานของมัน

04:53.750 --> 05:01.390
นั่นหมายความว่าเมื่อใดก็ตามที่เราสร้างแบบจำลองพจนานุกรมของเรานั่นคือเมื่อใดก็ตามที่เราสร้างวัตถุของครูในชั้นเรียน

05:01.520 --> 05:08.060
เราจะต้องระบุอาร์กิวเมนต์เป็นขนาดอินพุตจำนวนการกระทำและพารามิเตอร์

05:08.360 --> 05:10.590
และเราจะจบลงด้วยคุณค่าที่แท้จริงสำหรับพวกเขา

05:11.210 --> 05:13.870
เอาล่ะทีนี้มาฟังก์ชั่นกันดีกว่า

05:14.100 --> 05:14.400
ตกลง.

05:14.410 --> 05:16.480
ตอนนี้โดยทั่วไปสิ่งนี้จะเป็นเรื่องง่าย

05:16.510 --> 05:21.090
เรากำลังจะสร้างและเริ่มต้นตัวแปรทั้งหมดที่เราต้องการ

05:21.110 --> 05:22.770
ลองเริ่มด้วยอันแรกก่อน

05:22.910 --> 05:24.460
เริ่มจากแกมม่ากันก่อน

05:24.530 --> 05:26.090
จริง ๆ แล้วค่าสัมประสิทธิ์ความล่าช้า

05:26.330 --> 05:31.850
ดังนั้นเนื่องจากนี่คือ Voivode ต้องการที่จะยึดติดกับวัตถุของเธอเราจึงเริ่มด้วยตนเอง

05:31.880 --> 05:42.930
ดังนั้นแกมม่าจะเป็นตัวแปรของครูของเราและสร้างแบบจำลองเองที่แกมม่าเท่ากับอาร์กิวเมนต์ที่จะถูกป้อนเมื่อสร้างวัตถุของคลาส detune

05:42.950 --> 05:46.900
ดังนั้น Janna และที่นั่นเราจะไปพร้อมกับข้อโต้แย้งที่สอง

05:47.040 --> 05:50.560
อาร์กิวเมนต์ที่สองจะเป็นหน้าต่างรางวัล

05:50.840 --> 05:52.340
หน้าต่างนี้คืออะไร

05:52.520 --> 05:57.950
นั่นจะเป็นหน้าต่างเลื่อนของค่าเฉลี่ยของ

05:58.010 --> 06:06.320
100 คำสุดท้ายที่คุณจะใช้เพื่อประเมินวิวัฒนาการของการแสดงที่คุณรู้ว่าจะมีความหมายของคำในสงคราม Windu ที่จะเลื่อนเมื่อเวลาผ่านไป

06:06.440 --> 06:11.680
และสิ่งที่เราต้องการสังเกตคือความหมายของ 100 คำที่เพิ่มขึ้นเมื่อเวลาผ่านไป

06:11.930 --> 06:18.610
ดังนั้นเริ่มต้นด้วยตัวเองที่ให้รางวัลหน้าต่างขีดล่าง

06:18.710 --> 06:24.690
เนื่องจากนี่จะเป็นหน้าต่างบานเลื่อนของค่าเฉลี่ยการเปลี่ยนแปลงของ 100 คำสุดท้าย

06:24.860 --> 06:31.710
ทีนี้เราจะเริ่มต้นมันเป็นรายการว่างแล้วเราจะขยายไปถึงค่าเฉลี่ยว่าเราทำงานล่วงเวลา

06:32.860 --> 06:35.320
ถูกต้องแล้วน่าตื่นเต้นมากขึ้น

06:35.420 --> 06:37.430
มาสร้างเครือข่ายประสาทของเรากัน

06:37.580 --> 06:43.780
ดังนั้นเราจะเรียกมันว่ามาริโอที่สอนตัวเองเพราะโดยพื้นฐานแล้วนั่นคือหัวใจของแบบจำลอง

06:43.790 --> 06:53.270
ฉันเรียกมันว่าแบบจำลองและแบบจำลองนี้จะไม่มีอะไรอย่างอื่นนอกจากวิชาในชั้นเรียนนั้นและเพื่อสร้างวัตถุดังกล่าว

06:53.300 --> 07:02.630
เราใช้เครือข่ายคลาสของเราในวงเล็บและที่นี่เราแค่ใส่อาร์กิวเมนต์ของคลาส แต่เราใส่อาร์กิวเมนต์เหล่านี้ในอาร์กิวเมนต์ของฟังก์ชัน

07:02.750 --> 07:15.290
init และดังนั้นเราต้องคัดลอกตรงนี้และวางในคลาสเครือข่าย ไปกับบรรทัดของรหัสนี้

07:15.350 --> 07:22.690
เราสร้างโครงข่ายประสาทเทียมหนึ่งเดียวสำหรับการเรียนรู้รูปแบบที่สมบูรณ์แบบแล้วมาสร้างความทรงจำ

07:22.880 --> 07:29.930
ดังนั้นอีกครั้งเราจะสร้าง Vargo ใหม่ที่เราเรียกว่าความทรงจำที่สอนตัวเอง

07:29.930 --> 07:34.190
และนี่จะเป็นวัตถุของคลาสหน่วยความจำการเล่นซ้ำ

07:34.220 --> 07:49.880
งั้นลองจดชื่อหรือคลาสกันเถอะคัดลอกมาลองดูตรงนี้และในวงเล็บเราต้องใส่ความจุเพราะความจุเป็นอาร์กิวเมนต์ของฟังก์ชันและนั่นเป็นอาร์กิวเมนต์เดียวที่เราต้องการที่นี่

07:50.240 --> 07:59.800
ดังนั้นสิ่งที่เรากำลังจะเลือกจำไว้ว่าสอดคล้องกับจำนวนของการเปลี่ยนจำนวนเหตุการณ์ล่าสุดสถานะที่คุณระบุการกระทำล่าสุดและคำสุดท้าย

07:59.830 --> 08:07.550
และดังที่กล่าวไว้ในหนึ่งใน

08:07.550 --> 08:18.670
Priester toils เราจะใช้การเปลี่ยนหนึ่งแสนหนึ่งแสนหนึ่งแสนหน่วยความจำแล้วเราจะสุ่มตัวอย่างจากหน่วยความจำนี้เพื่อรับการเปลี่ยนแบบสุ่มจำนวนเล็กน้อยและแบบจำลองจะตกลง

08:18.720 --> 08:21.210
ดังนั้นตอนนี้เรามีความทรงจำที่สมบูรณ์แบบ

08:21.210 --> 08:23.180
ตอนนี้มารับเครื่องมือเพิ่มประสิทธิภาพของเรา

08:23.430 --> 08:35.320
ตัวเราเองอีกครั้งเราสร้างตัวแปรใหม่ที่เราเรียกเครื่องมือเพิ่มประสิทธิภาพดังนั้นเครื่องมือเพิ่มประสิทธิภาพเป็นตัวแปรในอนาคตของเรา dequeue ตัววัตถุที่เพิ่มประสิทธิภาพ

08:35.520 --> 08:47.080
และตอนนี้ถ้าเรากลับขึ้นไปคุณจะเห็นว่าเรานำเข้าทรมานอัพตันซึ่งเป็นไฟฉายแบบแยกส่วนที่มีเครื่องมือทั้งหมดที่จะดำเนินการเพื่อให้ได้ตารางในศูนย์

08:47.130 --> 09:03.060
แน่นอนว่ามันมีตัวเพิ่มประสิทธิภาพและเราให้ทางลัดอัพตันและนี่คือสิ่งที่เรากำลังจะทำคือนำแบบจำลองขึ้นไปหาเขาซึ่งเป็นไฟฉายที่ขึ้นอยู่กับเขาและจากโมดูลนี้เราจะใช้หนึ่งใน เพิ่มประสิทธิภาพ

09:03.180 --> 09:05.670
ดังนั้นคุณจะเห็นว่าพวกเขาอยู่ในรายการทั้งหมดที่นี่

09:05.880 --> 09:10.630
หลายคนยอดเยี่ยมเช่น Propp ของเกราะเป็นตัวปรับที่ยอดเยี่ยม

09:10.640 --> 09:16.170
มีตัวอย่างที่แนะนำเป็นอย่างยิ่งสำหรับบันทึกของเครือข่ายประสาทหรือการเรียนรู้อย่างลึกล้ำ

09:16.230 --> 09:22.140
แต่อีกอันที่ยอดเยี่ยมและเขาจะเลือกคือเครื่องมือเพิ่มประสิทธิภาพอะตอม

09:22.500 --> 09:26.400
นั่นคือสิ่งที่คุณจะเห็นว่าด้วยสิ่งนี้จะได้รับรถยนต์ที่ขับด้วยตนเองได้ดี

09:26.580 --> 09:32.810
แต่อีกครั้งคุณยินดีที่จะลองคนอื่น ๆ คุณสามารถลองใช้อาวุธได้ แต่สำหรับโลหะเราจะเลือกอดัม

09:32.850 --> 09:34.290
ดังนั้นฉันจึงกด Enter

09:34.560 --> 09:37.240
และในความเป็นจริงคุณจะสังเกตเห็นว่ามีหน่วยงานของรัฐที่นี่

09:37.260 --> 09:40.430
นั่นเป็นเพราะเรากำลังสร้างวัตถุของคลาส Atom

09:40.430 --> 09:44.990
นี่เป็นคลาส แต่วัตถุจะเป็นตัวเพิ่มประสิทธิภาพอะตอมเอง

09:45.060 --> 09:50.970
แต่เนื่องจากนี่เป็นคลาสเราต้องใส่อาร์กิวเมนต์บางอย่างอาร์กิวเมนต์ของคลาส Atom

09:51.060 --> 09:55.270
และอาร์กิวเมนต์เป็นพารามิเตอร์ทั้งหมดที่สามารถปรับแต่งและเครื่องมือเพิ่มประสิทธิภาพของคุณ

09:55.380 --> 10:00.330
ตัวอย่างเช่นโดยทั่วไปแล้วอัตราการเรียนรู้จะลดลงหรือพารามิเตอร์อื่น ๆ

10:00.510 --> 10:05.690
และนอกจากการใช้พารามิเตอร์ทั้งหมดของ Ormeau เราจะระบุอัตราการเรียนรู้

10:05.970 --> 10:08.650
ดังนั้นมันจึงเริ่มต้นจากพารามิเตอร์ของแบบจำลองของเรา

10:08.670 --> 10:12.830
เราสามารถทำให้พวกเขามีรูปแบบการสงสัยตนเอง

10:12.870 --> 10:17.530
นั่นคือรูปแบบที่เราสร้างขึ้นที่นี่รูปแบบการเรียนรู้ด้วยตนเองจากชั้นเรียนของเราเอง

10:17.580 --> 10:28.170
ดังนั้นโมเดลที่เรียนรู้ด้วยตนเองแล้วจึงเข้าถึงพารามิเตอร์ของโมเดลที่เราเพิ่มจุดอื่นแล้วพารามิเตอร์ด้วยวงเล็บบางอย่างง่ายมาก

10:28.170 --> 10:42.810
นั่นเป็นเพียงการเชื่อมต่อโปรแกรมเพิ่มประสิทธิภาพแอดออนเข้ากับเครือข่ายประสาทเทียมของเรากับสิ่งที่เราสร้างขึ้นที่นี่อีกครั้งจากนั้นเมื่อเราเพิ่งพูดว่า

10:43.170 --> 10:50.540
และเราจะตั้งค่าเท่ากับค่าที่การเรียนรู้จะไม่เกิดขึ้นเร็วเกินไปหากเราได้รับอัตราการเรียนรู้ที่มากเกินไป AI AI

10:50.540 --> 10:53.910
จะเรียนรู้อย่างถูกต้อง

10:53.910 --> 10:58.890
เราต้องการให้เวลากับ AI ในการสำรวจเรียนรู้จากความผิดพลาด

10:58.890 --> 11:05.510
คุณรู้ว่าเมื่อเราลงโทษมันเมื่อมันทำผิดพลาดบางอย่างเช่นไปสู่ความรู้สึกบางอย่างหรือเข้าใกล้กำแพงมากเกินไป

11:05.770 --> 11:08.780
เราต้องการให้เวลาในการเรียนรู้

11:08.880 --> 11:12.030
เราต้องการวิธีในการเครือข่ายประสาทในวันที่อย่างถูกต้อง

11:12.180 --> 11:21.010
ดังนั้นมูลค่าที่ดีสำหรับอัตราการเรียนรู้ที่ฉันได้รับหลังจากลองหลาย ๆ ครั้งก็คือ 0 2 หรือหนึ่ง

11:21.210 --> 11:24.540
ถูกต้องและนั่นคือทั้งหมดที่เราต้องสร้างเครื่องมือเพิ่มประสิทธิภาพ

11:24.720 --> 11:28.320
โดยพื้นฐานแล้วคุณกำลังสร้างวัตถุของคลาส Atom

11:28.530 --> 11:29.050
ยิ่งใหญ่

11:29.070 --> 11:35.980
จากนั้นตัวแปรสามตัวสุดท้ายที่เราต้องการคือตัวแปรที่ประกอบเหตุการณ์การเปลี่ยนแปลงของเรา

11:36.150 --> 11:40.130
นั่นคือวันสุดท้ายที่การกระทำสุดท้ายและคำสุดท้าย

11:40.170 --> 11:45.280
นั่นคือสิ่งที่เราจะสร้างขึ้นในตอนนี้และเราต้องเริ่มต้นมันก่อน

11:45.300 --> 11:50.130
ดังนั้นเรามาเริ่มด้วยวันที่สุดท้ายวันสุดท้ายที่เราจะเรียกมันว่าการเรียนรู้ด้วยตนเอง

11:50.400 --> 11:56.000
สถานะขีดล่างสุดท้ายแล้วคุณจะเริ่มต้นอย่างไร

11:56.190 --> 12:04.700
โปรดจำไว้ว่าวันสุดท้ายคือเวกเตอร์ของ 5 dominations เวกเตอร์ที่ถูกเข้ารหัสในสถานะหนึ่งของสภาพแวดล้อม

12:04.950 --> 12:15.180
และเพื่อเป็นการเตือนความทรงจำทั้งห้ามิตินี้คือสัญญาณสามตัวของเซ็นเซอร์สามตัวที่เหลือทั้งทางตรงและทางขวาและการวางแนวและการวางแนวลบ

12:15.210 --> 12:18.350
นี่คือเวกเตอร์และความรู้สึกหยั่งรู้

12:18.420 --> 12:21.060
แต่สำหรับคบไฟมันต้องมีมากกว่าเวกเตอร์

12:21.210 --> 12:23.640
จริงๆแล้วมันต้องเป็นเทนเซอร์ไฟฉาย

12:23.820 --> 12:29.970
แต่ไม่เพียง แต่จะต้องเป็นเซ็นเซอร์ไฟฉายเท่านั้น

12:29.970 --> 12:33.510
แต่ยังต้องมีอีกหนึ่งมิติที่ฉันต้องการเรียกว่ามิติปลอมที่สอดคล้องกับแบทช์

12:33.630 --> 12:48.040
และนั่นเป็นเพราะแปดสุดท้ายจะเป็นอินพุตของเครือข่ายประสาท แต่เมื่อทำงานกับฉันเมื่อมันทำงานโดยทั่วไปไม่ว่าจะเป็นการไหลที่หนาแน่นขึ้นถือไฟฉายในขณะที่เวกเตอร์อินพุตไม่สามารถเป็นเวกเตอร์ง่ายๆ

12:48.210 --> 12:49.760
มันจะต้องอยู่ในชุด

12:49.830 --> 12:57.660
เครือข่ายสามารถยอมรับแบทช์ของการสังเกตการป้อนข้อมูลเท่านั้นดังนั้นจึงไม่เพียง แต่จะสร้างเมตริกซ์สำหรับเวกเตอร์สถานะอินพุต

12:57.870 --> 13:05.140
แต่เราจะสร้างมิติปลอมนี้ที่สอดคล้องกับแบทช์

13:05.190 --> 13:12.340
ดังนั้นให้ทำสิ่งนี้และเริ่มต้นด้วยการเริ่มต้นคบเพลิงเทนเซอร์เพื่อทำสิ่งนี้ไม่มีอะไรง่าย ๆ

13:12.510 --> 13:21.810
เราใช้ห้องสมุด torche

13:21.810 --> 13:27.950
ของเราแล้วจุดแล้วเราจะใช้คลาสเทนเซอร์เพราะคุณอาจเดาได้ว่าสิ่งนี้จะสร้างวัตถุของคลาสเทนเซอร์ที่เป็นวัตถุเทนเซอร์

13:28.120 --> 13:34.660
และในเมตริกซ์นี้เราต้องใส่อาร์กิวเมนต์ที่จะระบุขนาดของเมตริกซ์

13:34.660 --> 13:38.720
คุณสามารถนึกภาพได้ว่าคุณจะชอบอาร์เรย์ที่มีประเภทเดียว

13:38.890 --> 13:49.380
แต่โดยทั่วไปสิ่งที่สิ่งนี้จะนำเสนอในขณะนี้คือแน่นอนว่าสถานะอินพุตนี้ซึ่งคุณสามารถเห็นได้มีเวกเตอร์และเพื่อระบุจำนวนขององค์ประกอบของระยะทาง

13:49.570 --> 13:57.520
เราจำเป็นต้องใช้ขนาดอินพุตแน่นอนเพราะขนาดอินพุตเป็นจำนวนมิติของเวกเตอร์สถานะอินพุตของเรา

13:57.520 --> 13:59.050
ตอนนี้ฉันควรพูดถึงเทนเซอร์

13:59.170 --> 14:05.650
และสิ่งที่เราต้องป้อนในคลาสเทนเซอร์เพื่อสร้างวัตถุเทนเซอร์

14:06.010 --> 14:07.260
นั่นไม่แน่ชัด

14:07.540 --> 14:10.230
และหลังจากนั้นขนาดอินพุตจะถูกวัดปริมาณ

14:11.350 --> 14:12.430
เอาล่ะนั่นเป็นเรื่องดี

14:12.430 --> 14:13.670
นั่นเป็นสิ่งแรกที่ทำ

14:13.720 --> 14:17.390
เราเพิ่งเริ่มต้นเมตริกซ์ตามที่ควรจะเป็น

14:17.530 --> 14:37.800
แต่จำไว้ว่าเราต้องทำสิ่งอื่นที่เราจำเป็นต้องสร้างมิติปลอมเพราะนี่คือสิ่งที่เครือข่ายคาดหวังสำหรับอินพุตและเพื่อสร้างสิ่งนี้สำหรับการตรวจสอบซึ่งโดยวิธีการจะต้องเป็นเครื่องมือในครั้งแรกที่คุณรู้ว่า ใส่ลงในชุดจะเป็นครั้งแรกที่ฉันพูดถึงเรื่องนี้สมมติว่าเป็นอย่างดี

14:38.230 --> 14:46.050
ทีนี้เมื่อต้องการทำสิ่งนี้เราก็แค่ต้องบวกมันเข้าไปแล้วบีบเข้าไปในวงเล็บ

14:46.050 --> 14:49.580
เราต้องใส่ดัชนีของมิติใหญ่นี้

14:49.620 --> 15:03.570
และอย่างที่ฉันเพิ่งพูดมิติปลอมนี้จะต้องเป็นแอนิเมชั่นแรกของวันที่ล่าสุดและเนื่องจากดัชนีและไบต์และเริ่มเป็นศูนย์เราจำเป็นต้องใส่ศูนย์เพื่อที่เครื่องยนต์กระบวนทัศน์ใหม่นี้จะกลายเป็นเครื่องมือบรรทัดแรก

15:03.570 --> 15:16.910
ดังนั้นเรามีเอ็นจิ้นครั้งแรกที่สอดคล้องกับแบทช์แล้วเพชรควรตอบสนองต่อเซ็นเซอร์นั้นซึ่งจะมีองค์ประกอบห้าองค์ประกอบของอินพุตของคุณระบุทิศทางการส่งสัญญาณทั้งสามและการวางแนวลบ

15:17.370 --> 15:21.960
จากนั้นเราก็ไปเริ่มต้นสถานะอินพุตของเราอย่างถูกต้อง

15:21.960 --> 15:22.850
สมบูรณ์

15:23.310 --> 15:31.850
จากนั้นตัวแปรสองตัวที่จะไปและนั่นจะง่ายกว่ามากเพราะตัวแปรถัดไปคือการกระทำสุดท้าย

15:32.190 --> 15:36.340
นั่นเป็น Roybal ใหม่ที่เราสร้างขึ้นสำหรับการกระทำล่าสุดของ Object

15:36.510 --> 15:43.440
และจำไว้ในบทช่วยสอนแรกของส่วนที่ฉันบอกคุณว่าการกระทำจะเป็น 0 1

15:43.440 --> 15:52.470
หรือ 2 แล้วใช้เวกเตอร์การหมุนของการกระทำเราจะแปลงดัชนีเหล่านี้ของการกระทำเหล่านี้เป็นมุมของการหมุนซึ่งผมเตือน 0 20

15:52.470 --> 15:58.010
หรือลบ 20

15:58.050 --> 16:00.980
เราสามารถฟื้นฟูความทรงจำของเราได้

16:01.200 --> 16:03.170
มันอยู่ตรงนี้

16:03.170 --> 16:06.260
การดำเนินการหมุนถ้าการกระทำเป็นศูนย์

16:06.390 --> 16:11.650
นี่จะตรงกับดัชนีแรกของศูนย์ถ้าการกระทำคือ 1

16:11.700 --> 16:17.310
นี่จะตรงกับดัชนีหนึ่งในเวกเตอร์เหล่านี้ที่ 20

16:17.310 --> 16:23.490
องศาและถ้าการกระทำคือเราจะได้ลบ 20 องศานั่นคือมุมการหมุนของรถของเราเมื่อเราเล่นแอ็คชั่น

16:23.510 --> 16:24.200
เอาล่ะ

16:24.380 --> 16:31.740
และเนื่องจากการกระทำจะเป็นอย่างใดอย่างหนึ่ง 0 1 หรือ 2 การกระทำมีอยู่สำหรับตัวเลขอย่างง่าย

16:31.850 --> 16:35.440
และอย่างง่ายมากเราสามารถเริ่มต้นให้เป็นศูนย์

16:35.660 --> 16:38.330
เราไม่จำเป็นต้องสร้างหมื่นหรือได้ยินสิ่งอื่นใด

16:38.360 --> 16:40.880
เราแค่ต้องเริ่มต้นด้วยศูนย์

16:41.420 --> 16:42.850
และในที่สุดก็.

16:43.010 --> 16:44.460
นั่นคือคำสุดท้าย

16:44.550 --> 16:48.840
มันเป็นคำพูดสุดท้าย

16:48.860 --> 16:49.940
เราจะไปที่นั่น.

16:49.940 --> 16:56.510
และอีกคำคือจำนวนลอยซึ่งฉันเตือนอยู่ระหว่างลบ 1 และบวก 1

16:56.510 --> 16:57.790
นั่นคือตัวเลขอีกครั้ง

16:57.860 --> 16:59.400
และสำหรับการกระทำนั้น

16:59.510 --> 17:02.900
เราจะเริ่มต้นให้เป็นศูนย์แล้วเราไป

17:02.900 --> 17:06.330
ขอแสดงความยินดีอยู่ในนั้นฟังก์ชั่นพร้อม

17:06.350 --> 17:08.930
ดังนั้นตอนนี้เราพร้อมที่จะไปยังสิ่งที่น่าตื่นเต้น

17:08.930 --> 17:16.040
และที่จริงแล้วสิ่งที่สำคัญที่สุดสำหรับ

17:16.080 --> 17:23.240
AI คือการตัดสินใจว่าจะเล่นแอ็คชั่นใดในแต่ละครั้งและแต่ละครั้งและนั่นคือสิ่งที่เรากำลังจะทำในบทช่วยสอนถัดไป

17:23.510 --> 17:27.310
ดังนั้นเรามาทำสิ่งต่อไปนี้เพื่อทำงานหนักและจนถึงตอนนั้นผม