WEBVTT

00:00.420 --> 00:03.950
สวัสดีและยินดีต้อนรับอีกครั้งสู่ Maggio รถที่ขับด้วยตนเองของเรา

00:03.960 --> 00:10.200
ดังนั้นในเพียง

00:10.410 --> 00:20.950
toile ฉันจะอธิบายสภาพแวดล้อมที่เราจะใช้ปัญญาประดิษฐ์ของเราและที่จะมีแน่นอนรถที่จะฝึกอบรมเพื่อขับเองและเพื่อหลีกเลี่ยงอุปสรรคและที่จะวาดถนนและบล็อก รถยนต์ของเราเพื่อนำทางรอบพวกเขา

00:21.210 --> 00:28.170
ดังนั้นเราจะสร้างปัญญาประดิษฐ์นี้ขึ้นมาเพื่อฝึกฝนรถคันนี้ให้ขับบนถนนที่คุณรู้จักโดยไม่ต้องข้ามขีด จำกัด

00:28.170 --> 00:33.830
และหลีกเลี่ยงอุปสรรคบางอย่างที่จะทำให้อยู่ภายในถนน

00:34.140 --> 00:35.870
ดังนั้นนี่เป็นความท้าทายที่น่าตื่นเต้น

00:35.910 --> 00:47.090
และจริงๆแล้วมีไฟล์สองไฟล์แยกกันอย่างที่คุณเห็นนั่นคือเอเพ็กซ์และไก่ซึ่งเป็นปัญญาประดิษฐ์ที่จะทำการฝึกอบรมทั้งหมดเพื่อฝึกอบรมรถยนต์ว่าจะขายไดรฟ์อย่างไร

00:47.280 --> 00:52.080
และเรามีแผนที่ที่เราพบว่าเป็นรหัสที่ทำให้สภาพแวดล้อมทั้งหมดนี้

00:52.110 --> 00:57.090
ดังนั้นนี่คือรหัสที่จริง ๆ แล้ว 200 บรรทัดของรหัสอีกเล็กน้อย

00:57.090 --> 01:00.460
ดังนั้นรหัสนี้มักจะไม่เกี่ยวข้องกับ AI

01:00.510 --> 01:03.380
มันเป็นเพียงรหัสเพื่อให้สภาพแวดล้อมในการสร้างแผนที่

01:03.420 --> 01:13.610
ดังนั้นฉันจะอธิบายแต่ละส่วนทีละหนึ่งเพื่ออธิบาย แต่เราจะไม่ใช้โค้ดนี้ทีละบรรทัดเนื่องจากเราต้องการเน้นปัญญาประดิษฐ์

01:13.740 --> 01:17.160
แต่เรายังคงต้องผ่านแต่ละส่วนเพื่อทำความเข้าใจว่าเกิดอะไรขึ้น

01:17.370 --> 01:22.020
ดังนั้นก่อนอื่นเรานำเข้าไลบรารีส่วนกลางที่มีไว้สำหรับรหัสใด ๆ

01:22.110 --> 01:28.770
เราต้องการห้องสมุดบางแห่งเพื่อทำงานบางอย่างได้อย่างมีประสิทธิภาพมากกว่าที่เรานำเข้าแพ็คเกจ cavy ทั้งหมด

01:28.890 --> 01:35.140
นั่นไม่สำคัญนักเพราะทั้งหมดนี้เป็นข้อมูลเฉพาะของ Cavey ที่เราใช้เพื่อทำแผนที่

01:35.190 --> 01:42.210
ดังนั้นเราจึงนำเข้าคลาสและวัตถุจำนวนมากเพื่อให้สามารถทำแผนที่นี้และเพิ่มเครื่องมือบางอย่างในแผนที่

01:42.210 --> 01:44.420
เอาล่ะสายนี้มีความสำคัญ

01:44.430 --> 01:57.760
บรรทัดนี้มีความเกี่ยวข้องเพราะโดยทั่วไปนี่คือที่เรานำเข้าสมองของเราสมองของรถยนต์ซึ่งจะเป็นเจ็ทอื่นของสิ่งนี้คุณในชั้นเรียนและครูในชั้นเรียน

01:57.820 --> 02:00.570
เป็นปัญญาประดิษฐ์ของเราเอง

02:00.570 --> 02:04.680
คุณจะเห็นว่าเราจะใช้ dequeue ในชั้นเรียนในบทช่วยสอนต่อไปนี้

02:04.680 --> 02:09.650
และอย่างที่คุณคาดเดาได้เช่น dequeue สำหรับเครือข่าย Q ลึก

02:09.650 --> 02:15.450
ดังนั้นเราจะใช้เครือข่ายการเรียนรู้แบบ dequeue

02:15.540 --> 02:21.910
และเมื่อพร้อมแล้วเราจะนำเข้าที่นี่ด้วยบรรทัดนี้จาก AI และดวงตาของหลักสูตรเป็นไฟล์หลาม

02:21.990 --> 02:22.310
เอาล่ะ

02:22.320 --> 02:24.450
ดังนั้นรอไม่ไหวที่จะใช้สิ่งนี้

02:24.450 --> 02:33.200
นี่จะเป็นการเดินทางค่อนข้างมาก แต่คุณจะเห็นว่าสิ่งนี้จะน่าตื่นเต้นมากเพราะต้องขอบคุณฉันฉันจะสามารถขับรถเองได้

02:33.270 --> 02:33.880
เอาล่ะ

02:33.880 --> 02:39.060
และตอนนี้ก่อนที่ฉันจะไปยังส่วนถัดไปเราต้องอธิบายว่าเราจะฝึกรถคันนี้อย่างไร

02:39.060 --> 02:48.080
ตอนนี้ฉันจะไม่อธิบายโครงข่ายประสาท แต่ฉันจะอธิบายแนวคิดว่าเราจะฝึกให้รถขับเองและหลีกเลี่ยงอุปสรรคได้อย่างไร

02:48.360 --> 02:54.130
ดังนั้นคุณจะรู้ว่าในชีวิตจริงถ้าคุณต้องการฝึกรถจริงเพื่อหลีกเลี่ยงกำแพงหรือสิ่งกีดขวาง

02:54.390 --> 02:55.580
คุณจะทำอะไรดี

02:55.830 --> 03:01.130
แน่นอนว่าคุณจะไม่ใช้กำแพงจริงหรือสิ่งกีดขวางขนาดใหญ่และทุบรถของคุณ

03:01.200 --> 03:02.710
นั่นจะทำให้คุณเสียเงินเป็นจำนวนมาก

03:02.850 --> 03:12.690
ความคิดที่ฉลาดกว่านั้นคือการลงโทษรถของคุณไม่ใช่เมื่อมันชนกำแพงหรือสิ่งกีดขวาง แต่เมื่อมันลงสู่พื้นทราย

03:12.810 --> 03:14.220
มันเหมือนกับว่าคุณมีทุ่งนา

03:14.220 --> 03:19.680
ฟิลด์นี้มีถนนบางสายที่รถต้องพักและถนนจะถูกคั่นด้วยทราย

03:19.860 --> 03:31.630
และทุกครั้งที่รถเข้าสู่จุดศูนย์กลางมันก็เหมือนกับว่ากำลังไปสู่สิ่งกีดขวางเพราะเมื่อรถเข้าไปในทรายมันจะชะลอตัวลงและเราจะทำให้แน่ใจว่ารถถูกลงโทษจะถูกลงโทษ

03:31.860 --> 03:35.200
และนั่นคือจุดสำคัญอย่างหนึ่งของปัญญาประดิษฐ์

03:35.220 --> 03:40.210
คำที่ไม่ดีเกิดขึ้นเมื่อใดก็ตามที่รถเข้าสู่ความรู้สึกและชะลอตัวลง

03:40.230 --> 03:40.770
เอาล่ะ

03:40.770 --> 03:45.160
และที่นี่ฉันแนะนำข้อความสุดท้ายและนั่นคือเหตุผล

03:45.300 --> 03:50.650
ซึ่งเป็นพิกัดของจุดสุดท้ายในหน่วยความจำเมื่อเราวาดกลิ่นบนแผนที่

03:50.760 --> 03:51.110
เอาล่ะ

03:51.120 --> 04:03.920
จากนั้นเราได้ปัญญาประดิษฐ์ที่เราเรียกว่าสมองและมันมีเครือข่ายประสาทของเราและเราจะเรียกมันว่าสมองเพราะนี่คือสมองของรถยนต์

04:04.350 --> 04:04.730
เอาล่ะ

04:04.770 --> 04:10.200
ดังนั้นในบรรทัดของรหัสนี้คุณสามารถเห็นฉันกำลังสร้างวัตถุที่ครูในชั้น

04:10.230 --> 04:17.000
ฉันจะเตือนคุณว่าคลาสและวัตถุเป็นเพียงวัตถุของ Brenna ที่ลดทอนความเป็นมนุษย์ในชั้นเรียนและ 5: 3 และ

04:17.010 --> 04:19.660
0 9 เป็นอินพุตของคลาส

04:19.680 --> 04:31.710
นั่นง่ายมากที่ห้าสอดคล้องกับรัฐที่ถูกเข้ารหัสเวกเตอร์ห้ามิติเราจะเห็นสิ่งที่พวกเขากำลังอธิบายสิ่งที่เกิดขึ้นในสภาพแวดล้อมบนแผนที่ได้อย่างสมบูรณ์แบบ

04:31.830 --> 04:44.190
จากนั้นสามคือจำนวนของการกระทำที่จะมีสามการกระทำที่เป็นไปได้ไปทางซ้ายตรงหรือไปทางขวาและ 0

04:44.190 --> 04:44.190
9 เป็นพารามิเตอร์อีกครั้งในอัลกอริทึมการเรียนรู้แบบออกเสียง

04:44.220 --> 04:46.900
เอาล่ะเรามีการกระทำผ่านการหมุน

04:46.980 --> 04:50.910
การกระทำต่อการหมุนคือเวกเตอร์ของสามองค์ประกอบ

04:50.910 --> 04:53.290
020 และลบ 20

04:53.300 --> 05:01.820
และเราต้องทำสิ่งนี้เพราะการกระทำถูกเข้ารหัสด้วยตัวเลขสามตัวคือ 0 1 และ 2

05:01.820 --> 05:04.700
และที่สอดคล้องกับดัชนีของเวกเตอร์การหมุนสองการกระทำนี้

05:04.710 --> 05:11.160
ตัวอย่างเช่นหากการกระทำที่เลือกในเวลา t เป็นศูนย์

05:11.270 --> 05:18.990
ศูนย์จะสอดคล้องกับดัชนีของการกระทำนี้เวกเตอร์การหมุนสองตัวและค่าของดัชนี 0 เป็นศูนย์

05:19.150 --> 05:24.490
ดังนั้นเราจะตรงไปถ้าการกระทำที่เลือกคือ 1

05:24.770 --> 05:32.810
หนึ่งอันนั้นตรงกับดัชนีของการกระทำนี้เวกเตอร์สองตัวเพิ่มเติมและค่าของเวกเตอร์นี้ที่มีอันถัดไปคือ 20

05:32.810 --> 05:38.580
ดังนั้น 20 สอดคล้องกับการหมุน

05:39.260 --> 05:46.500
20 องศาและนั่นหมายความว่ารหัสจะไปทางขวา 20 องศาจากนั้นหากการกระทำที่เลือกนั้นสอดคล้องกับดัชนีของการกระทำนี้กับเวกเตอร์การหมุน

05:46.700 --> 05:52.570
แล้วรหัสจะหมุนเป็นลบ 20 องศาแล้วหมุนไปทางซ้าย

05:52.580 --> 06:00.200
เอาล่ะเราแนะนำ Voivode ที่ยังเหลืออยู่เพราะในแต่ละด่านจะได้คำสุดท้าย

06:00.200 --> 06:04.970
ดังนั้นโปรดจำไว้ว่าถ้าการ์ดไม่เข้ากับความรู้สึกบางอย่างแล้วรางวัลจะเป็นบวก

06:05.180 --> 06:15.270
และถ้ารหัสไปสู่ความรู้สึกที่ดีมันจะได้รับรางวัลที่ไม่ดีและทุกครั้งที่ตัวแปรนี้จะมีรางวัลนี้ที่ได้รับ H20

06:15.500 --> 06:20.760
จากนั้นเราก็เริ่มต้นคะแนนซึ่งเป็นเวกเตอร์ที่จะมีรางวัล

06:20.780 --> 06:22.780
ไม่ใช่ทั้งหมดของพวกเขา แต่เป็นรางวัล

06:22.800 --> 06:29.440
บนหน้าต่างบานเลื่อนเพื่อให้คุณรู้ว่าเราสามารถสร้างเส้นโค้งของค่าเฉลี่ยของการหมอบให้รางวัลด้วยความเคารพต่อเวลา

06:29.450 --> 06:34.520
เอาล่ะในส่วนรหัสนี้เราเริ่มต้นแผนที่เพื่อให้เราเริ่ม

06:34.520 --> 06:36.170
ตัวอย่างเช่นตัวแปรดังกล่าว

06:36.170 --> 06:37.220
นั่นเป็นสิ่งสำคัญ

06:37.220 --> 06:45.880
ตัวแปรที่สองจะเป็นอาร์เรย์ที่เซลล์จะเป็นพิกเซลของแผนที่และในแต่ละเซลล์เราจะมี 1

06:45.980 --> 06:52.120
หากมีความรู้สึกเป็นศูนย์ถ้าไม่มีจุดเริ่มต้นเราจะไม่วาดอะไรเลย

06:52.160 --> 06:57.840
ดังนั้นจะไม่มีความรู้สึกเลยและเซลล์ทั้งหมดของอาร์เรย์กลางจะมีค่าเป็นศูนย์

06:57.860 --> 07:10.290
จะมีศูนย์ทุกที่และทันทีที่เราวาดความรู้สึกบางส่วนในขณะที่เซลล์ที่เราวาดความรู้สึกจะได้รับหนึ่งและเราเริ่มต้นการแข่งขันกับศูนย์ทั้งหมดที่นี่ส่งเท่ากับและศูนย์

07:10.370 --> 07:13.510
จากนั้นเรามีสิ่งสำคัญนี้ซึ่งเป็นเป้าหมาย

07:13.520 --> 07:17.630
ดังนั้นเป้าหมายคือจุดในแผนที่ซึ่งจะฝึกให้รถไปถึง

07:17.630 --> 07:19.850
มันก็เหมือนปลายทาง

07:19.850 --> 07:21.460
ดังนั้นเป้าหมายนี้จะเป็นอย่างไร

07:21.560 --> 07:28.480
นี่จะเป็นมุมบนซ้ายของแผนที่กับรถไฟทั้งหมดเพื่อไปที่มุมซ้ายบนของแผนที่

07:28.550 --> 07:36.590
จากนั้นเมื่อมันมาถึงมุมบนซ้ายของแผนที่จากนั้นเราก็จะไปที่มุมล่างขวาของแผนที่เพื่อให้เราสามารถจินตนาการถึงสถานการณ์ต่อไปนี้

07:36.590 --> 07:44.320
มุมซ้ายบนของแผนที่คือสนามบินของเมืองและมุมล่างขวาของแผนที่คือตัวเมืองของเมือง

07:44.570 --> 07:50.180
และเราจะฝึกแท็กซี่หรือ Uber เพื่อเดินทางไปกลับระหว่างสนามบินและตัวเมือง

07:50.210 --> 07:55.610
และแน่นอนว่าเราจะทำให้รถแท็กซี่คันนี้ยากขึ้นโดยการวาดถนนที่ยากขึ้นเรื่อย

07:55.700 --> 08:02.760
ๆ และเพิ่มอุปสรรคบนถนนมากขึ้นเพื่อดูว่ารถแท็กซี่ยังสามารถเดินทางจากสนามบินไปยังตัวเมืองได้หรือไม่

08:02.990 --> 08:04.170
ดังนั้นนี่จะเป็นเรื่องสนุก

08:04.190 --> 08:12.640
นั่นคือสาเหตุที่ฉันตั้งค่าพิกัดของเป้าหมายแรกนั่นคือสนามบินซึ่งอยู่ที่มุมบนซ้ายของหน้าจอ

08:12.830 --> 08:22.090
แผนที่จะเป็นสี่เหลี่ยมจัตุรัสแบบนี้และพิกัดของจุดกำเนิดที่เป็นพิกัด 00 อยู่ตรงนี้

08:22.340 --> 08:25.250
แล้วระยะที่ใหญ่กว่าคือระยะนี่ตรงนี้

08:25.310 --> 08:32.640
ดังนั้นพิกัด 20 และ Najah ลบ 20 จึงจะอยู่ตรงนี้ที่มุมซ้ายบนของแผนที่

08:32.790 --> 08:35.650
ทำไมฉันถึงเลือก 20 และไม่เป็นศูนย์

08:35.850 --> 08:40.300
นั่นเป็นเพราะเราต้องการฝึกรถไม่ให้พุ่งเข้ากำแพง

08:40.320 --> 08:48.120
คุณรู้ว่าเราต้องการที่จะฝึกฝนเข้าไปในกำแพงเช่นกันดังนั้นมันจึงไม่ใช่ศูนย์เพราะเราไม่ต้องการให้รถสัมผัสกับที่ที่เราต้องการสัมผัส

08:48.180 --> 08:58.200
ดังนั้นเราต้องใส่มันตรงนี้แล้วฉันแค่แนะนำตัวแปรระยะทางสุดท้ายซึ่งเพิ่งให้ระยะทางปัจจุบันจากรถไปยังถนนและฉันเริ่มต้นเป็นศูนย์

08:59.020 --> 08:59.470
เอาล่ะ

08:59.480 --> 09:02.220
และตอนนี้ถึงเวลาที่จะทำให้รถและเกม

09:02.370 --> 09:06.650
ดังนั้นเราจะสร้างสองคลาสหนึ่งคลาสสำหรับรถยนต์และหนึ่งคลาสสำหรับเกม

09:06.850 --> 09:10.850
และในชั้นเรียนเหล่านี้จะทำให้การเชื่อมต่อกับ AI ของเราแล้ว

09:11.170 --> 09:13.170
ดังนั้นเราจะทำใน Statoil ครั้งต่อไป

09:13.180 --> 09:15.000
และจนกว่าจะสนุกกับฉัน