WEBVTT

00:00.420 --> 00:04.730
สวัสดีและยินดีต้อนรับสู่ขั้นตอนสุดท้ายของส่วนนี้สิ่งปลูกสร้าง

00:04.860 --> 00:10.500
ทีนี้สิ่งเดียวที่เราต้องทำก็คือทำฟังก์ชั่นฟอร์ดที่จะถ่ายทอดสัญญาณตั้งแต่เริ่มต้นเมื่อสมองได้รับภาพมาถึงจุดสิ้นสุดมากที่สุดเมื่อฉันวางการกระทำ

00:10.500 --> 00:16.650
ฟังก์ชั่นทั้งหมดและนั่นจะเป็นขั้นตอนสุดท้ายของเราก่อนที่เราจะเข้าร่วมการฝึกอบรม AI

00:16.650 --> 00:26.710
ของเราด้วย kulang เชิงลึก

00:26.890 --> 00:28.080
ลองทำสิ่งนี้กัน

00:28.080 --> 00:34.470
เราจะใช้การเรียกใช้ฟังก์ชันซึ่งจริง ๆ แล้วคล้ายกับฟังก์ชัน init

00:34.470 --> 00:38.760
ที่เป็นฟังก์ชันที่มีอยู่ แต่คราวนี้เราใช้เพื่อเรียกใช้ฟังก์ชันอื่น

00:38.790 --> 00:45.490
สิ่งที่เราทำก่อนหน้านี้เพราะคุณรู้ว่าเราจะใช้ฟังก์ชันการส่งต่อจากสมองและการทำงานของพอร์ตจากร่างกาย

00:45.630 --> 00:50.270
ตอนนี้เรากำลังใช้ฟังก์ชั่นนี้เพื่อเรียกฟังก์ชั่นเหล่านี้

00:50.550 --> 00:53.160
ดังนั้นการโทรจะใช้สองข้อโต้แย้ง

00:53.160 --> 00:54.330
คนแรกคือตัวเอง

00:54.330 --> 01:00.220
แน่นอนว่าวัตถุและอาร์กิวเมนต์ที่สองซึ่งเป็นไปตามที่คุณจะเป็นอย่างไร

01:00.360 --> 01:02.910
ทีนี้เรากำลังทำการขยายพันธุ์ทั้งหมดในครั้งนี้

01:02.910 --> 01:10.860
ดังนั้นสิ่งที่เราต้องการนำเข้าเป็นของหลักสูตรภาพอินพุตเพราะแน่นอนว่าเป็นจุดเริ่มต้นเมื่อ AI กำลังเล่นเกม

01:10.860 --> 01:17.180
เป็นภาพแรกที่แสดงภาพของเกมจากนั้นแพร่กระจายสัญญาณในสมองและเล่นแอ็คชั่น

01:17.190 --> 01:20.130
ดังนั้นอาร์กิวเมนต์ที่สองจะเป็นอินพุต

01:20.610 --> 01:24.740
และตอนนี้เราก็พร้อมที่จะทำการเผยแผ่ทั้งหมดนี้แล้ว

01:24.810 --> 01:26.220
ลองทำอีกครั้ง

01:26.220 --> 01:31.900
ดังนั้นขั้นตอนแรกที่เป็นขั้นตอนแรกคือการรับภาพอินพุตจากเกม

01:32.190 --> 01:42.840
และเนื่องจากภาพเหล่านี้กำลังเข้าสู่เครือข่ายประสาทคุณสามารถจินตนาการได้ว่าเราต้องจัดรูปแบบพวกเขาในโครงสร้างพิเศษและโครงสร้างแน่นอนว่าเป็นโครงสร้างไฟฉาย

01:42.840 --> 01:58.260
ดังนั้นสิ่งแรกที่จะเกิดขึ้นคือเราจะแปลงภาพเหล่านี้เป็นอาร์เรย์กรรมการแล้วเราจะแปลงให้เป็นเทนเซอร์คบเพลิงและในที่สุดเราจะใส่คบไฟเทนเซอร์เข้าไปในตัวแปรคบเพลิงซึ่งจะมีทั้งเทนเซอร์และการไล่ระดับสี

01:58.350 --> 02:04.460
นั่นคือสำหรับกราฟแบบไดนามิกของเราในการคำนวณอย่างมีประสิทธิภาพมากการไล่สีที่เร็วขึ้นในภายหลัง Kattie ที่ยอดเยี่ยมในแง่

02:04.620 --> 02:06.200
นั่นคือขั้นตอนแรกของเรา

02:06.270 --> 02:16.320
จากนั้นเมื่อเราได้รูปแบบที่ถูกต้องของภาพของเราดีพวกเขาจะสามารถเข้าสู่เครือข่ายประสาทและนั่นคือที่ที่เราจะทำการถ่ายทอดสัญญาณทั้งหมด

02:16.380 --> 02:20.340
งั้นลองทำสิ่งนี้ก่อนเพื่อแปลงภาพให้อยู่ในรูปแบบที่ถูกต้อง

02:20.430 --> 02:23.050
ดังนั้นรูปภาพของเราจึงมีให้สำหรับอินพุต

02:23.220 --> 02:26.780
ตอนนี้เรากำลังจะสร้างตัวแปรใหม่ที่ฉันกำลังเรียกอินพุต

02:26.820 --> 02:30.470
นั่นคืออินพุตที่แท้จริงของโครงข่ายประสาทเทียมและอินพุตนี้

02:30.510 --> 02:31.760
มันจะอยู่ที่ไหน

02:31.920 --> 02:34.490
ก่อนอื่นเราต้องรับอินพุตของเรา

02:34.530 --> 02:36.650
นั่นคือภาพต้นฉบับของเรา

02:36.870 --> 02:42.190
จากนั้นเราก็บอกว่าเราต้องการแปลงภาพเหล่านี้เป็นอาร์เรย์ของ Nampa

02:42.330 --> 02:49.260
ดังนั้นในการทำเช่นนี้เราสามารถทำได้โดยไม่ต้องใช้ใครมีทางลัดแล้วอาร์เรย์ฟังก์ชั่น

02:49.500 --> 02:52.850
ดังนั้นเราใส่ในวงเล็บของอาร์เรย์ฟังก์ชัน

02:52.890 --> 02:53.340
เราจะไปที่นั่น.

02:53.340 --> 02:55.940
ตอนนี้มันถูกแปลงเป็นบางสิ่งและโดยอาร์เรย์

02:56.190 --> 03:04.230
แต่เนื่องจากเซลล์ของอาร์เรย์ numpad จะมีพิกเซลจึงปลอดภัยกว่าที่จะระบุประเภทลอย

03:04.310 --> 03:11.040
มันจะดีกว่าเพื่อให้แน่ใจว่าเรามีทุ่นบางส่วนในขณะนี้เพื่อให้แน่ใจว่าเราสามารถใช้ทุ่นนั้นได้

03:11.090 --> 03:12.690
เสียใจที่ได้ยิน.

03:12.720 --> 03:15.390
เอาล่ะตอนนี้เรายังมีกรรมการอยู่

03:15.540 --> 03:17.330
แต่ด้วยแท็บเล็ต

03:17.720 --> 03:24.150
เอาล่ะและนั่นก็เป็นอีกเหตุผลหนึ่งที่เทนเซอร์เป็นโดยนิยามอาร์เรย์ของประเภทเดียว

03:24.270 --> 03:28.060
เราจึงเลือกประเภทเดี่ยวเป็นทุ่นลอย

03:28.060 --> 03:28.350
เอาล่ะ

03:28.350 --> 03:37.990
ตอนนี้เรามีการเพิ่มที่ไม่ใช่ชีวภาพของเราขั้นตอนต่อไปคือการแปลงให้เป็นเซ็นเซอร์เต่าและการทำเช่นนี้เราสามารถใช้ตัวอย่างไฟฉาย

03:38.070 --> 03:45.380
และจากฟังก์ชั่นที่ไม่ใช่นักบินซึ่งจะแปลงให้เป็นเซ็นเซอร์คบเพลิง

03:45.420 --> 03:46.200
เราจะไปที่นั่น.

03:46.210 --> 03:53.230
และตอนนี้ขั้นตอนสุดท้ายคือการวางเซ็นเซอร์ไฟฉายเหล่านี้เป็นตัวแปรไฟฉายที่มีทั้งเทนเซอร์และข้อตกลง

03:53.400 --> 04:05.530
และคุณรู้วิธีที่จะทำมันแน่นอนว่าเรารับคลาสตัวแปรของเราเพราะทุกสิ่งที่อยู่ภายในตัวแปรนี้คืออินพุตของคลาสตัวแปร

04:05.760 --> 04:15.890
แต่ฉันต้องการแสดงให้คุณเห็นด้วยวิธีนี้เพราะคุณรู้ว่าเราเริ่มต้นด้วยภาพอินพุตของเราจากนั้นเราแปลงมันเป็นอาร์เรย์ที่มีหมายเลขแล้วเป็นคบเพลิงเทนเซอร์แล้วก็พรุ่งนี้

04:16.170 --> 04:17.220
และตอนนี้เราก็ทำได้ดี

04:17.220 --> 04:25.770
พวกเขาได้รับอนุญาตให้เข้าสู่เครือข่ายประสาทที่เป็นที่แรกที่ดวงตาของดวงตาและจากนั้นชั้นที่เชื่อมต่ออย่างเต็มที่เพื่อนำไปสู่การทำนาย

04:26.220 --> 04:30.340
ดังนั้นการพูดจากดวงตาของตานั่นคือสิ่งที่เรากำลังจะทำตอนนี้

04:30.480 --> 04:38.720
เรากำลังจะเผยแพร่ภาพที่ได้รับอนุญาตเหล่านี้ตอนนี้เข้าไปในดวงตาของดวงตาที่ผ่านชั้นสาม convolutional

04:38.850 --> 04:41.620
และเมื่อต้องการทำสิ่งนี้คุณจะเห็นได้ว่ามันง่ายแค่ไหน

04:41.640 --> 04:46.290
นั่นเป็นเพราะเรามีสมองอยู่แล้วในร่างกายของเราจากฟังก์ชั่นเริ่มต้น

04:46.320 --> 04:59.830
เราเพียงแค่ต้องใช้สมองของตัวเองว่าสมองและนำสมองนี้ไปใช้กับภาพอินพุตและที่จะแพร่กระจายสิ่งต่าง ๆ ไปยังฟังก์ชั่นอาหารที่นี่จากสมอง

05:00.430 --> 05:19.030
นั่นจะแพร่กระจายสัญญาณภายในสมองและเนื่องจากหน้าที่การทำงานของสมองส่งคืนสัญญาณเอาต์พุตที่เซลล์ประสาทของชั้นสัญญาณออกที่มีค่า Q ดีตัวนี้สมองที่ป้อนที่นี่จะส่งคืนสัญญาณเอาต์พุตนี้ดังนั้นเราจะใส่

05:19.090 --> 05:26.690
ที่นี่ไม่ว่ามันจะกลายเป็นตัวแปรและเราจะเรียกมันว่าอย่างง่ายมากเลยว่าเอาท์พุทนี้คือสัญญาณเอาท์พุทของสมอง

05:26.930 --> 05:37.990
และตอนนี้เรามีสัญญาณเอาท์พุทของสมองทีนี้เราต้องส่งสัญญาณนี้ไปยังร่างกายและเพื่อทำสิ่งนี้เราจะใช้ฟังก์ชันส่งต่อที่สองจากร่างกายและเพื่อทำสิ่งนี้

05:38.030 --> 05:50.600
เราเพียงแค่ต้องใช้ร่างกายของเราและนำไปใช้กับการส่งออกเพราะฟังก์ชั่นฟอร์ดของร่างกายใช้เป็นสัญญาณอินพุตของสมอง

05:50.660 --> 05:55.880
นั่นคือสิ่งที่เอาท์พุทอยู่ในขณะนี้และส่งกลับการกระทำ

05:56.000 --> 05:58.080
และเนื่องจากมันส่งกลับการกระทำ

05:58.380 --> 06:03.530
ที่นี่เราจะเพิ่มการกระทำเพื่อทำให้ตัวเองออกมาอย่างมาก

06:03.920 --> 06:19.830
เอาล่ะตอนนี้คุณสามารถเห็นได้ว่าเพียงแค่เราแพร่กระจายสัญญาณภายในสมองและจากสมองไปสู่สิ่งแรกโดยใช้ฟังก์ชั่นฟอร์มจากสมองซึ่งนำเราและใส่ภาพอินพุต รักษาค่าคีย์

06:20.240 --> 06:26.900
จากนั้นเราแพร่กระจายสัญญาณเอาท์พุตนี้ไปยังร่างกายโดยที่ฟังก์ชันไปข้างหน้าของร่างกายของเราเพื่อรับการกระทำที่จะเล่น

06:26.900 --> 06:34.510
และตอนนี้สิ่งเดียวที่เหลืออยู่ที่เราต้องทำและนั่นคือรหัสสุดท้ายของส่วนนี้ที่สร้าง

06:34.760 --> 06:39.370
เราต้องกลับมาดำเนินการเพื่อเล่นและนั่นคือการกระทำ

06:39.530 --> 06:53.840
อย่างไรก็ตามในตอนนี้การกระทำจำเป็นต้องจัดรูปแบบและเราจำเป็นต้องแปลงกลับเป็นสิ่งที่ถูกต้องและเพื่อทำสิ่งนี้เราจะนำโครงสร้างข้อมูลของการกระทำเหล่านี้แล้วเพิ่มฟังก์ชัน non-pilot

06:53.840 --> 06:56.780
ตอนนี้เรามีการกระทำที่เราเปิดในรูปแบบที่ถูกต้อง

06:56.780 --> 06:58.040
ขอแสดงความยินดีด้วย

06:58.040 --> 07:00.660
ตอนนี้เราทำกับส่วนแรก 1 แล้ว

07:00.770 --> 07:03.410
เราสร้าง AI ในสามขั้นตอน

07:03.410 --> 07:06.860
ครั้งแรกที่เราสร้างสมองที่สองเราสร้างร่างกาย

07:06.860 --> 07:15.130
และสามเราประกอบสมองในร่างกายและเราแพร่กระจายสัญญาณทั้งหมดจากดวงตาจนถึงขณะที่เราเล่นการกระทำ

07:15.560 --> 07:17.100
นั่นเป็นขั้นตอนแรกที่ทำ

07:17.120 --> 07:22.200
นั่นเป็นขั้นตอนใหญ่ แต่ตอนนี้คุณเข้าใจแล้วว่าเราสร้าง AI AI แต่มันก็ยังโง่อยู่

07:22.220 --> 07:24.110
เราต้องฝึกให้ฉลาด

07:24.170 --> 07:34.690
ดังนั้นเราต้องฝึกให้ทำในสิ่งที่เราต้องการทำและเพื่อทำสิ่งนี้เราจะใช้คำว่าต้องทำสิ่งที่คุณรู้เพราะการเรียนรู้จากโลกโดยการเสริมกำลังเมื่อได้รับรางวัลที่ดี

07:34.760 --> 07:41.670
และโดยการถูกลงโทษหรืออ่อนแอเมื่อได้คำที่ไม่ดีซึ่งเป็นที่ที่การเรียนรู้คิวจะเข้ามาเล่น

07:41.690 --> 07:47.510
และนั่นคือสิ่งที่เราจะทำในส่วนนี้เพื่อฝึกสายตาด้วยการเรียนรู้ Q ที่ซับซ้อน

07:47.510 --> 07:50.270
ฉันแทบรอไม่ไหวที่จะเริ่มและจนกว่าจะถึงตอนนั้น