WEBVTT

00:00.390 --> 00:05.320
สวัสดีและยินดีที่จะเป็นส่วนหนึ่งในการฝึกอบรมตาด้วย kuning convolutional ลึก

00:05.490 --> 00:06.240
ถูกตัอง.

00:06.240 --> 00:12.830
ตอนนี้เราได้สร้าง AI AI ด้วยสถาปัตยกรรมของโครงข่ายประสาทเทียมร่างกายในแบบที่เล่นและทุกอย่าง

00:12.840 --> 00:17.040
ถึงเวลาที่จะฝึกพูดว่าฉันกับ Cuellar convolutional

00:17.220 --> 00:21.100
ดังนั้นตั้งแต่นี้ไปเราจะทำให้คุณรู้จักเล่นใหม่

00:21.210 --> 00:23.770
การทำงานกับค่าที่ใช้กับคำ

00:24.000 --> 00:27.820
และยังมีโบนัสที่จะปรับปรุงให้ดีขึ้นอีกมาก

00:27.840 --> 00:46.860
กระบวนการฝึกอบรมและที่เรียกว่าการมีสิทธิ์ติดตามการมีสิทธิ์ติดตามเป็นเทคนิคที่มีประสิทธิภาพซึ่งประกอบด้วยการสะสมคำในหลายขั้นตอนและค่าคิวบ์จะได้เรียนรู้เกี่ยวกับการสะสมของคำนี้เมื่อเทียบกับก่อนที่ค่าคิวบ์ได้เรียนรู้หลังจากการเปลี่ยนแปลงแต่ละ

00:46.860 --> 00:54.480
ดังนั้นหลังจากที่ได้รับแต่ละคำในครั้งนี้เราจะได้เรียนรู้คุณค่าหลังจากได้รับรางวัลมากมายแทนที่จะเป็นเพียงหนึ่งคำ

00:54.660 --> 01:00.530
ดังนั้นแทนที่จะมีการเปลี่ยนแปลงครั้งเดียวหลังจากที่อื่นและคุณรู้ว่าการปรับปรุงค่า Q ในแต่ละครั้ง

01:00.660 --> 01:07.620
ค่า q นั้นจะได้รับการอัพเดททุกขั้นตอนเพราะคุณสมบัติการติดตามอนุมูลและขั้นตอนการมีสิทธิ์ติดตามและสิ้นสุดคือตัวเลขนี้หลังจากนั้นค่า

01:07.710 --> 01:13.820
q จะได้รับการปรับปรุงและในรูปแบบของเรา

01:13.820 --> 01:15.600
ที่นี่เราจะมีสายใด ๆ แล้ว

01:15.630 --> 01:21.570
นั่นหมายความว่าจะเป็น 10 ขั้นตอนในการติดตามคุณสมบัติดังนั้นเราจะอัปเดตและเรียนรู้ค่า q ทุก ๆ 10

01:21.840 --> 01:22.880
ขั้นตอน

01:22.890 --> 01:26.820
หลังจากรวบรวมคำศัพท์ใน 10 ขั้นตอนเหล่านี้แล้วนั่นคือโบนัส

01:26.820 --> 01:33.180
นั่นจะทำให้แบบจำลองของเรามีประสิทธิภาพยิ่งขึ้นและคุณจะเห็นว่าในท้ายที่สุดเราจะได้ผลลัพธ์ที่ยอดเยี่ยม

01:33.180 --> 01:36.020
ฉันประหลาดใจจริงๆเมื่อฉันเห็นผลลัพธ์สุดท้าย

01:36.030 --> 01:40.430
ฉันเคยทำงานกับเมิร์ลซึ่งใช้เวลาในการดำเนินการมาก

01:40.430 --> 01:46.640
คุณรู้ว่า AI ใช้เวลาในการฝึกอบรมมาก แต่คุณจะเห็นว่าด้วยสิ่งนี้บวกกับเครือข่ายประสาทที่เราทำ

01:46.860 --> 01:49.390
นั่นคือสมองของเราและร่างกายของเราที่นี่พร้อมสิ่งของ

01:49.390 --> 01:56.600
ต่อไปเราจะได้ม็อบที่ทรงพลังและ AI ที่ทรงพลังมากเพราะคุณจะเห็นว่ามันจะรักษาคำโกหก

01:56.610 --> 01:59.090
คุณเข้าใจไหมว่าฉันกำลังพูดถึงเรื่องอะไร

01:59.370 --> 02:06.740
ดังที่คุณเห็นในส่วนที่ 2 นี้เราเริ่มต้นจากการรับสภาพแวดล้อม Dume และเตรียมรหัสสำหรับคุณ

02:06.780 --> 02:12.790
เราแค่ใช้ไฟล์ภายนอกประมวลผลภาพล่วงหน้าจากโฟลเดอร์สารบบ

02:12.930 --> 02:19.520
ดังนั้นโดยพื้นฐานแล้วคำสั่งนั้นค่อนข้างที่จะนำเอาบรรทัดของโค้ดนี้ไปใช้ไม่ได้

02:19.590 --> 02:24.450
0 0 คือชื่อของสภาพแวดล้อมของเกมที่เรากำลังเล่น

02:24.450 --> 02:31.970
ดังนั้นก่อนอื่นเรานำเข้าสภาพแวดล้อมด้วยอัญมณีที่ทำนั่นคือสิ่งที่คุณสามารถหาได้ในหน้าเปิดและแบบฝึกหัด

02:32.190 --> 02:40.230
แต่จากนั้นเราใช้คลาสภาพ preprocess นี้ซึ่งเป็นคลาสจาก Image

02:40.290 --> 02:45.870
pre-processing เพื่อประมวลผลรูปภาพที่จะเข้ามาในอันใหม่ที่ทำงานได้และเราประมวลผลล่วงหน้าพวกมันเพื่อให้พวกเขามีรูปแบบสี่เหลี่ยมจตุรัสที่มีการปกครอง 80

02:45.870 --> 02:54.060
80 จำได้ว่าเป็นเพราะในใหม่ของเราที่ทำงานได้ดีเรากำหนดภาพอินพุตของเราที่จะมีเครื่องมือเวลาหนึ่งโดย 80 โดย

02:54.360 --> 02:58.530
80

02:58.560 --> 03:03.490
โปรดจำไว้ว่าช่องหนึ่งคือจำนวนช่องสัญญาณและช่องทางหนึ่งหมายความว่าเรากำลังทำงานกับภาพขาวดำ

03:03.660 --> 03:06.350
นั่นคือตึกระฟ้าที่นี่

03:06.900 --> 03:14.070
และ 80 โดย 80 หมายความว่าการครอบงำของภาพอินพุตของเราจะเป็น

03:14.070 --> 03:20.190
80 คูณ 80 และนั่นคือสิ่งที่เราตั้งไว้ในโครงข่ายประสาทเทียม แต่แน่นอนแล้วเราต้องระบุสิ่งนี้เมื่อใส่ภาพ

03:20.190 --> 03:23.150
คลาสภาพ

03:23.670 --> 03:34.920
และหลังจากที่เรานำเข้าสภาพแวดล้อมด้วยรูปแบบที่ถูกต้องของภาพอินพุตในขณะที่เรานำเข้าเกมทั้งหมดด้วยวิดีโอที่มีรหัสของบรรทัดนี้และจำสิ่งที่ยอดเยี่ยมเกี่ยวกับเรื่องนี้คือในที่สุดเราจะเห็นวิดีโอกำลังเล่น ดังนั้นเราจะเห็นว่ามันจะฆ่าสัตว์ประหลาดพยายามเข้าถึงสิ่งที่ดีที่สุดได้อย่างไรและทุกสิ่งจะน่าตื่นเต้นสุด

03:34.920 --> 03:43.410
ๆ

03:43.440 --> 03:48.170
และจำไว้ว่าวิดีโอเหล่านี้จะเข้าสู่โฟลเดอร์วิดีโอเหล่านี้

03:48.630 --> 03:49.100
เอาล่ะ

03:49.230 --> 03:54.990
และบรรทัดสุดท้ายที่นี่ แต่ฉันต้องการแสดงให้คุณเพราะนั่นเป็นสิ่งสำคัญที่ตอนนี้เกี่ยวข้องกับ AI AI

03:55.200 --> 03:56.710
ที่เรากำลังสร้าง

03:56.910 --> 04:02.680
โปรดจำไว้ว่าเครือข่ายประสาทของเราทำหน้าที่เหมือนการป้อนหมายเลข

04:02.880 --> 04:07.950
นั่นเป็นเพราะคุณรู้ว่าเราต้องการสร้าง AI AI ที่เราสามารถทดสอบได้ง่ายในสภาพแวดล้อมที่หลากหลายและสภาพแวดล้อม Dume หลาย

04:07.950 --> 04:09.660
ๆ

04:09.660 --> 04:19.070
และเนื่องจากสภาพแวดล้อมที่แตกต่างกันมีจำนวนของการกระทำที่แตกต่างกันเราได้ระบุตัวแปรการกระทำจำนวนนี้เป็นอินพุตของสมองซีเอ็นเอ็น

04:19.380 --> 04:29.340
และตอนนี้สิ่งที่เรากำลังจะทำคือรับค่าตัวแปรแอ็คชั่นจำนวนนี้โดยใช้สภาพแวดล้อม Dumah ที่เราสำคัญและสร้างไว้ในตัวแปรนี้

04:29.340 --> 04:34.860
และต่อมาจำนวนนี้จริง ๆ แล้วดีมากที่เรากำลังจะสร้างจะเป็นอินพุตของสมอง

04:34.890 --> 04:36.000
ลองทำสิ่งนี้กัน

04:36.000 --> 04:42.690
ฉันขอแนะนำการกระทำตัวเลขการกระทำของจำนวนจริงในขณะนี้เท่ากับ

04:42.720 --> 04:47.870
ตอนนี้เรากำลังจะใช้สภาพแวดล้อมการลงโทษซึ่งเป็นตัวแปรที่เราสร้างขึ้น

04:48.150 --> 04:49.330
ดังนั้นฉันทำ

04:49.500 --> 04:57.200
จากนั้นเราเพิ่มที่นี่และจากนั้นที่นี่เราไปเราใช้พื้นที่การดำเนินการที่นี่เป็นครั้งแรกที่ชุดของการกระทำของคุณ

04:57.230 --> 05:01.960
ฉันขอแนะนำให้คุณดูการเปิดตัวของ Horrible เพื่อดูว่ามันทำงานอย่างไร

05:02.010 --> 05:05.530
คุณรู้ที่จะเข้าใจวิธีการเปิดสภาพแวดล้อมในโรงยิมทำงาน

05:05.670 --> 05:07.940
แต่โดยทั่วไปนี่คือชุดของการกระทำ

05:08.040 --> 05:15.770
และจากชุดของการกระทำนี้เราสามารถเข้าถึงจำนวนการกระทำในสภาพแวดล้อมและทำข้อมูลนี้ที่นี่แล้ว

05:16.080 --> 05:26.550
และนั่นคือจำนวนของการกระทำดังนั้นการลงโทษและพื้นที่การกระทำนั้นจะส่งคืน 7 6:48 เนื่องจากมีเจ็ดการกระทำ

05:26.760 --> 05:33.400
ฉันรู้ว่าเราสามารถเห็นการกระทำหกอย่างในสองสภาพแวดล้อมในหน้าเริ่มต้น แต่ฉันคิดว่าเราสามารถทำงาน

05:33.490 --> 05:39.000
และเพื่อให้คุณรู้ว่าเราสามารถก้าวไปข้างหน้าไปทางซ้ายย้ายไปทางขวาเลี้ยวซ้ายเลี้ยวขวาและยิง

05:39.000 --> 05:47.010
และนอกจากนี้เราสามารถเรียกใช้งานที่ทำให้การกระทำเจ็ดอย่างถูกต้องและนั่นคือการเริ่มทำสภาพแวดล้อมที่เราต้องทำในสภาพแวดล้อมของเรา

05:47.040 --> 05:52.640
เรามีการกระทำหลายอย่างดังนั้นเราจึงมีทุกอย่างที่เราต้องการสำหรับสมองของเรา

05:52.800 --> 05:58.320
จากนั้นเราจะสร้างวัตถุหรือวัตถุสมองซึ่งเราจะเรียกอักษรตัวน้อยของ CNN

05:58.500 --> 06:04.500
และเนื่องจากฟังก์ชั่นใด

06:04.900 --> 06:11.690
ๆ ใช้การกระทำเป็นจำนวนมากเราจะใส่จำนวนการกระทำในฉากเป็นวัตถุที่เราจะสร้างและแน่นอนเราจะสร้างร่างกายและ AI

06:11.850 --> 06:19.170
และนั่นคือสาเหตุที่หัวข้อถัดไปฉันจะเรียกมันว่าสร้าง AI AI เพราะตอนนี้เราสามารถสร้างดวงตาได้มากเท่าที่เราต้องการ

06:19.170 --> 06:22.070
นั่นคือสิ่งที่ยอดเยี่ยมเกี่ยวกับการเขียนโปรแกรมเชิงวัตถุ

06:22.110 --> 06:24.290
เราสามารถสร้าง AI ได้ตามที่ต้องการ

06:24.320 --> 06:31.690
ดังนั้นเราจะสร้าง AI ของเราที่มีสมองที่มีความซับซ้อน

06:31.860 --> 06:33.430
จนกว่าจะสนุกกับ AI