WEBVTT

00:00.480 --> 00:03.160
สวัสดีและยินดีต้อนรับสู่การสอน Python นี้

00:03.180 --> 00:03.520
เอาล่ะ

00:03.520 --> 00:08.810
ในน้ำมันนี้เราจะสร้างฟังก์ชั่นที่จะเลือกการกระทำที่เหมาะสมและทุกครั้ง

00:08.810 --> 00:13.650
โดยพื้นฐานแล้วเราจะใช้ชิ้นส่วนที่จะทำให้รถเคลื่อนที่ถูกต้อง

00:13.740 --> 00:20.640
และทุกครั้งที่มันออกไปตรงหรือไปทางขวาเพื่อไปให้ถึงเป้าหมายและเพื่อหลีกเลี่ยงอุปสรรคที่สืบเชื้อสายมา

00:21.000 --> 00:22.350
ลองทำกันตอนนี้

00:22.370 --> 00:37.410
เราจะเริ่มต้นตามปกติด้วยคนหูหนวกเพื่อกำหนดฟังก์ชั่นแล้วเราให้ชื่อฟังก์ชั่นของเราซึ่งเราจะเรียกการกระทำที่เลือกกว่าวงเล็บบางส่วนและฟังก์ชั่นการกระทำที่เลือกนี้จะมีสองอาร์กิวเมนต์

00:37.450 --> 00:46.150
สิ่งแรกคือตัวคุณเองเมื่อคุณโตขึ้นเพื่ออ้างถึงวัตถุและอาร์กิวเมนต์ที่สองซึ่งตามที่คุณกำลังจะเป็นที่หนึ่ง

00:46.390 --> 00:47.860
มันอาจเป็นไปได้

00:47.860 --> 00:59.890
ถ้าคุณคิดเกี่ยวกับมันการกระทำที่เราเลือกมาจากเอาท์พุทของโครงข่ายประสาทเทียมเพราะเอาต์พุตของโครงข่ายประสาทหรือค่า q สำหรับแต่ละการกระทำที่เป็นไปได้สามข้อ

00:59.890 --> 01:11.610
เครือข่ายนิวรัลขึ้นอยู่กับสถานะอินพุตและสถานะอินพุตเป็นอาร์กิวเมนต์ที่สองที่เราต้องการด้วยฟังก์ชันการทำงานที่เลือก

01:11.680 --> 01:16.310
เป็นเพราะเรากำลังจะเอาท์พุทของเครือข่ายประสาท

01:16.510 --> 01:22.180
และแน่นอนว่าผลลัพธ์ของเครือข่ายประสาทโดยตรงขึ้นอยู่กับอินพุตของเครือข่ายประสาท

01:22.360 --> 01:24.010
นั่นจะเป็นข้อโต้แย้งของเรา

01:24.280 --> 01:31.720
และตอนนี้เราสามารถตั้งชื่อได้จริง

01:31.960 --> 01:39.920
ๆ แล้วเราจะเรียกมันว่าสถานะเพราะอินพุตของเครือข่ายประสาทเทียมคือสถานะอินพุตที่และเขียนโดยเวกเตอร์ขนาดห้าถึงสามทิศทางการวางแนวและลบ

01:40.120 --> 01:42.120
และตอนนี้ทุกอย่างก็ง่ายขึ้น

01:42.160 --> 01:47.860
เราจะป้อนสถานะอินพุตเข้าสู่เครือข่ายประสาทเทียมที่เราสร้างขึ้นด้านบนตรงนี้กับคลาสถัดไปจากนั้นเราจะได้ผลลัพธ์ซึ่งเป็นค่าคีย์สำหรับการกระทำที่เป็นไปได้สามอย่างจากนั้น

01:47.860 --> 01:54.520
ใช้วิธี soft

01:54.520 --> 02:00.360
max ซึ่งฉันจะอธิบายในบทช่วยสอนนี้

02:00.400 --> 02:03.140
เรากำลังจะได้ฉากสุดท้ายที่จะเล่น

02:03.280 --> 02:08.460
งั้นลองทำฟังก์ชั่นกันดู

02:08.470 --> 02:14.980
ดังนั้นสิ่งแรกที่เราต้องเริ่มต้นคือเกี่ยวกับสิ่งที่ฉันเพิ่งกล่าวถึง soughed Max ความคิดของ

02:14.980 --> 02:20.590
soft max คือการที่เรากำลังพยายามที่จะเล่นให้ดีที่สุดในแต่ละครั้ง

02:20.740 --> 02:25.000
แต่ในเวลาเดียวกันเราจะสำรวจการกระทำที่แตกต่างกัน

02:25.000 --> 02:25.950
และเราจะทำอย่างไร

02:25.960 --> 02:31.080
เราจะได้รับการดำเนินการที่ดีที่สุดในการเล่นในขณะที่ยังคงสำรวจการกระทำอื่น ๆ

02:31.270 --> 02:40.370
ทีนี้เราใช้ความคิดเรื่องนี้ซึ่งประกอบด้วยการแจกแจงความน่าจะเป็นสำหรับค่า q แต่ละค่า

02:40.420 --> 02:42.100
การกระทำ Q States

02:42.160 --> 02:46.600
ตอนนี้เรามีค่า Q หนึ่งค่าสำหรับแต่ละการกระทำไปทางซ้ายหรือตรง

02:46.850 --> 02:49.680
แต่ค่า q นี้ยังขึ้นอยู่กับสถานะอินพุต

02:49.690 --> 02:52.720
นั่นคือฟังก์ชั่น Q ที่ใช้ในการบรรยายปรีชา

02:52.870 --> 02:56.280
ฟังก์ชั่น Q นี้เป็นฟังก์ชั่นของรัฐและการกระทำ

02:56.320 --> 03:09.070
ดังนั้นเนื่องจากเรามีสถานะอินพุตหนึ่งสถานะซึ่งเป็นสถานะที่นี่และสามการกระทำที่เป็นไปได้เราจึงมีค่าใหม่สามค่า

03:09.070 --> 03:13.760
การกระทำของรัฐ 1 Q การกระทำของรัฐ 2 และสองการกระทำของรัฐ 3 และเราจะสร้างการกระจายของความน่าจะเป็นที่เกี่ยวกับค่านิยมทั้งสาม

03:13.930 --> 03:19.420
นั่นคือเราจะมีความน่าจะเป็นหนึ่งสำหรับค่า Q แรกความน่าจะเป็นหนึ่งสำหรับค่า

03:19.420 --> 03:25.490
Q ที่สองและความน่าจะเป็นที่สามสำหรับ Q ที่สามและความน่าจะเป็นทั้งสามนั้นจะรวมกันเป็น 1

03:25.670 --> 03:31.840
ดังนั้นเราจะทำทั้งหมดนี้ด้วยค่าสูงสุดของ soughed และค่า soughed Max จะให้ค่าความน่าจะเป็นที่สูงของค่า Q

03:32.170 --> 03:33.530
สูงสุด

03:33.820 --> 03:41.050
นั่นเป็นเหตุผลว่าทำไมทางเลือกของ soft max จึงเป็น RMX แบบง่ายๆที่ไม่รับค่า q

03:41.530 --> 03:44.860
สูงสุดโดยตรง แต่ในกรณีนี้เราไม่ได้สำรวจการกระทำอื่น ๆ

03:44.920 --> 03:51.900
ด้วยความน่าจะเป็นที่เราสามารถสำรวจได้จากที่อื่นโดยใช้พารามิเตอร์อุณหภูมิที่เราจะเห็นได้อย่างรวดเร็ว

03:52.210 --> 03:55.990
เรายังสามารถสำรวจพวกมันได้โดยการกำหนดค่าพารามิเตอร์อุณหภูมินี้

03:56.020 --> 04:03.380
นั่นเป็นเหตุผลทั่วไปสำหรับความปลอดภัยฉันขอแนะนำให้ใช้ soft x มากกว่า RMX ธรรมดา

04:03.460 --> 04:06.990
เอาล่ะมาลองใช้ X กันเถอะ

04:07.060 --> 04:12.990
เนื่องจาก soughed Max ส่งคืนความน่าจะเป็นของแต่ละค่า Q ทั้งสามสำหรับการดำเนินการสามอย่าง

04:13.180 --> 04:20.120
ตัวแปรแรกที่เราจะสร้างอาจอ้างอิงถึงความน่าจะเป็นเหล่านี้

04:20.450 --> 04:28.070
ดังนั้นอุปกรณ์ประกอบฉากเท่ากับและตอนนี้เรากำลังจะใช้ฟังก์ชันถัดไปที่ทำให้เค็มของเราและตามที่คุณจะไปจากที่ใด

04:28.330 --> 04:31.600
แน่นอนว่าเราจำได้ว่านำเข้า

04:31.700 --> 04:39.790
และจากนั้นฟังก์ชั่น submodule ที่ฉันเตือนคือโมดูลที่มีการดำเนินการส่วนใหญ่ในการนำเครือข่ายประสาท

04:39.820 --> 04:44.980
เราให้มันเป็นทางลัด F และนั่นก็คือจากฟังก์ชั่น submodule

04:44.980 --> 04:46.990
ที่เราจะทำหน้าที่ต่อไป

04:47.290 --> 04:53.830
แต่เนื่องจากเราให้ทางลัด f เราจึงเริ่มต้นที่นี่ด้วย Neph

04:54.040 --> 04:56.080
ซึ่งเป็นตัวแทนของฟังก์ชันที่เราใช้ในฟังก์ชันถัดไป

04:56.080 --> 04:56.920
นี่มันคือ

04:56.980 --> 04:59.540
นั่นคืออันแรกและวงเล็บ

04:59.770 --> 05:00.160
เอาล่ะ

05:00.200 --> 05:03.920
ทีนี้เราต้องใส่อะไรในฟังก์ชั่นถัดไป

05:04.150 --> 05:10.020
แน่นอนว่าเป็นเอนทิตีที่เราต้องการสร้างการแจกแจงความน่าจะเป็น

05:10.190 --> 05:11.430
และหน่วยงานเหล่านี้คืออะไร

05:11.550 --> 05:13.870
แน่นอนว่าสิ่งเหล่านี้คือค่านิยมหลัก

05:13.870 --> 05:16.790
ตอนนี้คำถามคือเราจะได้ค่า q อย่างไร

05:16.960 --> 05:23.410
แน่นอนว่าค่า q คือผลลัพธ์ของโครงข่ายประสาทและเพื่อให้ได้ผลลัพธ์เหล่านี้ของ

05:23.590 --> 05:24.560
เราไปกันดีกว่า

05:24.610 --> 05:26.830
เราจำเป็นต้องใช้เครือข่ายใหม่ของเรา

05:27.100 --> 05:33.520
แต่ในความเป็นจริงเรามีอยู่แล้วเพราะนั่นคือสิ่งที่เริ่มต้นได้ในตอนท้าย

05:33.530 --> 05:41.540
รู้ว่าเราสร้างรูปแบบการเรียนรู้ด้วยตนเองซึ่งไม่มีอะไรอื่นที่จะไม่ทำงานเพราะเป็นวัตถุใหม่ของคลาสเครือข่าย

05:41.600 --> 05:42.820
และนั่นก็สมบูรณ์แบบ

05:42.830 --> 05:52.950
เราสามารถนำโมเดลของเรามาที่นี่และสิ่งต่อไปจะใช้โมเดลนี้กับสถานะอินพุตซึ่งเป็นอาร์กิวเมนต์ที่นี่

05:53.090 --> 05:54.440
นั่นคือค่าที่สำคัญ

05:54.560 --> 06:00.840
ดังนั้นตอนนี้สัญชาตญาณของคุณว่าทำไมเราต้องนำแบบจำลองนี้ไปใช้เพื่อแนะนำในฟังก์ชัน

06:00.920 --> 06:08.780
ผู้ที่เริ่มต้นด้วยการเขียนโปรแกรมเชิงวัตถุคุณจะเห็นว่าทั้งหมดนี้จะกลายเป็นธรรมชาติที่อ่อนนุ่มต่อไป

06:08.870 --> 06:16.840
ดังนั้นเราจึงนำแบบจำลองของเราเองมาใช้เพราะนี่จะต้องเป็นแบบจำลองของวัตถุที่เราสร้างขึ้นที่นี่

06:17.180 --> 06:30.400
แต่จากนั้นเราจำเป็นต้องรับเอาท์พุทของโมเดลโครงข่ายประสาทของเราและดังนั้นเราจะได้ยินวงเล็บบางตัวที่เราจะใส่เข้าไป

06:30.620 --> 06:40.560
ดังนั้นสิ่งที่เราต้องการทำในตอนแรกคือเข้าสู่สถานะ แต่ตอนนี้เราต้องระวังสิ่งที่รัฐดูเหมือนจะเป็นชุดที่เรียบง่ายในขณะนี้

06:40.790 --> 06:52.190
แต่จำไว้ว่ารัฐนั้นจะเป็นเซ็นเซอร์คบเพลิงเพราะในภายหลังเราจะใช้เซลล์นี้ในสถานะที่น้อยลงเพื่อใช้เป็นอาร์กิวเมนต์ของฟังก์ชั่นเลือกการกระทำ

06:52.190 --> 06:57.430
การโต้เถียงของรัฐที่อยู่ที่นี่กำลังจะกลายเป็นรัฐที่สอนตัวเองน้อยกว่า

06:57.680 --> 07:01.680
และเนื่องจากนี่เป็นโลกแห่งคำตอบที่ทรมานรูปแบบจะยอมรับ

07:01.760 --> 07:02.690
นั่นเป็นเรื่องปกติ

07:02.810 --> 07:05.000
แต่ตอนนี้เราสามารถปรับปรุงอัลกอริทึม

07:05.180 --> 07:13.260
ดังนั้นทันทีที่รัฐเป็นเซ็นเซอร์ไฟฉายและอย่างที่เราได้กล่าวไปแล้วก่อนหน้านี้

07:13.320 --> 07:15.640
สิ่งนี้จะมีการไล่ระดับสี

07:15.650 --> 07:27.990
ตอนนี้สิ่งที่เราจะทำก่อนคือห่อสถานะอินพุตนี้ซึ่งเป็นเมตริกซ์เข้าไปในไฟฉายได้ดี แต่เนื่องจากนี่คือสถานะอินพุต

07:28.160 --> 07:34.700
เราจะไม่ใช้การไล่ระดับสีของ

07:34.880 --> 07:45.530
Voivode ของไฟฉายสถานะนี้และนั่นอาจเป็นสถานีดังนั้นสิ่งที่เรากำลังจะทำตอนนี้คือการแปลงสถานะเซ็นเซอร์ไฟฉายนี้เป็นตัวแปรไฟฉายเช่นนี้

07:45.780 --> 07:52.380
แต่เพื่อระบุว่าเราไม่ต้องการการไล่ระดับสีในกราฟที่สามารถปล้นได้ในตอนท้ายของ Mudgal

07:52.570 --> 07:57.800
ทีนี้เราจะได้ค่าความผันผวนเท่ากับจริง

07:58.150 --> 08:07.200
ดังนั้นตอนนี้เรามีเซ็นเซอร์คบเพลิงของรัฐเป็นไฟฉายได้ดีมาก แต่ต้องขอบคุณ Votel นี้เท่ากับบารอมิเตอร์จริง

08:07.390 --> 08:16.530
ทีนี้เราจะรวมการไล่ระดับสีที่เกี่ยวข้องกับสถานะอินพุตนี้เข้ากับกราฟของเงื่อนไขทั้งหมดของจุดจบในโมเดลนั้น

08:16.840 --> 08:18.530
นั่นคือเคล็ดลับทางเทคนิคอื่น

08:18.550 --> 08:23.130
สิ่งนี้จะช่วยให้เรามีความทรงจำและดังนั้นสิ่งนี้จะปรับปรุงประสิทธิภาพ

08:23.170 --> 08:27.850
ดังนั้นฉันขอแนะนำให้ทำและตอนนี้เรากำลังจะเพิ่มสิ่งที่สนุกกว่า

08:27.910 --> 08:30.640
มันเกี่ยวกับพารามิเตอร์อุณหภูมิที่ฉันเพิ่งพูด

08:30.850 --> 08:40.040
ดังนั้นพารามิเตอร์อุณหภูมินี้เป็นพารามิเตอร์ที่จะช่วยให้เราปรับเปลี่ยนวิธีการที่เครือข่ายประสาทจะต้องแน่ใจว่าการกระทำที่ควรจะเล่น

08:40.210 --> 08:56.540
ดังนั้นพารามิเตอร์อุณหภูมินี้จะเป็นตัวเลขบวกและยิ่งเข้าใกล้มากเท่าใดก็จะยิ่งเป็นศูนย์ยิ่งแน่ใจว่าเครือข่ายประสาทเทียมจะเล่นเมื่อมีการเคลื่อนไหวและยิ่งพารามิเตอร์อุณหภูมิสูงขึ้นเท่าใด .

08:56.890 --> 09:05.250
และเพื่อเพิ่มพารามิเตอร์นี้ฉันจะคูณเอาท์พุทซึ่งเป็น Kugan ที่ใช้โดยพารามิเตอร์อุณหภูมินี้

09:05.500 --> 09:13.440
งั้นลองเริ่มตัวอย่างด้วย 7 แล้วผมจะระบุที่นี่ความคิดเห็นเล็กน้อย T เท่ากับ 7

09:13.460 --> 09:15.610
นั่นคือพารามิเตอร์อุณหภูมิ

09:15.690 --> 09:17.210
ฉันขอโทษไปที่ 7

09:17.260 --> 09:21.010
เราจะลองอันอื่น แต่ฉันอยากเริ่มด้วยอันเล็ก ๆ เพราะคุณจะเห็นด้วยอันเล็ก

09:21.010 --> 09:22.470
ๆ

09:22.510 --> 09:34.340
รถของเราจะยังคงทำตัวเหมือนแมลงบางชนิด แต่จากนั้นการเพิ่มพารามิเตอร์อุณหภูมิรหัสของเราจะดูเหมือนรถและตัดสินใจขายการขับขี่จะดีขึ้นมาก

09:34.480 --> 09:40.450
และนั่นก็สมเหตุสมผลเนื่องจากค่าที่สูงกว่าคือพารามิเตอร์อุณหภูมิที่สูงกว่าจะเป็นความน่าจะเป็นของ Juval

09:40.450 --> 09:48.010
ที่ชนะเพราะตัวอย่างเช่นถ้าเรามีค่า q สูงสุด

09:48.190 --> 09:54.850
ลองหาตัวเลขง่ายๆหนึ่งสองสามถ้ายัดได้สูงสุดหนึ่งถึงสามเท่ากับ

09:54.850 --> 10:01.150
ตัวอย่างเช่น 0 04 0. 11 และเปิดแปดสิบห้า

10:01.270 --> 10:05.650
จากนั้นเพิ่มอุณหภูมิโดยการเพิ่มอุณหภูมิ

10:05.680 --> 10:13.360
ตอนนี้อุณหภูมิเท่ากับหนึ่งโดยการใช้อุณหภูมิสูงเช่นตัวอย่างการลบ

10:13.360 --> 10:24.110
Tussaud ลองคัดลอกแล้วคูณด้วยตัวอย่างสองหรือสามถัดไปมีค่าเท่ากัน แต่คูณด้วยพารามิเตอร์อุณหภูมิสาม

10:24.370 --> 10:39.260
ทีนี้เราจะได้อะไรที่เป็นศูนย์สำหรับค่าคิวแรกเพราะนี่มีความน่าจะเป็นที่ต่ำมากที่บางสิ่งรอบศูนย์แล้วบางสิ่งที่เล็กมากสำหรับความน่าจะเป็นที่สองเพราะนี่ยังคงเป็นความน่าจะเป็นต่ำ

10:39.410 --> 10:42.910
สมมุติว่าเป็นตัวอย่างหรือจุด 0 2

10:43.320 --> 10:49.910
แต่ความน่าจะเป็นที่สามนี้เพราะมันเป็นอันที่ใหญ่ที่สุดและอันที่สูงมาก

10:50.140 --> 10:55.180
การเพิ่มอุณหภูมิความน่าจะเป็นนี้จะยิ่งใหญ่ขึ้นเพราะเราจะต้องแน่ใจมากขึ้นว่านี่คือค่า

10:55.180 --> 11:05.630
Q ที่ถูกต้องซึ่งสอดคล้องกับการกระทำที่เราต้องเล่นดังนั้นนี่จึงเป็น 0

11:05.630 --> 11:05.630
2 98.

11:05.980 --> 11:11.800
ทีนี้โดยการเพิ่มพารามิเตอร์อุณหภูมิตอนนี้เรามั่นใจมากขึ้นว่าการกระทำที่สามที่นี่ควรเป็นการกระทำที่จะเล่นเพราะความน่าจะเป็นสำหรับค่า q

11:11.800 --> 11:19.590
ของการกระทำนี้ไม่เพียง แต่ใหญ่ที่สุด แต่ยังสูงมาก

11:19.840 --> 11:22.600
นั่นคือสิ่งที่พารามิเตอร์อุณหภูมินี้เกี่ยวกับ

11:22.660 --> 11:27.340
มันเกี่ยวกับความมั่นใจในทิศทางที่เราควรตัดสินใจเล่น

11:27.340 --> 11:27.610
เอาล่ะ

11:27.610 --> 11:29.450
ดังนั้นฉันจะลบความคิดเห็นนี้

11:29.470 --> 11:31.000
นี่เป็นเพียงการอธิบาย

11:31.200 --> 11:33.490
และตอนนี้เรามาลงมือทำกันดีกว่า

11:33.490 --> 11:35.370
ดังนั้นคุณจะทำอย่างไร

11:35.560 --> 11:41.440
หลักการของวิธีการต่อไปไม่เพียง แต่จะสร้างการแจกแจงความน่าจะเป็นสำหรับค่าคีย์แต่ละค่า

11:41.440 --> 11:46.390
แต่ยังและนั่นคือขั้นตอนที่สองของวิธีการอ่อนตัวถัดไป

11:46.480 --> 11:51.820
เราใช้การสุ่มจับจากการแจกแจงนี้เพื่อรับการกระทำขั้นสุดท้าย

11:52.010 --> 11:57.310
และแน่นอนว่าเราจะมีโอกาสสูงที่จะได้รับการกระทำที่สอดคล้องกับค่า Q

11:57.310 --> 12:01.660
ที่มีความน่าจะเป็นสูงสุดเพราะนั่นคือวิธีการแจกแจง

12:01.660 --> 12:02.550
ดังนั้นเราไปกันเลย

12:02.560 --> 12:04.040
มาลงมือทำกันดีกว่า

12:04.060 --> 12:11.380
ดังนั้นเราจะแนะนำ Voivode

12:11.380 --> 12:17.460
ใหม่คือเราจะเรียกแอคชั่นและการกระทำนี้จะเป็นการสุ่มเลือกการแจกแจงความน่าจะเป็นที่เราเพิ่งสร้างขึ้นก่อนหน้านี้

12:17.510 --> 12:20.100
แล้วเราจะได้รับการสุ่มแบบสุ่มได้อย่างไร

12:20.200 --> 12:26.410
ทีนี้เราจะลองใช้ความน่าจะเป็นของแต่ละค่าหลักที่เราใช้ประกอบฉากแล้วโผแล้วเราจะใช้ฟังก์ชั่นหลาย

12:26.650 --> 12:36.030
Gnomeo และนั่นจะให้ผลการสุ่มจากกระบวนการกระจาย

12:36.160 --> 12:38.420
นั่นคือทั้งหมดที่จะได้รับปฏิกิริยาของเขา

12:38.470 --> 12:39.280
สมบูรณ์

12:39.490 --> 12:42.790
และแน่นอนตอนนี้เรากำลังจะกลับมาดำเนินการ

12:42.790 --> 12:44.730
มีเคล็ดลับเล็กน้อยที่นี่

12:44.810 --> 12:51.460
อะไรคือความจริงที่ว่า Propst ที่ multinomial คืนค่า PI ไปสู่การใช้งานได้กับป้ายปลอม

12:51.490 --> 12:57.210
คุณรู้ว่าเพชรปลอมนี้และสอดคล้องกับชุดและเพื่อให้ได้ผลลัพธ์ที่ถูกต้องที่เราต้องการนั่นคือการกระทำใน 0 1 หรือ

12:57.220 --> 13:00.540
2

13:00.820 --> 13:08.200
เราต้องเพิ่มข้อมูลที่นี่จากนั้นวงเล็บและการกระทำที่นี่เป็นหนึ่งหรือสองอย่างที่เรากำลังค้นหาคือเนื้อหาและดัชนีคือ 0 และ

13:08.230 --> 13:13.100
0

13:13.570 --> 13:14.000
เอาล่ะ

13:14.000 --> 13:14.730
และเราไปกันแล้ว

13:14.740 --> 13:21.420
ตอนนี้เรามีการกระทำของเราด้วยฟังก์ชั่นการกระทำที่เลือก AI ตอนนี้จะรู้ว่าการกระทำที่จะเล่น

13:21.490 --> 13:22.440
และแต่ละครั้ง

13:22.810 --> 13:23.460
มากมาย

13:23.500 --> 13:27.430
ดังนั้นตอนนี้เราสามารถไปยังฟังก์ชั่นถัดไปซึ่งจะเป็นฟังก์ชั่นเรียนรู้

13:27.520 --> 13:35.790
และนั่นคือสิ่งที่เราจะฝึกอบรมเครือข่ายประสาททั้งหมดที่คุณรู้จักด้วยการแพร่กระจายไปข้างหน้าทั้งหมดจากนั้นการขยายพันธุ์กลับคือการจัดหมวดหมู่ตามความหมาย

13:35.950 --> 13:43.340
โดยพื้นฐานแล้วเราจะทำการฝึกอบรมรูปแบบการเรียนรู้อย่างลึกซึ้งทั้งหมดซึ่งเป็นหัวใจสำคัญของปัญญาประดิษฐ์ของเรา

13:43.480 --> 13:44.680
ดังนั้นฉันไม่สามารถรอที่จะทำ

13:44.680 --> 13:49.290
นี่จะเป็นการสอนที่น่าตื่นเต้นดังนั้นฉันจะพบคุณใน Statoil ครั้งต่อไป

13:49.510 --> 13:50.670
จนกว่าจะสนุกแล้ว

13:50.720 --> 13:51.000
ผม.