WEBVTT

00:00.480 --> 00:06.650
สวัสดีและยินดีต้อนรับสู่การสอนนี้ตอนนี้เรากำลังจะทำให้ฟังก์ชั่นที่สองนี้เพื่อเริ่มต้นน้ำหนัก

00:06.840 --> 00:11.190
และอันนี้จะถูกใช้เพื่อการเรียนรู้ที่ดีที่สุด

00:11.340 --> 00:13.160
ที่จริงแล้วน้ำหนักเหล่านี้

00:13.230 --> 00:26.020
ดังนั้นฟังก์ชั่นที่สองเราจะเรียกมันว่าขีดล่างในนั้นและมันจะใช้เป็นอาร์กิวเมนต์วัตถุและซึ่งจะเป็นตัวแทนของเครือข่ายประสาท

00:26.220 --> 00:27.080
นั่นคือทั้งหมดที่

00:27.090 --> 00:32.300
จากนั้นโคลอนและตอนนี้ลองเข้าไปในฟังก์ชันเพื่อกำหนดสิ่งที่เราต้องการ

00:32.580 --> 00:39.920
ดังนั้นสิ่งที่เราต้องการทำคือเริ่มต้นน้ำหนักของเครือข่ายใหม่ในลักษณะที่เราได้รับการเรียนรู้ที่ดี

00:40.080 --> 00:43.590
ดังนั้นสิ่งนี้ดูเหมือนจะไม่ง่ายนัก

00:43.590 --> 00:46.740
สิ่งนี้อยู่บนพื้นฐานของงานวิจัยและการทดลอง

00:46.740 --> 00:54.740
เราจะเริ่มต้นน้ำหนักในวิธีเฉพาะที่เราไม่เคยเห็นมาก่อน แต่เชื่อฉันว่าจะเพิ่มประสิทธิภาพของกระบวนการเรียนรู้

00:54.930 --> 01:00.760
ดังนั้นเราจึงนำไปใช้โดยไม่ต้องลงรายละเอียดว่าทำไมเราจึงเริ่มต้นน้ำหนักด้วยวิธีนี้

01:00.960 --> 01:06.390
ดังนั้นเราจะเริ่มด้วยการใช้กลอุบายซึ่งจะใช้ในภายหลังเพื่อสร้างความแตกต่างระหว่างการบิดและการเชื่อมต่อแบบเต็มเพราะคุณรู้ว่า

01:06.660 --> 01:15.290
AI ของเราจะมีตาและมันจะมีเลเยอร์ convolutional

01:15.330 --> 01:23.550
และแน่นอนว่ามันจะมีเลเยอร์ที่เชื่อมต่ออย่างเต็มที่และเราจะมีการเริ่มต้นที่แตกต่างกันของน้ำหนักสำหรับการเชื่อมต่อทั้งสองประเภท

01:23.820 --> 01:34.160
ดังนั้นเราจะใช้เคล็ดลับนี้เพื่อแยกการเชื่อมต่อสองประเภทนี้จากนั้นเราจะใช้เงื่อนไขบางอย่างเพื่อให้ได้การเริ่มต้นที่แตกต่างกันสำหรับการเชื่อมต่อเหล่านี้

01:34.170 --> 01:44.630
ดังนั้นเคล็ดลับนี้คือการสร้างตัวแปรใหม่ที่เราจะเรียกนามสกุลและที่จะถูกเรียกไปยังวัตถุดังนั้นและแสดงถึงเครือข่ายประสาท

01:44.670 --> 01:47.140
แต่มันเป็นวัตถุที่เราจะเห็นในภายหลัง

01:47.430 --> 01:54.290
และเราจะได้รับคุณสมบัติพิเศษจากวัตถุนี้ซึ่งจะเป็น

01:54.390 --> 02:01.570
Kolesnik ที่มีเครื่องหมายขีดล่างคู่ชั้นแรกขีดเส้นใต้คู่จุดขีดเส้นใต้คู่อีกครั้งชื่อและเกือบจะมี

02:01.610 --> 02:03.100
ขีดเส้นใต้คู่อื่น

02:03.360 --> 02:12.100
นั่นเป็นกลอุบายที่น่าเกลียดที่จะมองหาประเภทการเชื่อมต่อของวัตถุเครือข่ายใหม่ของเรา แต่มันจะให้สิ่งที่คุณต้องการ

02:12.210 --> 02:15.300
คุณจะเห็นว่ามันจะสมเหตุสมผลเมื่อเราเริ่มต้นถ้ามีเงื่อนไข

02:15.540 --> 02:19.710
และโดยวิธีการพูดของเงื่อนไขเราสามารถหยุดพวกเขาได้ในขณะนี้

02:19.710 --> 02:26.170
และสิ่งที่เรากำลังจะทำตอนนี้คือเริ่มเงื่อนไขแรกซึ่งจะให้เราคดีแรก

02:26.280 --> 02:35.510
นั่นคือถ้าการเชื่อมต่อนั้นเป็นรูปสังวัตนาและเพื่อที่จะเขียนเงื่อนไขนี้ให้ถูกต้อง

02:35.510 --> 02:45.180
ที่นี่เราใช้วิธีการค้นหาวิธีการค้นหาและภายในเมื่อใส่ในเครื่องหมายคำพูดเพื่อหาข้อตกลง

02:45.300 --> 02:57.900
ดังนั้นถ้าชื่อคลาสสามารถค้นหาได้เราจะทำแตกต่างจากลบหนึ่งที่จริงถ้าเรามีการสนทนาเพราะ Manasquan หมายถึงไม่

02:58.200 --> 03:03.360
ในกรณีนี้เราจะทำการเริ่มต้นน้ำหนักพิเศษ

03:03.420 --> 03:07.830
ดังนั้นเงื่อนไขนี้ตรงนี้หมายความว่าถ้าเรามีการเชื่อมต่อแบบคอนโวล

03:07.830 --> 03:13.910
ดังนั้นในกรณีนี้สิ่งที่เราทำคือเรียกใช้การกำหนดค่าเริ่มต้นเฉพาะวิธีที่เราต้องการทำ

03:14.040 --> 03:17.930
และนั่นคือสิ่งที่ทุกสิ่งที่ไม่คุ้นเคยจะเกิดขึ้น

03:18.060 --> 03:21.990
เราจะเริ่มต้นด้วยการสร้างตัวแปรที่เราจะเรียกมันว่า

03:22.180 --> 03:31.310
และรูปร่างของศาลนี้ดังนั้นรูปร่างที่ขีดน้ำหนักจะเป็นรายการที่โดยทั่วไปจะมีรูปร่างของน้ำหนักในเครือข่ายใหม่ของเรา

03:31.580 --> 03:35.800
ดังนั้นเราจึงใช้ฟังก์ชั่นรายการเพื่อสร้างรายการ

03:35.930 --> 03:43.500
และภายในเราจะใส่โครงข่ายประสาทเทียมนั่นคือน้ำหนักของโครงข่ายประสาท

03:43.570 --> 03:59.670
แต่ในการเชื่อมต่อแบบสังวัตนาและเพื่อให้ได้รูปร่างของตุ้มน้ำหนักเหล่านี้เราใช้คุณลักษณะอื่นซึ่งก็คือข้อมูลแล้วขนาดขนาดจะทำให้เราได้รูปร่างของตุ้มน้ำหนักเหล่านี้ในการเชื่อมต่อแบบคอนโวลูชั่น

03:59.680 --> 04:08.300
ดังนั้นตอนนี้รูปร่างของน้ำหนักจะมีรูปร่างของน้ำหนักและการเชื่อมต่อที่เป็นรูปธรรมของเครือข่ายของเราและ

04:08.460 --> 04:14.510
เอาล่ะเรามีรูปทรงน้ำหนักเพื่อเริ่มต้นน้ำหนักของการเชื่อมต่อที่มีการบิดนี้

04:14.560 --> 04:16.650
เราจะต้องมีค่าสองค่า

04:16.650 --> 04:22.920
แรกคือผลิตภัณฑ์ของมิติแรกโดยการเสนอชื่อที่สองโดยมิติที่สามนี้

04:22.930 --> 04:35.660
นั่นคือสิ่งที่เราจะได้รับในขณะนี้และจากนั้นเราจะต้องได้รับค่าศูนย์เวลาโบราณครั้งที่สองและบางครั้งมิติที่สามแล้วเราจะใช้ค่าทั้งสองนี้ในการแข่งขันวิธีการที่เราเริ่มต้น น้ำหนัก

04:35.670 --> 04:37.920
งั้นลองมาดูกันผ่านผลิตภัณฑ์ตัวแรกนี้

04:37.920 --> 04:46.050
เราเรียกมันว่าความสนุกและมันจะเท่ากับผลิตภัณฑ์และเราจะใช้ฟังก์ชัน prod ซึ่งเป็นฟังก์ชั่นที่ไม่ใช่คนไทยซึ่งมีทางลัดและ P

04:46.050 --> 04:56.680
ดังนั้น MP ที่ PRUD และภายในเราผลิตสิ่งที่เราต้องการ สินค้า

04:57.180 --> 05:02.590
อย่างที่เราบอกไปนั่นคือเพชรและรูปร่างน้ำหนักหนึ่งในสองของเรา

05:02.880 --> 05:10.430
เพื่อให้ได้สิ่งนี้เราสามารถสร้างรูปคลื่นและรับดัชนีของเครื่องยนต์สามบรรทัดเหล่านี้

05:10.500 --> 05:15.800
ดังนั้นเราจึงตั้งมัน Simonton หนึ่งถึง 10 นิ้วและสามรวม

05:16.020 --> 05:18.770
ดังนั้นดันเจี้ยนที่ถูกกีดกัน

05:19.050 --> 05:24.230
และนั่นคือวิธีที่เราจะได้มันสำหรับขอบเขตบนตรงนี้ไม่รวม

05:24.440 --> 05:35.410
นั่นคือสิ่งที่เราต้องการจากนั้น Same เพื่อความสนุกในขณะที่เราพูดว่า Fan out

05:35.410 --> 05:39.650
มันจะเป็นผลผลิตของความเสียหายในมิติเวลาศูนย์สองเท่าที่ฉันพูดถึงสาม

05:39.730 --> 05:45.490
และที่นี่เราสามารถทำดัชนีจากสองรวมถึงสี่ไม่รวม

05:45.730 --> 05:58.900
นั่นก็จะได้ผลคูณของเวลาและสองและสามแล้วเราก็คูณมันด้วยการออกแบบและศูนย์ที่เราสามารถเข้าถึงได้ด้วยค่าศูนย์ปลาวาฬของดัชนีศูนย์

05:59.230 --> 06:20.320
ดังนั้นการสรุปนี่คือครั้งเดียวสองครั้งในสามและด้านล่างเรามีศูนย์คูณสองครั้งในสามรายการตรวจสอบน้ำหนัก

06:20.320 --> 06:25.390
เอาล่ะตอนนี้เราจะใช้ค่าสองค่านี้ในการเริ่มต้นเพราะเราจะคำนวณค่าใหม่เนื่องจากเราจะเรียกค่า W

06:25.870 --> 06:33.280
bound และนั่นเท่ากับรากที่สอง เราสามารถหาฟังก์ชั่นและ P

06:33.280 --> 06:39.530
จากและโดยที่เป็น qr t

06:39.520 --> 06:40.830
ที่สองเหมือนก่อน

06:40.840 --> 06:46.710
สแควร์รูทของ 6 หารด้วยการแผ่ออก

06:46.820 --> 06:58.140
ดังนั้นแฟนในลองปล่อยออกมาว่าเราลง W นี่ตรงนี้แทนขนาดของน้ำหนักสิบ

06:58.240 --> 06:59.740
และทำไมเราถึงได้รับสิ่งนี้

06:59.740 --> 07:10.070
มันเป็นเพราะสิ่งที่เราเพิ่งจะทำตอนนี้คือเราต้องการสร้างน้ำหนักสุ่มบางส่วนที่แปรผกผันกับขนาดของน้ำหนักเทนเซอร์

07:10.180 --> 07:18.580
เพราะแน่นอนสิ่งที่เรากำลังจะทำตอนนี้คือการใช้เครือข่ายใหม่ของเราแล้วรับน้ำหนัก

07:18.580 --> 07:25.260
ดังนั้นโดยยังคงรับน้ำหนักของคุณลักษณะแล้วเข้าถึงข้อมูลของมันนั่นคือเมตริกซ์เอง

07:26.100 --> 07:37.110
แล้วจากตุ้มน้ำหนักนี้เราจะสร้างน้ำหนักสุ่มบางส่วนที่แปรผกผันกับขนาดของน้ำหนักตุ้ม

07:37.180 --> 07:45.520
ดังนั้นในฟังก์ชั่นชุดนี้ตอนนี้เราต้องใส่ขอบเขตล่างซึ่งจะเป็นลบ W ผูกกับและขอบบนซึ่งจะบวก W

07:45.520 --> 07:49.090
กลับ

07:49.750 --> 07:52.460
ตกลงดังนั้นสำหรับน้ำหนัก

07:52.510 --> 07:57.460
และตอนนี้เราต้องเริ่มต้นอคติและข่าวดีสำหรับอคติ

07:57.460 --> 07:59.130
มันจะง่ายกว่านี้มาก

07:59.200 --> 08:09.470
เราจะเริ่มต้นพวกเขาทั้งหมดด้วยศูนย์เพื่อรับซื้อเหล่านี้เราเอาพวกเขาจากแบบจำลองของเรานั่นคือเครือข่ายใหม่ของเรา

08:09.930 --> 08:15.790
จากนั้นแอ็ตทริบิวต์สำหรับอคตินั้นก็คืออคติด้วยการเข้าถึงข้อมูล

08:16.200 --> 08:31.600
จากนั้นเราจะใช้วิธีการซึ่งเป็นวิธีการขีดล่างของฟิลซึ่งในขณะที่คุณคาดเดาไว้จะใช้ในการเติมเมตริกซ์ของอคติกับศูนย์เป็นอย่างดีด้วยกฎที่เราต้องระบุว่า

08:31.700 --> 08:34.230
และนั่นคือสาเหตุที่ฉันใส่นี่เป็นศูนย์

08:34.560 --> 08:43.860
เอาล่ะสรุปก็คือเราสร้างตุ้มน้ำหนักสุ่มบางส่วนแปรผกผันกับขนาดของตุ้มน้ำหนักตุ้มน้ำหนักและเราเริ่มต้นอุปกรณ์ด้วยค่าศูนย์

08:43.860 --> 08:49.850
เอาล่ะนั่นคือสำหรับการเริ่มต้นการกระทำที่การเชื่อมต่อแบบ Convolution

08:49.880 --> 08:52.880
ตอนนี้เราต้องทำเช่นเดียวกันสำหรับการเชื่อมต่อแบบเต็ม

08:53.300 --> 09:05.160
ดังนั้นเราจะเพิ่มเงื่อนไขใหม่และถ้าอย่างนั้นเราใช้เคล็ดลับนี้เราใช้ชื่อชั้นที่เป็นตัวแปรนี้ที่มีชื่อที่แตกต่างกันของการเชื่อมต่อ

09:05.160 --> 09:19.050
ดังนั้นถ้าชื่อคลาสนั้นเหมือนกันเราใช้วิธีการค้นหาซึ่งเมื่อใส่เครื่องหมายคำพูดในเวลานี้การเชื่อมต่อแบบเต็มนั่นคือการเชื่อมต่อแบบคลาสสิกเชิงเส้นในเครือข่ายประสาทเทียมคลาสสิก

09:19.390 --> 09:41.360
และชื่อของมันนั้นเป็นเส้นตรงและการบอกว่าเราจะใช้เคล็ดลับนี้เพื่อบอกว่าเราต้องการให้มันแตกต่างจากลบหนึ่งดังนั้นนั่นคือจุดสิ้นสุดของสิ่งที่ชั้นผ้าลินินชั้นดีนี้ต่างจากลบ นั่นคือถ้าเรามีการเชื่อมต่อแบบคลาสสิก

09:41.360 --> 09:44.620
ดังนั้นในกรณีนี้เราจะเริ่มต้นน้ำหนักได้อย่างไร

09:44.840 --> 09:47.260
มันจะค่อนข้างเหมือนกัน

09:47.270 --> 09:54.020
เราจะแนะนำ

09:54.050 --> 10:01.430
Voales ที่มี

10:01.430 --> 10:09.440
whaleship ซึ่งจะไม่ลบอันแรกเพราะเราจะทำในกรณีนี้หรือในกรณีนั้นมันจะไม่เหมือนกันดังนั้นเราจึงสามารถย้อนกลับทั้งหมดแล้วเราจะแนะนำพัดลมในตัวแปร ซึ่งเวลานี้จะไม่เท่ากับผลคูณของสามมิตินี้

10:09.650 --> 10:17.090
แต่ที่จริงเวลานี้มันจะเท่ากับการออกแบบเพียงกล่าวถึงอย่างใดอย่างหนึ่ง

10:17.380 --> 10:23.870
และนั่นเป็นเพราะสำหรับการเชื่อมต่อแบบเต็มจะมีการเชื่อมต่อน้อยกว่าการเชื่อมต่อแบบ Convolution

10:23.880 --> 10:32.640
ตอนนี้นี่เป็นการบรรยายเชิงปรีชาญาณในตอนท้ายและในส่วนของ CNN นั้นมีการกล่าวถึงน้อยกว่าสำหรับการเชื่อมต่อที่สมบูรณ์กว่าสำหรับการโน้มน้าวใจ

10:32.640 --> 10:48.780
ดังนั้นโดยทั่วไปเราเพิ่งใช้เวลาในหนึ่งปีนี้แล้วบอกว่าเราจะมีตัวแปรแฟนเอาท์ซึ่งจะใช้คำนวณว

10:49.160 --> 10:49.890
ขอบเขตและการครอบงำโดยแฟนคนนี้จะเป็นรูปร่างน้ำหนักของดัชนี 0

10:49.890 --> 10:51.470
นั่นคือเพชรเป็นศูนย์

10:51.480 --> 10:55.290
เอาล่ะมาถึง GWB แล้วมันก็จะเหมือนกัน

10:55.470 --> 11:01.780
มันจะเป็นสแควร์รูทของ 6 หารด้วยผลรวมที่ทำให้ขุ่นเคืองและหา

11:01.830 --> 11:04.660
ดังนั้นเราไปกันเลย

11:04.880 --> 11:24.440
และข่าวดีก็คือมันเหมือนกับก่อนหน้านี้เราใช้ฟังก์ชั่นชุดสำหรับตุ้มน้ำหนักและฟังก์ชั่นการเติมสำหรับอคติเพื่อให้ได้การเริ่มต้นแบบเดียวกันในครั้งนี้โดยมีพัดลมที่แตกต่างกันออกไป .

11:24.560 --> 11:27.520
นั่นคือหลักการเดียวกันที่เป็นความคิดเดียวกัน

11:27.530 --> 11:39.160
สิ่งเดียวที่เปลี่ยนแปลงได้ที่นี่คือเรามีการปกครองน้อยกว่าสำหรับการเชื่อมต่อแบบเต็มดังนั้นการพิจารณาที่ง่ายขึ้นของน้ำหนักที่นี่ที่นี่เพื่อสร้างน้ำหนักแบบสุ่ม

11:39.200 --> 11:45.210
แต่ข่าวดีก็คือตอนนี้มันไม่เพียง แต่น้ำหนักเหล่านี้เท่านั้น

11:45.380 --> 11:47.150
แต่ตอนนี้เรามีเครื่องมือสองอย่าง

11:47.330 --> 11:50.180
ดังนั้นเราพร้อมที่จะเริ่มสร้างสมอง

11:50.300 --> 11:51.280
ดังนั้นฉันรอไม่ไหว

11:51.290 --> 11:53.500
แน่นอนว่านี่จะเป็นส่วนที่น่าตื่นเต้นที่สุด

11:53.510 --> 11:57.630
นี่เป็นเพียงการอุ่นเครื่องและเตรียมพร้อมสำหรับสิ่งที่ยิ่งใหญ่

11:57.650 --> 11:59.990
ดังนั้นเราจะดูแลในบทช่วยสอนถัดไป

12:00.080 --> 12:02.590
แน่นอนว่ามันต้องใช้บทเรียนหลายอย่างแน่นอน

12:02.690 --> 12:04.350
เราจะเริ่มต้นด้วยการจับตา

12:04.520 --> 12:12.170
และจำไว้ว่าเราจะเพิ่มภาพประกอบเพื่อเรียนรู้คุณสมบัติทางโลกของข้อมูลนั้นแล้วเราจะดูแลนักแสดงและนักวิจารณ์

12:12.170 --> 12:17.000
และนั่นคือสิ่งที่เราจะใช้ฟังก์ชันนี้เพื่อทำให้ค่าเริ่มต้นมาเป็นค่าเริ่มต้นและมีน้ำหนักอยู่ในตัว

12:17.120 --> 12:18.590
ดังนั้นฉันไม่สามารถรอที่จะทำ

12:18.590 --> 12:20.630
ตอนนี้เรากำลังจะสร้างบางสิ่งที่ทรงพลังมากขึ้น

12:20.630 --> 12:22.510
เตรียมตัวให้พร้อม

12:22.790 --> 12:24.250
จนกว่าจะสนุกกับ AI
