WEBVTT

00:00.640 --> 00:02.940
สวัสดีและยินดีต้อนรับกลับสู่หลักสูตรการเรียนรู้ลึก

00:02.970 --> 00:12.180
วันนี้เรากำลังพูดถึงเงื่อนงำที่แก้ไขในหน่วยงานของคุณและนี่คือขั้นตอนเพิ่มเติมที่อยู่ด้านบนของขั้นตอนการโน้มน้าวใจของเรา

00:12.180 --> 00:16.140
ดังนั้นจึงไม่ใช่ขั้นตอนใหญ่แยกเป็นขั้นตอนเล็ก ๆ ในขั้นตอนเดียวโดยทั่วไป

00:16.290 --> 00:18.230
และเกิดอะไรขึ้นที่นี่

00:18.240 --> 00:26.080
ทีนี้เรามีอิมเมจอินพุตของเราเรามี convolutional ทั้งหมดที่เราได้พูดถึงแล้วยิ่งไปกว่านั้นเราจะนำไปใช้

00:26.400 --> 00:27.190
รอมันอยู่.

00:27.240 --> 00:36.720
ฟังก์ชั่น rectifier

00:36.750 --> 00:47.400
ที่เราโปรดปรานและคุณคุ้นเคยกับฟังก์ชัน rectifier จากส่วนก่อนหน้าบนเครือข่ายประสาทเทียมและในบางครั้งผู้เขียนหรือผู้สอนของเราแยก convolution

00:47.430 --> 00:57.060
และ fire โดยตรงเป็นสองขั้นตอนในตัวอย่างของเราซึ่งจะพิจารณาพวกเขาเพียงแค่ หนึ่งขั้นตอนใหญ่สำหรับวิวัฒนาการครั้งที่สองจากนั้นตัวเรียงกระแส

00:57.270 --> 01:13.410
และสาเหตุที่เราใช้วงจรเรียงกระแสเนื่องจากคุณต้องการเพิ่มความไม่เป็นเชิงเส้นในภาพของเราหรือในเครือข่ายของเราและเครือข่ายประสาทเชิงพาณิชย์ของเราและไฟของเราทำหน้าที่เป็นตัวกรองหรือการเข้าถึงฟังก์ชั่นนั้น เหตุผลที่เราต้องการเพิ่มความไม่เป็นเชิงเส้นในเครือข่ายของเราเพราะภาพตัวเองมีความไม่เป็นเชิงเส้นสูงโดยเฉพาะอย่างยิ่งถ้าคุณจำวัตถุต่าง ๆ

01:13.440 --> 01:25.950
ที่อยู่ติดกันหรือเพียงแค่บนพื้นหลังและสิ่งต่าง ๆ เช่นนั้น

01:26.010 --> 01:38.050
และการเปลี่ยนระหว่างพิกเซลพิกเซลที่อยู่ติดกันมักเป็นแบบไม่เชิงเส้น

01:38.040 --> 01:41.280
นั่นคือคุณรู้เพราะเส้นขอบเป็นสีที่แตกต่างกัน

01:41.460 --> 01:59.710
มีองค์ประกอบที่แตกต่างกันในภาพของคุณและในเวลาเดียวกันเมื่อเราใช้การคำนวณทางคณิตศาสตร์เช่นการบิดที่คุณรู้จักและเรียกใช้การตรวจจับคุณสมบัตินี้เพื่อสร้างแผนที่คุณลักษณะของเราเรามีความเสี่ยงที่เราอาจสร้างบางอย่างเชิงเส้น การบรรยาย

01:59.970 --> 02:05.960
ลองมาดูตัวอย่างที่นี่เป็นภาพและภาพต้นฉบับ

02:05.970 --> 02:13.220
ตอนนี้เมื่อเราใช้เครื่องตรวจจับการตรวจจับคุณสมบัติภาพนี้เราได้อะไรเช่นนี้

02:13.290 --> 02:16.230
คุณจะเห็นได้ว่าสีดำเป็นลบสีขาวเป็นค่าบวกเช่นกัน

02:16.230 --> 02:30.920
เมื่อคุณใช้เครื่องตรวจจับคุณสมบัติกับภาพที่เหมาะสมซึ่งไม่ได้เป็นเพียงศูนย์และคน แต่มีค่าที่แตกต่างกันมากมายและคุณนำไปใช้ตามที่เราเห็นก่อนหน้านี้คุณเท็กซัสสามารถมีค่าลบในตัวเองบางครั้งคุณจะได้รับค่าลบ

02:31.080 --> 02:34.670
และนี่คือสีดำที่เป็นลบสีขาวเป็นบวก

02:34.800 --> 02:46.490
และสิ่งที่ฟังก์ชั่นหน่วยเชิงเส้นที่แก้ไขแล้วทำคือลบสิทธิ์สีดำทั้งหมดในอะไรก็ตามที่ต่ำกว่าศูนย์มันจะกลายเป็นศูนย์

02:46.560 --> 02:49.160
จากนี้ไปมันจะกลายเป็นสิทธินี้

02:49.290 --> 02:58.910
และมันก็ค่อนข้างยากที่จะเห็นว่าอะไรคือประโยชน์ในแง่ของการแบ่งเชิงเส้น

02:59.400 --> 03:01.050
ฉันจะพยายามอธิบาย

03:01.080 --> 03:07.740
ฉันจะพยายามแสดงตัวอย่างในภาพนี้ แต่ในตอนท้ายของวันมันเป็นแนวคิดทางคณิตศาสตร์ที่ดีมากและจะต้องมีคณิตศาสตร์มากมายเพื่ออธิบายสิ่งที่เกิดขึ้นจริง

03:07.740 --> 03:12.480
ๆ

03:12.480 --> 03:13.800
แต่ลองมาดูกันดีกว่า

03:13.800 --> 03:16.800
ตัวอย่างเช่นลองดูที่นี่

03:16.860 --> 03:17.580
อาคารหลังนี้

03:17.580 --> 03:18.070
ขวา.

03:18.090 --> 03:20.150
ดังนั้นนี่คืออาคารของตัวเอง

03:20.730 --> 03:22.400
จากนั้นคุณสามารถเห็นเงานี้

03:22.440 --> 03:33.160
ส่วนสีดำนี่เงานี่ตรงนี้คุณจะเห็นว่ามันเป็นสีขาวการสะท้อนของแสงและจากนั้นก็จะเป็นสีเทาและจากนั้นก็จะเข้มขึ้น

03:33.240 --> 03:35.860
ดังนั้นเมื่อเรานำมันออกไปเราจะลบจุดดำนั้น

03:35.860 --> 03:38.220
ลองคิดถึงมันในแง่ของความเป็นเส้นตรง

03:38.250 --> 03:43.700
ดังนั้นเมื่อคุณเปลี่ยนจากสีขาวเป็นสีเทาขั้นตอนต่อไปจะเป็นสีดำ

03:43.740 --> 03:53.490
ขวาขึ้นถัดไปจะเป็นสีดำมันเป็นความก้าวหน้าเชิงเส้นจากสว่างเป็นมืดและดังนั้นนี่เป็นสถานการณ์เชิงเส้น

03:53.490 --> 03:56.560
เมื่อคุณดึงสีดำออกมาคุณจะแยกเส้นตรงออกมา

03:56.670 --> 03:57.800
ลองอีกอันหนึ่ง

03:58.050 --> 03:59.110
ลองดูที่นี่

03:59.220 --> 04:01.980
และในขณะเดียวกันก็ยังคงเป็นอาคารเดียวกันที่ถูกต้อง

04:01.980 --> 04:09.810
ไม่ใช่ว่าคุณหรือคนที่ชอบไม่ใช่ว่าคุณผสมผสานอาคารสองหลังเข้าด้วยกัน แต่นั่นก็เป็นเรื่องรอง

04:09.810 --> 04:11.940
จุดหลักคือการทำลายเส้นตรง

04:12.210 --> 04:13.590
ลองดูที่นี่แบบเดียวกัน

04:13.590 --> 04:19.480
ดังนั้นคุณจะเห็นสีขาวสีเทาสีดำสีเทาสีขาว

04:19.590 --> 04:22.520
และเมื่อคุณเลิกกันคุณก็ไม่มีสิทธิ์อีกต่อไปแล้ว

04:22.530 --> 04:29.600
คุณไม่ได้มีความก้าวหน้าที่ค่อยเป็นค่อยไปที่คุณเพิ่งมีการเปลี่ยนแปลงอย่างฉับพลัน

04:29.730 --> 04:33.540
และนั่นจะช่วยเพิ่มความไม่เป็นเชิงเส้นให้กับภาพของคุณ

04:33.540 --> 04:47.370
ดังนั้นมันจึงเป็นคำอธิบายคร่าวๆของคำว่านิ้วหรือคำอธิบายแบบนิ้วมือมากกว่าเทคนิค แต่หวังว่ามันจะช่วยให้คุณเข้าใจได้ดีขึ้นว่าเรากำลังพูดถึงอะไรอยู่ที่นี่

04:47.370 --> 04:55.680
ดังนั้นที่นี่อีกครั้งคุณสามารถเห็นสีเทาสีขาวเป็นตัวอย่างที่ดียิ่งขึ้นถึงเข้มเข้มเข้มเข้มเข้มและเข้มเข้ม

04:55.680 --> 05:04.460
ดังนั้นส่วนนี้ดูเหมือนจะบางกว่าที่คุณแยกมันออกมาอีกครั้งดังนั้นนี่คือคำอธิบายคร่าวๆ

05:04.480 --> 05:08.570
มันไม่ได้สมบูรณ์แบบอย่างแน่นอน แต่อย่างน้อยมันก็ทำให้คุณเข้าใจว่าเกิดอะไรขึ้น

05:08.800 --> 05:14.120
แต่ถ้าคุณต้องการเรียนรู้เพิ่มเติมมีกระดาษที่ดีเช่นเคยมีกระดาษเสมอ

05:14.200 --> 05:20.370
อันนี้คือ CCJ corps จาก University of

05:20.380 --> 05:22.980
California และมันเรียกว่าการทำความเข้าใจกับโครงข่ายประสาทเทียมที่มีโมเดลทางคณิตศาสตร์

05:23.200 --> 05:28.840
และโดยพื้นฐานแล้วพวกเขากำลังตอบคำถามและคุณต้องดูคำถามแรกก่อน

05:28.840 --> 05:36.130
และคำถามก็คือว่าทำไมฟังก์ชั่นการเปิดใช้งานแบบไม่เชิงเส้นจึงไม่จำเป็นสำหรับเอาต์พุตตัวกรองของเลเยอร์กลางทั้งหมด

05:36.220 --> 05:44.280
ดังนั้นชนิดของมันอธิบายในรายละเอียดอีกเล็กน้อยทั้งในแง่ของสัญชาตญาณและส่วนใหญ่ในแง่ของคณิตศาสตร์

05:44.320 --> 05:47.970
นั่นเป็นรายงานที่น่าสนใจที่คุณสามารถรับข้อมูลเพิ่มเติมเพิ่มเติมในหัวข้อนี้

05:48.100 --> 05:53.360
และถ้าคุณอยากขุดและสำรวจสิ่งดีๆบางอย่างที่นี่

05:53.360 --> 05:55.690
ถ้าอย่างนั้นมีอีกกระดาษหนึ่งที่คุณอาจสนใจ

05:55.690 --> 06:02.830
มันเรียกว่าการเจาะลึกลงไปในวงจรเรียงกระแสที่เหนือกว่าประสิทธิภาพของระดับมนุษย์บนภาพและการจัดหมวดหมู่นั้น

06:02.920 --> 06:09.190
และที่นี่ผู้เขียนกำลังหวีผมและคนอื่น ๆ จาก Microsoft Research

06:09.400 --> 06:17.630
พวกเขาเสนอฟังก์ชั่นยูนิตเอนกายที่แก้ไขแล้วชนิดอื่น

06:17.650 --> 06:21.830
พวกเขาเสนอฟังก์ชั่นการแก้ไขพารามิเตอร์ซึ่งคุณเห็นที่นี่ทางด้านขวา

06:22.030 --> 06:26.740
และพวกเขาอ้างว่ามันให้ผลลัพธ์ที่ดีกว่าโดยไม่ต้องเสียสละประสิทธิภาพ

06:26.740 --> 06:30.200
อ่านแล้วน่าสนใจถ้าคุณอยากได้อะไรเพิ่มเติมในหัวข้อนี้

06:30.490 --> 06:32.020
และนั่นคือทั้งหมดในวันนี้

06:32.280 --> 06:39.230
เลเยอร์ของคุณจริงๆแล้วค่อนข้างง่ายดังนั้นสำหรับการปรับเพียงแค่ใช้ฟังก์ชันตัวเรียงกระแสและฉันหวังว่าจะได้พบคุณในครั้งต่อไป

06:39.250 --> 06:40.770
จนแล้วสนุกกับการเรียน
