WEBVTT

00:00.270 --> 00:02.640
สวัสดีและยินดีต้อนรับกลับสู่หลักสูตรการเรียนรู้ลึก

00:02.730 --> 00:05.140
เอาล่ะวันนี้เรากำลังพูดถึงฟังก์ชั่นการเปิดใช้งาน

00:05.190 --> 00:07.010
ลองตรงเข้าไปดู

00:07.020 --> 00:11.910
ดังนั้นนี่คือที่เราทิ้งไว้ก่อนหน้านี้เราได้พูดคุยเกี่ยวกับโครงสร้างของเซลล์ประสาทหนึ่ง

00:12.030 --> 00:24.690
ดังนั้นมันอยู่ตรงกลางเรารู้ว่ามันมีค่าอินพุตบางอย่างที่เข้ามามันมีน้ำหนักบางส่วนจากนั้นจะเพิ่มวิธีการคำนวณวิธีที่อินพุตเหล่านั้นบางส่วนจากนั้นใช้ฟังก์ชันเปิดใช้งานในขั้นตอนที่ 3

00:24.750 --> 00:32.850
มันส่งสัญญาณไปยังปีหน้าและนั่นคือสิ่งที่เรากำลังพูดถึงในวันนี้เรากำลังพูดถึงคุณค่าที่กำลังจะถูกส่งผ่าน

00:32.850 --> 00:35.970
ดังนั้นเรากำลังพูดถึงฟังก์ชั่นการเปิดใช้งานที่ถูกนำมาใช้

00:36.390 --> 00:39.270
เรามีตัวเลือกอะไรสำหรับฟังก์ชั่นเปิดใช้งาน

00:39.270 --> 00:43.400
ทีนี้เราจะดูฟังก์ชั่นการเปิดใช้งานสี่แบบที่คุณสามารถเลือกได้

00:43.410 --> 00:50.390
แน่นอนว่ามีฟังก์ชั่นการเปิดใช้งานหลากหลายประเภท แต่สิ่งเหล่านี้เป็นฟังก์ชั่นเด่นที่คุณจะได้ยินและเราจะใช้ในหลักสูตรนี้

00:50.400 --> 00:53.060
นี่คือฟังก์ชันขีด จำกัด

00:53.070 --> 00:54.300
นี่คือสิ่งที่ดูเหมือน

00:54.300 --> 00:59.600
ดังนั้นบนแกน x คุณได้ให้น้ำหนักบางส่วนของอินพุตบนแกน y

00:59.610 --> 01:07.320
คุณเพิ่งรู้ค่าจาก 0 ถึง 1

01:07.330 --> 01:14.700
และโดยทั่วไปแล้วฟังก์ชันขีด จำกัด นั้นง่ายมากพิมพ์ฟังก์ชันที่ถ้าค่าน้อยกว่าศูนย์แล้วฟรี

01:14.730 --> 01:16.680
ขอบคุณ ssion ส่งผ่านศูนย์

01:16.890 --> 01:22.940
หากค่ามากกว่าศูนย์หรือเท่ากับศูนย์ดังนั้นฟังก์ชันขีด จำกัด จะกระทบกับ 1

01:22.940 --> 01:26.910
ดังนั้นโดยพื้นฐานแล้วมันก็เหมือนกับว่าใช่ไม่มีฟังก์ชั่น

01:26.940 --> 01:29.130
ตรงไปตรงมามากมาก

01:29.130 --> 01:33.500
ฟังก์ชั่นแบบแข็งมาก ๆ ทั้งใช่หรือไม่ใช่

01:33.540 --> 01:35.000
ไม่มีตัวเลือกอื่น

01:35.040 --> 01:35.510
ดังนั้นคุณไป

01:35.510 --> 01:36.210
มันเป็นวิธีการทำงาน

01:36.210 --> 01:37.440
ฟังก์ชั่นที่ง่ายมาก

01:37.440 --> 01:40.020
มาทำเรื่องที่ซับซ้อนกว่านี้กันหน่อย

01:40.020 --> 01:49.940
ตอนนี้ฟังก์ชัน sigmoid น่าสนใจมากสูตรที่เรามีตรงนี้คุณจะเห็นว่าตอนนี้มีหนึ่งหารด้วยหนึ่งบวกละ

01:49.950 --> 01:58.450
พลังของลบ X ในขณะที่ในกรณีนี้ของหลักสูตร X คือค่าของผลบวกของวิธี

01:58.590 --> 02:00.540
และใช่

02:00.570 --> 02:02.600
นี่คือสิ่งที่ sigmoid ดูเหมือน

02:02.610 --> 02:06.510
มันเป็นฟังก์ชั่นที่ใช้ในการถดถอยโลจิสติก

02:06.510 --> 02:09.470
หากคุณจำได้จากหลักสูตรการเรียนรู้ของเครื่อง

02:09.540 --> 02:12.000
ดังนั้นสิ่งที่ดีเกี่ยวกับฟังก์ชั่นนี้คือมันราบรื่น

02:12.060 --> 02:14.880
ไม่เหมือนฟังก์ชั่นเสมือนจริง

02:14.970 --> 02:21.720
อันนี้ไม่มีเส้นโค้งที่โค้งงอดังนั้นมันจึงเป็นความก้าวหน้าที่ดีและราบรื่น

02:21.720 --> 02:26.340
ดังนั้นอะไรก็ตามที่ต่ำกว่า 0 ก็เหมือนกับหยดลงมาเหนือศูนย์

02:26.340 --> 02:35.590
มันทำหน้าที่ใกล้เคียงกับหนึ่งและฟังก์ชั่น sigmoid นี้มีประโยชน์มากใน Lehren สุดท้ายชั้นเลเยอร์

02:35.610 --> 02:38.900
โดยเฉพาะเมื่อคุณพยายามทำนายความน่าจะเป็น

02:38.910 --> 02:40.820
และเราจะเห็นสิ่งนั้นตลอดหลักสูตร

02:41.190 --> 02:47.370
จากนั้นเราก็มีฟังก์ชั่น rectifier

02:47.370 --> 02:55.090
ฟังก์ชั่นแม้ว่ามันจะมี kink เป็นหนึ่งในฟังก์ชั่นที่ได้รับความนิยมมากที่สุดสำหรับเครือข่ายประสาทเทียม

02:55.110 --> 03:02.460
จากนั้นมันก็ค่อยๆดำเนินไปเรื่อย ๆ เมื่อค่าอินพุทเพิ่มขึ้นเช่นกันและเราจะเห็นว่าตลอดหลักสูตรเราจะเห็นว่าในบทเรียนปรีชาอื่น

03:02.460 --> 03:07.140
ๆ

03:07.140 --> 03:13.590
และเรายังเห็นด้วยว่า ฉันจะแสดงความคิดเห็นเกี่ยวกับเรื่องนี้อีกเล็กน้อยในไม่กี่สไลด์จากนี้

03:13.590 --> 03:18.970
ดังนั้นโปรดจำไว้ว่าฟังก์ชั่นไฟโดยตรงเป็นหนึ่งในฟังก์ชั่นที่ใช้มากที่สุดในเครือข่ายประสาทเทียม

03:19.020 --> 03:22.770
และในที่สุดเราก็มีฟังก์ชั่นอีกหนึ่งฟังก์ชั่นที่คุณอาจได้ยิน

03:22.830 --> 03:25.220
มันคือฟังก์ชันไฮเพอร์โบลิกแทนเจนต์

03:25.260 --> 03:32.760
มันคล้ายกับฟังก์ชั่น sigmoid แต่ที่นี่ฟังก์ชั่นไฮเพอร์โบลิกแทนเจนต์มีค่าต่ำกว่าศูนย์ดังนั้นค่าจาก 0 ถึง 1 หรือประมาณ

03:32.760 --> 03:39.510
2 1 และไปจากศูนย์ถึงลบ 1 ในอีกด้าน

03:39.750 --> 03:42.360
และนั่นอาจเป็นประโยชน์ในบางแอปพลิเคชัน

03:42.390 --> 03:51.680
ดังนั้นเราจะไม่ไปลงลึกในแต่ละฟังก์ชั่นเหล่านี้มากเกินไปฉันแค่อยากจะรู้จักคุณกับพวกมันเพื่อที่คุณจะได้รู้ว่ามันมีหน้าตาอย่างไร

03:51.780 --> 03:59.690
หากคุณต้องการอ่านเพิ่มเติมจากนั้นลองดูบทความนี้ด้วยการจับสลาก 75 ปี

03:59.820 --> 04:05.630
คุณมีจำนวนมากที่เรียกว่า Deep sparse rectifies network 2000 paper

04:05.790 --> 04:16.300
แล้วคุณจะพบว่าทำไมฟังก์ชั่น rectifier จึงเป็นฟังก์ชันที่มีคุณค่าว่าทำไมมันจึงใช้กันอย่างแพร่หลาย

04:16.350 --> 04:20.640
แต่กระนั้นสำหรับตอนนี้เราไม่จำเป็นต้องรู้ทุกสิ่งจริงๆ

04:20.650 --> 04:24.240
สำหรับตอนนี้เรากำลังจะเริ่มใช้สิ่งเหล่านี้ซึ่งคุณจะเริ่มใช้มันมากขึ้นเรื่อย ๆ

04:24.270 --> 04:31.290
ดังนั้นเมื่อคุณรู้สึกสะดวกสบายกับการใช้งานจริงของสิ่งต่าง ๆ

04:31.290 --> 04:37.140
คุณสามารถไปอ่านบทความนี้แล้วคุณจะสามารถซึมซับความรู้นั้นได้เร็วขึ้นมาก

04:37.370 --> 04:45.060
แต่โปรดจำไว้ว่าเมื่อคุณพร้อมเมื่อคุณรู้สึกว่าพร้อมแล้วคุณสามารถไปค้นคว้ารายงานและรับความรู้ที่มีค่าจากพวกเขา

04:45.540 --> 04:55.360
ดังนั้นเพื่อสรุปอย่างรวดเร็วเรามีฟังก์ชั่นการเปิดใช้งานเกณฑ์ซึ่งจะเป็นเช่นนี้ฟังก์ชั่นการเปิดใช้งาน sigmoid ซึ่งมีลักษณะเช่นนี้

04:55.680 --> 05:01.770
เรามีฟังก์ชัน rectifier

05:01.770 --> 05:09.150
และเรามีฟังก์ชั่นแทนเจนต์ไฮเพอร์โบลิกและตอนนี้ให้ทำแบบฝึกหัดนี้เสร็จเร็ว ๆ นี้ลองทำแบบฝึกหัดสองสามข้อเพื่อให้การออกกำลังกายสองอย่างรวดเร็ว

05:09.150 --> 05:16.030
อย่างแรกคือเรามีตัวอย่างนี่ของโครงข่ายประสาทของเซลล์ประสาทเพียงเส้นเดียวและนั่นก็คือชั้นเลเยอร์เอาท์พุท

05:16.140 --> 05:23.780
และคำถามก็คือสมมติว่าตัวแปรตามของคุณคือไบนารีดังนั้นมันอาจเป็น 0 หรือ 1 ซึ่งคุณจะใช้ฟังก์ชันขีด จำกัด

05:23.790 --> 05:31.980
จากสิ่งที่เราได้พูดถึงเรามีฟังก์ชันขีด จำกัด

05:31.980 --> 05:43.450
ฟังก์ชัน sigmoid ของฟังก์ชันเรียงกระแสและเรามีฟังก์ชันไฮเพอร์โบลิกแทนเจนต์ในรูปแบบม้วนซึ่งคุณสามารถใช้สำหรับตัวแปรไบนารีได้

05:43.950 --> 05:44.410
ตกลง.

05:44.490 --> 05:49.360
ดังนั้นคำตอบที่นี่มีสองตัวเลือกที่เราสามารถเข้าถึง

05:49.380 --> 05:55.790
ดังนั้นหนึ่งคือฟังก์ชั่นการเปิดใช้งานเกณฑ์เนื่องจากเรารู้ว่ามันอยู่ระหว่าง 0 ถึง 1 และมันให้

05:55.800 --> 06:00.090
0 ร่มแอนเดอร์สันของเรา

06:00.090 --> 06:10.020
มันลงตัวพอดีกับความต้องการนี้อย่างสมบูรณ์และคุณสามารถบอกว่า y เท่ากับฟังก์ชันขีด จำกัด

06:10.020 --> 06:13.770
ของการแกว่งของคุณกับบางสิ่ง

06:14.010 --> 06:18.450
และในกรณีที่สองซึ่งคุณสามารถใช้เป็นฟังก์ชั่นการเปิดใช้งาน sigmoid

06:18.450 --> 06:21.710
เป็นจริงระหว่าง 0 และ 1 เพียงแค่สิ่งที่เราต้องการ

06:21.750 --> 06:29.940
แต่ในเวลาเดียวกันคุณต้องการเพียงหนึ่งเดียวคุณจึงไม่ใช่สิ่งที่เราต้องการ แต่ในกรณีนี้ซึ่งคุณสามารถใช้มันได้เนื่องจากความน่าจะเป็นของ Y

06:29.940 --> 06:37.530
คือใช่หรือไม่ใช่

06:37.530 --> 06:46.170
เราอยากให้ Y เป็น 0 1 แต่เราจะบอกว่าฟังก์ชัน sigmoid ฟังก์ชันการเปิดใช้งาน

06:46.170 --> 06:51.860
Simoun บอกเราว่ามันจะบอกเราว่าความน่าจะเป็นของ Y เท่ากับ 1

06:51.870 --> 07:00.300
ดังนั้นโดยทั่วไปยิ่งคุณอยู่ใกล้จุดสูงสุดเท่าไหร่โอกาสที่จะได้มากขึ้นก็คือว่านี่คือหนึ่งหรือใช่มากกว่าไม่ใช่

07:00.750 --> 07:04.700
และนั่นก็คล้ายกับวิธีการถดถอยโลจิสติก

07:04.920 --> 07:07.570
และนี่เป็นเพียงสองตัวอย่าง

07:07.650 --> 07:09.610
หากคุณมีตัวแปรไบนารี

07:10.120 --> 07:12.810
ตอนนี้เรามาดูการประยุกต์ใช้จริงอื่น

07:12.810 --> 07:17.190
เรามาดูกันว่าสิ่งเหล่านี้จะเกิดขึ้นได้อย่างไรถ้าเรามีความเป็นธรรมชาติแบบนี้

07:17.430 --> 07:20.960
ดังนั้นในชั้นแรกเรามีอินพุตบางส่วน

07:20.980 --> 07:26.060
พวกมันจะถูกส่งไปยังเลเยอร์ที่ซ่อนอยู่แรกของเราจากนั้นจะเปิดใช้งานฟังก์ชั่น

07:26.070 --> 07:31.380
และโดยปกติสิ่งที่คุณจะใช้ที่นี่และสิ่งที่คุณจะเห็นตลอดทั้ง Scorsese

07:31.410 --> 07:34.510
จะใช้ฟังก์ชั่นการเปิดใช้งานวงจรเรียงกระแสดังนั้นมันจะมีลักษณะเช่นนั้น

07:34.530 --> 07:40.980
เราใช้ฟังก์ชั่นการเปิดใช้งาน rectifier จากนั้นสัญญาณจะถูกส่งต่อไปยังเลเยอร์เอาท์พุทที่จะใช้ฟังก์ชั่นการเปิดใช้งาน

07:40.980 --> 07:46.820
sigmoid และนั่นจะเป็นผลลัพธ์สุดท้ายของเรา

07:46.830 --> 07:58.640
และนั่นสามารถทำนายความน่าจะเป็นเช่นชุดค่าผสมนี้จะเป็นเรื่องธรรมดามากที่ในเลเยอร์ที่ซ่อนอยู่เราใช้ฟังก์ชันตัวเรียงกระแสแล้วส่งออกตรงนั้นเราใช้ฟังก์ชัน sigmoid

07:58.890 --> 07:59.850
ดังนั้นเราไปกันเลย

07:59.850 --> 08:16.310
หวังว่าคุณจะสนุกกับการสอนนี้ตอนนี้คุณค่อนข้างรอบรู้ในฟังก์ชั่นการเปิดใช้งานสี่ประเภทที่แตกต่างกันและคุณจะได้สัมผัสกับประสบการณ์เชิงปฏิบัติกับพวกเขาในหลักสูตรนี้ และคุณควรจะค่อนข้างสบายใจกับพวกเขา

08:16.530 --> 08:23.600
แต่สำหรับตอนนี้นี่คือความรู้ที่คุณต้องการเพื่อความก้าวหน้าและเข้าใจสิ่งที่เขากำลังจะเกิดขึ้นต่อไปในหลักสูตรนี้

08:23.940 --> 08:26.940
และในบันทึกนั้นฉันหวังว่าจะได้พบคุณในครั้งต่อไป

08:26.940 --> 08:28.560
จนแล้วสนุกกับการเรียน
