WEBVTT

00:01.130 --> 00:06.810
สวัสดีและยินดีต้อนรับกลับมาแน่นอนเกี่ยวกับการเรียนรู้ที่ลึกล้ำในวันนี้เราพูดถึงการไล่ระดับสี Kostic

00:07.220 --> 00:19.590
ก่อนหน้านี้เราเรียนรู้เกี่ยวกับการไล่ระดับสีไล่ระดับและเราพบว่ามันเป็นวิธีที่มีประสิทธิภาพมากในการแก้ปัญหาการเพิ่มประสิทธิภาพซึ่งเรากำลังพยายามลดฟังก์ชันต้นทุน

00:19.640 --> 00:30.940
โดยพื้นฐานแล้วเราใช้เวลาตั้งแต่ 10 ถึงพลัง 57 ปีในการแก้ปัญหาภายในไม่กี่นาทีหรือชั่วโมงหรือภายในหนึ่งวัน

00:31.100 --> 00:41.400
และมันช่วยเร่งความเร็วให้มากขึ้นเพราะเราเห็นได้ว่าทางไหนตกต่ำและเราสามารถไปในทิศทางนั้นและทำตามขั้นตอนและก้าวให้เร็วที่สุด

00:41.600 --> 00:50.990
แต่สิ่งที่ติดกับการไล่ระดับสีคือวิธีนี้ต้องการฟังก์ชั่นค่าใช้จ่ายที่จะนูน

00:51.140 --> 00:57.710
และอย่างที่คุณเห็นที่นี่เราได้เลือกฟังก์ชั่นต้นทุนนูนโดยทั่วไปแล้วนูนหมายถึงฟังก์ชั่นนี้ดูเหมือนกับสิ่งที่เราเห็นในตอนนี้ว่ามันเป็น

00:58.160 --> 01:09.220
vext ในทิศทางเดียวและในสาระสำคัญมีขั้นต่ำทั่วโลก

01:09.380 --> 01:11.560
และนั่นคือสิ่งที่เราจะพบ

01:11.630 --> 01:14.060
แต่ถ้าฟังก์ชั่นของเราไม่นูนออกมา

01:14.060 --> 01:16.250
เกิดอะไรขึ้นถ้าฟังก์ชั่นค่าใช้จ่ายของเราไม่ถูกต้อง

01:16.370 --> 01:17.810
ถ้าหากมันดูเหมือนอะไรแบบนี้

01:18.020 --> 01:19.660
ก่อนอื่นอาจเกิดขึ้นได้อย่างไร

01:19.880 --> 01:33.850
นั่นอาจเกิดขึ้นเพราะถ้าก่อนอื่นเราเลือกฟังก์ชั่นค่าใช้จ่ายซึ่งไม่ได้เป็นความแตกต่างระหว่างเหตุผลว่าทำไมและอย่างไรหรือถ้าเราเลือกฟังก์ชั่นค่าใช้จ่ายซึ่งเป็นเช่นนั้น

01:33.860 --> 01:39.650
แต่จากนั้นในพื้นที่หลายมิติจริงๆแล้วมันสามารถเปลี่ยนเป็นสิ่งที่ไม่ได้นูน

01:39.780 --> 01:46.390
แล้วจะเกิดอะไรขึ้นในกรณีนี้ถ้าเราแค่พยายามใช้วิธีการไล่ระดับสีปกติของเราอย่างนี้จะเกิดขึ้น

01:46.520 --> 01:51.230
เราสามารถหาฟังก์ชั่นต้นทุนขั้นต่ำในท้องถิ่นมากกว่าที่จะเป็นระดับโลก

01:51.230 --> 01:57.730
อันนี้เป็นอันที่ดีที่สุดและเราพบสิ่งที่ผิดดังนั้นเราจึงไม่มีน้ำหนักที่ถูกต้อง

01:57.740 --> 01:59.940
เราไม่มีเครือข่ายประสาทเทียมที่ได้รับการปรับปรุง

02:00.230 --> 02:02.480
เรามีเครือข่ายประสาทย่อย

02:02.610 --> 02:04.470
แล้วเราจะทำอย่างไรในกรณีนี้

02:04.670 --> 02:09.110
คำตอบที่นี่คือสุ่ม

02:09.110 --> 02:10.050
โคตรลาด

02:10.070 --> 02:15.260
และปรากฎว่าการไล่ระดับสีแบบประชดประชันไม่จำเป็นต้องใช้ฟังก์ชันสาเหตุ

02:15.380 --> 02:21.600
ลองดูที่ความแตกต่างสองอย่างระหว่างการไล่ระดับสีปกติที่เราพูดถึงและช่วงสุ่ม

02:21.860 --> 02:36.050
ดังนั้นสายเลือดสีเขียวปกติคือเมื่อเรานำแถวทั้งหมดของเราเราเสียบเข้าไปในเครือข่ายประสาทของเราและอีกครั้งที่นี่เราได้คัดลอกโครงข่ายประสาทเทียมหลายครั้ง แต่แถวนั้นถูกเสียบเข้ากับเครือข่ายประสาทเดียวกันทุกครั้ง

02:36.050 --> 02:39.200
ดังนั้นจึงมีเล่ห์เหลี่ยมเพียงหนึ่งปีเท่านั้นนี่เป็นเพียงเพื่อวัตถุประสงค์ในการดำเนินการของ Kissel

02:39.350 --> 02:54.480
จากนั้นเมื่อเราเสียบเข้าไปเราได้คำนวณฟังก์ชั่นต้นทุนของเราตามสูตรที่เหมาะสมและดูแผนภูมิที่ด้านล่างและจากนั้นเราปรับน้ำหนักแล้วนี่เรียกว่าวิธีการไล่ระดับสีหรือมันเป็นคำที่เหมาะสม วิธีการไล่ระดับแบทช์นั้น

02:54.470 --> 03:03.730
ดังนั้นเราจึงนำชุดทั้งหมดมาจากตัวอย่างที่เรานำมาใช้จากนั้นเราก็เรียกใช้วิธีการไล่ระดับสีแบบลาดสุ่ม

03:03.800 --> 03:12.020
ที่นี่เรารับแถวทีละหนึ่งเพื่อให้เราใช้แถวนี้เราเรียกใช้เครือข่ายประสาทของเราแล้วเราจะปรับน้ำหนัก

03:12.020 --> 03:16.420
จากนั้นเราก็ย้ายไปยังแถวที่สองที่เราใช้แถวที่สองที่เราเรียกใช้เครือข่ายประสาทของเรา

03:16.580 --> 03:21.640
เราดูที่ฟังก์ชั่นต้นทุนแล้วเราปรับน้ำหนักอีกครั้งจากนั้นเราก็เอา Rohtak

03:21.640 --> 03:25.430
เพิ่มขึ้นอีกสามตัวที่เราเรียกใช้เครือข่ายประสาทของเราจะดูที่ฟังก์ชันต้นทุนที่เราปรับน้ำหนัก

03:25.430 --> 03:36.080
โดยพื้นฐานแล้วเรากำลังดูว่าเราปรับน้ำหนักหลังจากทุกแถวแทนที่จะทำทุกอย่างด้วยกันแล้วทดสอบน้ำหนักสองวิธีที่แตกต่างกัน

03:36.230 --> 03:39.710
ทีนี้เราจะเปรียบเทียบทั้งสองข้างกัน

03:39.710 --> 03:42.920
ดังนั้นที่นี่พวกเขานี่คือวิธีการจำพวกเขาเห็น

03:42.920 --> 04:10.040
ดังนั้นคุณมีโคตรลาดที่ดีที่สุดที่คุณปรับน้ำหนักหลังจากที่คุณเรียกใช้พวกเขาหลังจากที่คุณเรียกใช้ทุกแถวในเครือข่ายประสาทของคุณแล้วโดยทั่วไปเพียงแค่น้ำหนักและคุณทำสิ่งทั้งหมดซ้ำอีกครั้ง ในชั้นประถมศึกษาปีที่หกในเดือนธันวาคมและคุณทำงานครั้งละหนึ่งแถวและคุณปรับน้ำหนักแบบที่เป็นเพียงน้ำหนักแล้วคุณทำทุกอย่างอีกครั้งและอีกครั้งและที่เรียกว่าการอภิปราย

04:10.080 --> 04:28.620
และคุณบอกว่าข้อแตกต่างที่สำคัญสองประการคือวิธีการลดระดับเสียงประชดประชันแบบเหน็บแนมช่วยให้คุณหลีกเลี่ยงปัญหาที่คุณพบว่าแขนขาในท้องถิ่นนั้นหรือจุดต่ำสุดในท้องถิ่นเหล่านั้น

04:29.030 --> 04:34.850
และเหตุผลในเรื่องง่าย ๆ

04:35.150 --> 04:38.220
ก็คือมีวิดีโอของวิธีการไล่ระดับสีแบบสุ่มแบบสโตแคสติกมีความผันผวนสูงมาก

04:38.210 --> 04:49.440
มันทำซ้ำครั้งละหนึ่งแถวหรือครั้งละหนึ่งครั้งดังนั้นความผันผวนจึงสูงกว่ามากและมีแนวโน้มที่จะพบค่าต่ำสุดของโลกมากกว่าแค่ค่าต่ำสุดในท้องถิ่น

04:49.460 --> 05:01.670
และสิ่งอื่น ๆ เกี่ยวกับการไล่ระดับสีแบบเหน็บแนมที่ฉันคิดว่าเป็นความลาดชันที่ไม่ดีคือมันเป็นอุปถัมภ์เช่นความประทับใจแรกที่คุณอาจมีเพราะมันเติบโตขึ้นทีละครั้งมันช้าลง

05:01.730 --> 05:12.610
ไม่ต้องโหลดข้อมูลทั้งหมดลงในหน่วยความจำและเรียกใช้และรอจนกว่ากฎเหล่านั้นจะทำงานโดยสิ้นเชิง

05:12.710 --> 05:16.780
คุณสามารถหมุนไปรอบ

05:16.790 --> 05:24.020
ๆ ทีละตัวดังนั้นมันจึงเป็นอัลกอริธึมที่เบากว่ามากเร็วกว่าในแง่นั้นดังนั้นแม้ว่ามันจะมีความหมายมากกว่าในแง่นั้นเพราะมันมีข้อดีมากกว่าความเลว

05:24.110 --> 05:25.320
วิธีการไล่ระดับสี

05:25.430 --> 05:37.250
ข้อได้เปรียบหลักของหรือโดเมนเช่นเดียวกับ profer วิธีการไล่ระดับสีที่ไม่ดีคือมันเป็นอัลกอริธึมที่กำหนดขึ้นหรือนอกเหนือจากการใช้การไล่ระดับสีแบบลาดชันเป็นอัลกอริทึมประชดประชัน

05:37.250 --> 05:45.430
น้ำหนักเริ่มต้นเท่ากันสำหรับเครือข่ายประสาทเทียมของคุณ

05:45.500 --> 05:52.300
ทุกครั้งที่คุณเรียกใช้วิธีการไล่ระดับสีแบบแบทช์คุณจะได้รับผลการคำนวณแบบเดียวกันซ้ำ ๆ

05:52.300 --> 05:58.300
กันสำหรับคุณทุกครั้งที่น้ำหนักของคุณได้รับการอัปเดตเพื่อให้เรามีวิธีการไล่ระดับสีที่ดี

05:58.310 --> 06:20.770
คุณจะไม่ได้รับเพราะมันเป็นวิธีสุ่มคุณเลือกบทบาทของคุณอาจสุ่มและคุณกำลังปรับปรุงเครือข่ายประสาทของคุณในลักษณะประชดประชันและดังนั้นคุณจะไปทุกครั้งที่คุณเรียกใช้หมวดหมู่เป็นวิธีที่ดี แม้ว่าคุณจะมีน้ำหนักเท่ากันตั้งแต่เริ่มต้นคุณก็จะมีกระบวนการที่แตกต่างกันและมีการทำซ้ำหลายครั้งเพื่อไปที่นั่น

06:20.780 --> 06:37.640
ดังนั้นโดยสังเขปสิ่งที่ต้องละทิ้งและคัดค้านก็คือมีวิธีการระหว่างสองวิธีที่เรียกว่าวิธีการไล่ระดับสีแบบแบทช์ขนาดเล็กที่คุณรวมทั้งสองเข้าด้วยกัน

06:37.640 --> 06:44.150
คุณเรียกใช้ชุดของแถวอาจ 5 10 100

06:44.150 --> 06:47.690
แต่หลายแถวคุณตัดสินใจที่จะตั้งค่าให้คุณเรียกใช้จำนวนแถวที่ในเวลานั้นจากนั้นคุณปรับปรุงวิธีหลักเดียวของคุณและอื่น ๆ

06:47.900 --> 06:52.670
และเรียกว่าวิธีการไล่ระดับสี Mini Bache

06:52.670 --> 06:56.630
หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการไล่ระดับสีแบบไล่ระดับมีบทความที่ดีที่คุณสามารถดูได้

06:56.660 --> 07:04.940
มันเรียกว่าโครงข่ายประสาทเทียมในส่วนของ Python 13 บรรทัดที่ยอดเยี่ยมและสืบทอดโดย Andrew Trask

07:04.940 --> 07:12.840
และลิงก์ด้านล่างเป็นบทความที่ดี 12 15 ข้อที่เขียนได้ง่ายมาก

07:12.920 --> 07:21.860
มันมีปรัชญาที่น่าสนใจหรือมีความคิดที่น่าสนใจเกี่ยวกับวิธีการใช้น้ำสีเขียวที่เหมาะสมคุณรู้ถึงข้อดีและข้อเสียและวิธีการทำสิ่งต่าง ๆ

07:22.340 --> 07:30.730
ในบางสถานการณ์เพื่อให้คุณมีเคล็ดลับและเทคนิคที่ยอดเยี่ยม

07:31.370 --> 07:33.620
อ่านง่ายมากอย่างแน่นอนตรวจสอบว่า

07:33.800 --> 07:37.010
และอีกหนึ่งอ่านหนักขึ้นอีกหน่อย

07:37.010 --> 07:41.930
สำหรับบรรดาของคุณที่เป็นคณิตศาสตร์ที่ต้องการไปที่ด้านล่างของคณิตศาสตร์ทำไม

07:41.930 --> 07:45.180
การไล่ระดับสีเป็นสิ่งที่เฉพาะเจาะจง

07:45.260 --> 07:49.200
มีสูตรอะไรบ้างที่กำลังขับไล่ระดับชั้นและมีวิธีคำนวณอย่างไรบ้างเป็นต้น

07:49.220 --> 07:51.610
ตรวจสอบบทความหรือหนังสือจริง

07:51.620 --> 07:57.160
มันเป็นหนังสือออนไลน์ฟรีที่เรียกว่าเครือข่ายประสาทและการเรียนรู้ลึกโดยหนังสือ Michael Nielsen 2015

07:57.160 --> 08:02.190
มันเป็นเพียงแค่ทุกอย่างในบรรทัดคุณสามารถไปข้างหน้าและตรวจสอบออก

08:02.450 --> 08:05.870
และมีการนำคณิตศาสตร์มาใช้ใหม่

08:05.870 --> 08:13.340
แต่สำหรับคุณแม่แล้วคณิตศาสตร์ แต่คณิตศาสตร์นั้นค่อนข้างหนักพอ ๆ กับที่คุณอ่านบทความ

08:13.610 --> 08:26.110
แต่ในเวลาเดียวกันมันทำให้คุณเข้าสู่อารมณ์นั้นฉันคิดว่าคุณหมายถึงเหมือนบทอุ่นเครื่องที่คุณทำให้คณิตศาสตร์อุ่นขึ้นก่อนจากนั้นคุณกระโดดเข้าสู่ฉันสนใจคณิตศาสตร์มากขึ้น

08:26.540 --> 08:32.780
เราไปที่นั่นโดยสรุปแล้วความแตกต่างระหว่างความรู้สึกของ Graney

08:32.810 --> 08:36.360
กับการลงทางลาดลาดและวิธีการทำงาน

08:36.410 --> 08:39.830
และในบันทึกนั้นเราจะสรุปในวันนี้

08:39.840 --> 08:42.000
ฉันหวังว่าจะได้พบคุณในหน้าถัดไป

08:42.020 --> 08:44.090
และจนกว่าจะสนุกกับการเรียนรู้ลึก