WEBVTT

00:00.550 --> 00:03.340
أهلا ومرحبا بكم مرة أخرى في دورة التعلم العميق.

00:03.340 --> 00:06.580
في درس اليوم نتحدث عن الانحدار المتدرج.

00:06.580 --> 00:13.240
ما تعلمناه سابقًا هو أنه لكي تتعلم الشبكة العصبية ، ما يجب أن يحدث هو إعادة

00:13.240 --> 00:14.260
الانتشار.

00:14.260 --> 00:23.080
وذلك عندما يتم نشر الخطأ أو الفرق أو مجموع الفروق التربيعية بين y hat و y مرة أخرى عبر

00:23.080 --> 00:28.210
الشبكة العصبية ويتم تعديل الأوزان وفقًا لذلك.

00:28.210 --> 00:34.150
لذلك رأينا ذلك واليوم سوف نتعلم بالضبط كيف يتم ضبط هذه الأوزان.

00:34.150 --> 00:35.230
لذلك دعونا نلقي نظرة.

00:35.920 --> 00:44.590
هذه هي نسختنا البسيطة جدًا من الشبكة العصبية ، أو مدرك أو شبكة عصبية متجهة إلى الأمام بطبقة واحدة.

00:44.590 --> 00:52.360
وما يمكننا رؤيته هنا هو هذه العملية برمتها قيد التنفيذ حيث حصلنا على بعض القيمة المدخلة

00:52.360 --> 00:56.920
، ثم أصبح لدينا وزن ، ثم يتم تطبيق وظيفة التنشيط.

00:56.920 --> 00:59.800
لدينا قبعة بيضاء ثم نقارنها بالقيمة الفعلية.

00:59.800 --> 01:01.570
نحسب دالة التكلفة.

01:01.570 --> 01:05.200
فكيف يمكننا تقليل دالة التكلفة؟

01:05.200 --> 01:07.270
مالذي يمكننا فعله حيال هذا؟

01:07.270 --> 01:14.680
حسنًا ، أحد الأساليب للقيام بذلك هو نهج القوة الغاشمة حيث نأخذ جميع الأوزان الممكنة المختلفة

01:14.680 --> 01:18.130
وننظر إليها ونرى أيها يعمل بشكل أفضل.

01:18.130 --> 01:24.760
وما نقوم به هو ، على سبيل المثال ، أن نجرب ، لنقل ، على سبيل المثال ، 1000 أوزان ونجرب النموذج.

01:24.940 --> 01:27.640
سنحصل على شيء مثل هذا لوظيفة التكلفة.

01:27.640 --> 01:32.740
وهذا مخطط على المحور ص لديك دالة تكلفة أو المحور الرأسي.

01:32.740 --> 01:39.100
على المحور الأفقي لديك قبعة y ولأنك ترى أن الصيغة هي y قبعة ناقص y تربيع ، هذا ما ستبدو عليه

01:39.100 --> 01:41.590
دالة التكلفة ، شيء من هذا القبيل.

01:42.510 --> 01:47.100
وستجد أساسًا أن أفضل واحد موجود هنا.

01:47.760 --> 01:50.490
نهج بسيط للغاية وبديهي للغاية.

01:50.850 --> 01:53.130
لماذا لا تفعل هذا الأسلوب القوة الغاشمة؟

01:53.130 --> 02:02.100
لماذا لا تقوم فقط بتجربة 1000 تكلفة مختلفة ، أو ألف معلمة أو مدخلات مختلفة للأوزان ومعرفة أيها يعمل بشكل

02:02.100 --> 02:02.940
أفضل؟

02:02.940 --> 02:04.110
ستجد الأفضل بهذه الطريقة.

02:04.140 --> 02:07.530
حسنًا ، إذا كان لديك طريقة واحدة فقط للتحسين ، فقد ينجح ذلك.

02:07.530 --> 02:14.100
ولكن مع زيادة عدد الأوزان وزيادة عدد نقاط الاشتباك العصبي في شبكتك ، عليك

02:14.100 --> 02:16.310
مواجهة لعنة الأبعاد.

02:16.320 --> 02:18.690
إذن ما هي لعنة الأبعاد؟

02:19.350 --> 02:24.390
أفضل طريقة لوصف هذا أو شرحه هي مجرد إلقاء نظرة على مثال عملي.

02:24.390 --> 02:30.420
لذا تذكر هذا المثال الذي كان لدينا عندما كنا نتحدث عن كيفية عمل الشبكات

02:30.420 --> 02:36.870
العصبية بالفعل ، حيث كنا نبني أو نشغل شبكة عصبية لتقييم الخصائص.

02:36.870 --> 02:40.500
إذن هذا ما بدا عليه عندما تم تدريبه بالفعل.

02:40.500 --> 02:43.440
حسنًا ، عندما لا يتم تدريبه من قبل ، يتم تدريبه من قبل.

02:43.440 --> 02:47.520
نحن نعلم أي الأوزان ، الشبكة العصبية الفعلية تبدو هكذا.

02:47.520 --> 02:54.960
حسنًا ، لأن لدينا كل هذه المشابك العصبية المحتملة المختلفة ولا يزال يتعين علينا تدريب الأوزان.

02:54.960 --> 03:00.600
ولدينا هنا إجمالي 25 وزنًا ، إذن أربعة في خمسة في البداية ، بالإضافة إلى خمسة من الطبقة المخفية

03:00.600 --> 03:03.330
إلى الطبقة الناتجة ، إجمالي 25 وزنًا.

03:03.390 --> 03:09.030
ودعونا نرى كيف يمكننا القوة الغاشمة 25 أوزانًا.

03:09.150 --> 03:13.230
إنها شبكة عصبية بسيطة جدًا هنا ، بسيطة جدًا.

03:13.230 --> 03:14.400
طبقة واحدة مخفية فقط.

03:14.400 --> 03:21.090
وكيف يمكننا أن نجبر طريقنا من خلال شبكة عصبية بهذا الحجم؟

03:21.090 --> 03:24.150
حسنًا ، لنقم ببعض العمليات الحسابية البسيطة.

03:24.150 --> 03:25.800
لدينا 25 أوزان.

03:25.800 --> 03:30.330
هذا يعني أنه إذا كان لدينا 1000 مجموعة سنختبرها لكل وزن

03:30.330 --> 03:36.960
، فإن العدد الإجمالي للتركيبات هو 1000 أس 25 أو 1000 أو عشرة أس 75 توليفة مختلفة.

03:37.680 --> 03:46.800
الآن دعونا نرى كيف تضيء Sunway العنوان أسرع كمبيوتر عملاق في العالم اعتبارًا من يونيو 2016.

03:47.250 --> 03:49.590
كيف ستتعامل مع هذه المشكلة؟

03:49.590 --> 03:49.770
الصحيح.

03:49.770 --> 03:53.730
لذا بطريقة ما مرتبطة بالضوء ، تبدو هكذا.

03:53.760 --> 03:58.770
إنه مبنى ضخم بالكامل بالنسبة لهذا الكمبيوتر العملاق.

03:58.770 --> 04:04.470
وقد حصل على رقم غينيس للأرقام القياسية لكونه أسرع كمبيوتر عملاق.

04:05.100 --> 04:08.160
الآن ، هو أسرع كمبيوتر عملاق في العالم.

04:08.160 --> 04:14.730
ويمكن أن يعمل Sunway Tiger Light بسرعة 93 بيتافلوبس.

04:15.220 --> 04:24.300
يشير التقليب إلى العملية العائمة في الثانية ، لذا يمكنها القيام بـ 93 أس مضروبًا في عشرة

04:24.300 --> 04:27.930
أس 15 عملية عائمة في الثانية.

04:27.930 --> 04:32.280
هذا هو مدى سرعة المقارنة.

04:32.280 --> 04:37.980
أجهزة الكمبيوتر العادية في الوقت الحالي تحب ما يزيد قليلاً عن عدة جيجا يتخبط وما إلى ذلك.

04:37.980 --> 04:44.130
لذا مثل نوع من تلك النطاقات أقل بكثير من صنواي توايلايت.

04:44.130 --> 04:47.790
لذا صنواي توايلايت في طليعة التكنولوجيا.

04:48.150 --> 04:57.900
ودعونا نقول نظريًا أنه يمكن إجراء اختبار واحد ، اختبار واحد ، مجموعة واحدة لشبكتنا العصبية في فشل واحد

04:57.900 --> 05:01.320
، بشكل أساسي في عملية عائمة واحدة.

05:01.560 --> 05:03.150
ذلك غير ممكن.

05:03.150 --> 05:09.420
هذا ليس عمليًا لأنك تحتاج إلى عمليات عائمة متعددة لاختبار وزن واحد في شبكتك العصبية.

05:09.420 --> 05:11.190
ولكن حتى دعونا نعطيها السبق.

05:11.190 --> 05:14.970
لنفترض أنها تستطيع فعل ذلك في عالم مثالي.

05:14.970 --> 05:17.310
يمكنه القيام بذلك في عملية عائمة واحدة.

05:17.310 --> 05:19.830
يمكنها إجراء اختبار واحد لكل عملية عائمة واحدة.

05:19.830 --> 05:28.470
هذا يعني أنه سيظل يتطلب عشرة أس 75 مقسومًا على 93 مرة ، من عشرة إلى بار ، و 15 ثانية قادمة ، لإجراء

05:28.470 --> 05:33.900
كل تلك الاختبارات للقوة الغاشمة عبر تلك الشبكة.

05:33.900 --> 05:39.540
هذا يعني واحدًا أو ما يقرب من عشرة أس 58 ثانية ، وهذا يساوي

05:39.540 --> 05:41.850
عشرة أس 50 عامًا.

05:41.850 --> 05:44.220
هذا هو عدد كبير.

05:44.220 --> 05:48.120
هذا أطول من وجود الكون.

05:48.120 --> 05:52.800
وهذا بالتأكيد لن يعني ببساطة أن هذا الرقم ضخم جدًا.

05:52.800 --> 05:58.860
من المؤكد أنها لن تعمل من أجلنا على الإطلاق في التحسين.

05:58.860 --> 05:59.970
لذا ها نحن ذا.

05:59.970 --> 06:01.170
هذا هو لا.

06:01.170 --> 06:05.340
حتى على ضوء العنوان sunway أسرع كمبيوتر عملاق في العالم.

06:05.340 --> 06:07.560
لذلك علينا أن نتوصل إلى نهج مختلف.

06:07.560 --> 06:10.080
كيف سنجد الوزن الأمثل؟

06:10.080 --> 06:13.500
بالمناسبة ، كانت شبكتنا العصبية بسيطة للغاية.

06:13.500 --> 06:17.060
ماذا لو كانت الشبكات العصبية تبدو مثل هذا ، أليس كذلك؟

06:17.100 --> 06:22.110
أو أكبر من ذلك أيضًا ، حسنًا ، لن يحدث هذا على الإطلاق.

06:22.530 --> 06:26.100
الطريقة التي سنتناولها تدعى الانحدار.

06:26.100 --> 06:28.200
وربما سمعت عنها بالفعل.

06:28.410 --> 06:30.630
إذا لم يكن الأمر كذلك ، فسنكتشف ما هو عليه الآن.

06:30.630 --> 06:40.500
إذن ، هناك دالة التكلفة الخاصة بنا وسنرى الآن كيف يمكننا إيجاد طريقة أسرع للعثور

06:40.500 --> 06:41.910
على.

06:41.980 --> 06:43.120
الخيار الأفضل.

06:43.120 --> 06:44.980
لنفترض أننا بدأنا من مكان ما.

06:44.980 --> 06:45.850
عليك أن تبدأ من مكان ما.

06:45.850 --> 06:52.810
لذا نبدأ من هناك ومن تلك النقطة في أعلى اليسار ، ما سنفعله هو أننا

06:52.810 --> 06:58.510
سننظر إلى زاوية دالة التكلفة عند تلك النقطة.

06:58.510 --> 07:01.900
لذلك سنقوم بشكل أساسي بهذا السبب في تسميته بالتدرج ، لأنه يجب عليك الاشتقاق.

07:01.900 --> 07:03.790
لن ننظر إلى المعادلات الرياضية.

07:04.090 --> 07:09.220
سنقدم بعض النصائح حول القراءة الإضافية في نهاية المحاضرة التالية.

07:09.580 --> 07:16.900
لكن في الأساس تحتاج فقط إلى الاشتقاق ، ومعرفة الميل في تلك النقطة المحددة ومعرفة ما إذا كان

07:16.900 --> 07:19.180
الميل موجبًا أم سالبًا.

07:19.180 --> 07:23.890
إذا كان المنحدر سالبًا ، في هذه الحالة يعني أنك تنحدر.

07:23.890 --> 07:27.070
إذن ، إلى اليمين هو انحدار ، إلى اليسار صعودًا.

07:27.070 --> 07:29.620
ومن هناك ، فهذا يعني أنك بحاجة إلى السير في الاتجاه الصحيح.

07:29.620 --> 07:32.920
في الأساس ، أنت بحاجة إلى النزول إلى منحدر وهذا ما سنفعله.

07:32.950 --> 07:35.140
الغرفة تأخذ خطوة ، أليس كذلك؟

07:35.380 --> 07:37.390
الكرة تتدحرج مرة أخرى.

07:37.390 --> 07:38.230
نفس الشيء.

07:38.230 --> 07:39.460
تقوم بحساب المنحدر.

07:39.460 --> 07:44.860
هذه المرة يكون المنحدر موجبًا ، أي أن اليمين صعودًا ، واليسار هبوطًا

07:44.860 --> 07:52.120
، وعليك أن تتجه يسارًا وتدحرج الكرة لأسفل ومرة أخرى تحسب المنحدر وتدحرج الكرة لليمين.

07:52.960 --> 07:53.470
هناك نذهب.

07:53.470 --> 08:02.980
هذه هي الطريقة التي تجدها بعبارات بسيطة ، هكذا تجد أفضل الأوزان ، أفضل موقف يقلل من دالة التكلفة

08:02.980 --> 08:04.420
الخاصة بك.

08:04.420 --> 08:06.520
بالطبع ، لن تكون مثل الكرة.

08:06.520 --> 08:12.670
سيكون التدحرج أسلوبًا متعرجًا للغاية ، ولكن من الأسهل تذكر نوعًا من أنه من الممتع النظر

08:12.670 --> 08:14.860
إليه على أنه كرة تتدحرج.

08:14.860 --> 08:18.500
لكن في الواقع ، نعم ، ستكون مجرد نهج خطوة بخطوة.

08:18.500 --> 08:20.560
لذلك ستكون طريقة من النوع المتعرج.

08:21.820 --> 08:22.210
نعم.

08:22.210 --> 08:24.970
وهناك أيضًا الكثير من العناصر الأخرى.

08:24.970 --> 08:31.540
هناك أشياء مثل ، على سبيل المثال ، لماذا مثل لماذا تنخفض؟

08:31.540 --> 08:35.020
لماذا لا يحب الذهاب بعيدًا عن الخط؟

08:35.020 --> 08:40.360
لذلك كان من الممكن أن يقفز من هذا إلى الأعلى بدلاً من الأسفل وأشياء من هذا القبيل.

08:40.360 --> 08:41.890
لذلك فهي معلمات يمكنك تعديلها.

08:41.890 --> 08:45.460
ومرة أخرى ، سنذكر أين يمكنك معرفة المزيد عن ذلك.

08:45.460 --> 08:50.470
بالإضافة إلى ذلك ، سيكون لدينا هذا في تطبيق عملي ، ولكن بأبسط نهج بديهي.

08:50.470 --> 08:51.670
هذا هو ما يحدث.

08:51.670 --> 08:57.730
نحن نصل إلى القاع فقط من خلال فهم الطريقة التي يجب أن نسلكها بدلاً من التأثير الغاشم عبر

08:57.730 --> 09:02.800
الآلاف والآلاف والملايين والمليارات والمليارات من المجموعات.

09:02.800 --> 09:08.860
يمكننا ببساطة في كل مرة أن نلقي نظرة على مكان وجوده ، وأي اتجاه يكون منحدرًا.

09:08.860 --> 09:13.720
لذا تمامًا كما تتخيل أنك تقف على تل ، ما هي الطريقة التي تشعر بها أنها تتجه لأسفل وأيًا كانت الطريقة

09:13.720 --> 09:16.420
التي تتجه لأسفل ، فأنت تستمر في السير بهذه الطريقة.

09:16.420 --> 09:20.320
أنت مثل ، تتخذ 50 خطوة بهذه الطريقة ثم تقوم بالتقييم مرة أخرى ، ما هي الطريقة التي تسير بها؟

09:20.320 --> 09:21.370
إلى أسفل بهذه الطريقة.

09:21.370 --> 09:23.170
حسنًا ، اتخذ الآن 50 خطوة أو أقل.

09:23.170 --> 09:27.880
اتخذ 40 خطوة بهذه الطريقة ، بحيث تصبح أقل وأقل وأقل كلما اقتربت.

09:28.390 --> 09:32.650
هذا مثال على الانحدار المتدرج المطبق في فضاء ثنائي الأبعاد.

09:32.650 --> 09:35.440
لذلك كان هذا مثالًا ذا بعد واحد.

09:36.460 --> 09:40.180
لدينا هنا مساحة ثنائية الأبعاد للهبوط المتدرج.

09:40.180 --> 09:44.890
كما ترى ، فإنه يقترب من الحد الأدنى ويسمى أيضًا نزول التدرج

09:44.890 --> 09:49.240
لأنك تنزل إلى الحد الأدنى من دالة التكلفة.

09:49.420 --> 09:53.260
وأخيرًا ، هذا هو الانحدار المتدرج المطبق في ثلاثة أبعاد.

09:53.260 --> 09:54.340
هذا ما يبدو عليه.

09:54.340 --> 09:59.260
إذا قمت بإسقاطها على بعدين ، يمكنك أن ترى أنها تتعرج في طريقها إلى الحد الأدنى.

09:59.440 --> 10:00.020
لذا ها أنت ذا.

10:00.070 --> 10:05.890
كان هذا نزولًا متدرجًا في البرنامج التعليمي الذي سنتحدث فيه عن نزول التدرج العشوائي سيكون استمرارًا

10:05.890 --> 10:08.620
لهذا البرنامج التعليمي وأتطلع إلى رؤيتك هناك.

10:08.620 --> 10:10.720
وهكذا في المرة القادمة استمتع بالتعلم العميق.
