WEBVTT

00:00.270 --> 00:02.880
أهلا ومرحبا بكم مرة أخرى في دورة التعلم العميق.

00:02.880 --> 00:08.360
هذا برنامج تعليمي إضافي للحديث عن أجهزة Mac اللينة ووظائف الانتروبيا المتقاطعة.

00:08.370 --> 00:15.570
ليس من الضروري بنسبة 100٪ أن تمر عبر كل الأجزاء التي مررنا بها في الجزء الرئيسي

00:15.570 --> 00:21.120
من هذا القسم حيث نتحدث عن الشبكات العصبية التلافيفية.

00:21.120 --> 00:26.490
لكن في الوقت نفسه ، اعتقدت أنها ستكون إضافة جيدة لمجموعة المعرفة والمهارات الخاصة بك.

00:26.490 --> 00:30.450
لذلك دعونا نمضي قدمًا ونبحث في هذه الوظائف.

00:30.570 --> 00:37.470
لنبدأ ، ما لدينا هنا هو الشبكة العصبية التلافيفية التي أنشأناها في الجزء الرئيسي من القسم ، ثم

00:37.470 --> 00:47.790
في النهاية تظهر بعض الاحتمالات للصفر. 95 لكلب و 0. 055 أو 5٪ للقطط.

00:47.820 --> 00:52.530
بالنظر إلى تلك الصورة الموجودة على اليسار كمدخلات ، فهذا بعد إجراء القطار.

00:52.530 --> 00:57.120
هذا هو في الواقع قيد التشغيل ويقوم بتصنيف صورة معينة.

00:57.120 --> 01:00.690
والسؤال هنا هو ، كيف يتم جمع هاتين القيمتين حتى واحد؟

01:00.690 --> 01:06.150
لأنه على حد علمنا ، من كل ما تعلمناه عن الشبكات العصبية الاصطناعية ، لا يوجد

01:06.150 --> 01:11.490
ما يقال أن هاتين العصبيتين النهائيتين متصلتان ببعضهما البعض.

01:11.490 --> 01:16.680
فكيف سيعرفون ما هي قيمة كيف يعرف كل منهم ، ما هي قيمة الآخر ، وكيف

01:16.680 --> 01:20.070
يعرفون أن يضيفوا قيمهم إلى قيمة واحدة؟

01:20.070 --> 01:26.010
حسنًا ، الجواب هو أنهم لن يكونوا في النسخة الكلاسيكية من الشبكة العصبية الاصطناعية.

01:26.100 --> 01:31.650
والطريقة الوحيدة التي يقومون بها هي أننا نقدم وظيفة خاصة تسمى دالة soft max من أجل مساعدتنا

01:31.650 --> 01:33.720
في الخروج من هذا الموقف.

01:33.720 --> 01:40.620
عادة ما يحدث هو أن الخلايا العصبية في الكلاب والقطط سيكون لها أي نوع من القيم الحقيقية.

01:41.400 --> 01:44.910
لا يجب أن يكونوا من الفئة "ب" ، ولا يتعين عليهم إضافة ما يصل إلى واحد.

01:44.910 --> 01:51.510
ولكن بعد ذلك سنقوم بتطبيق دالة soft max ، والتي تمت كتابتها هناك في الأعلى ، وهذا

01:51.510 --> 01:56.100
سيجعل هذه القيم بين صفر وواحد وستجعلها تضاف إلى واحد.

01:56.100 --> 02:03.180
وللاقتباس من ويكيبيديا ، فإن دالة المصدر القصوى أو الوظيفة الأسية المعيارية هي تعميم للوظيفة

02:03.180 --> 02:10.200
اللوجيستية التي تقتبس من دون اقتباس يسحق متجه k الأبعاد للقيم الحقيقية التعسفية إلى متجه k الأبعاد

02:10.200 --> 02:15.240
للقيم الحقيقية في النطاق من 0 إلى 1 التي تضيف ما يصل إلى واحد.

02:15.240 --> 02:17.460
لذلك فهو في الأساس يفعل ما نريده بالضبط.

02:17.460 --> 02:22.650
إنها تجعل هذه القيم بين صفر وواحد وتتأكد من أنها تضيف ما يصل إلى واحد.

02:22.650 --> 02:26.400
والطريقة التي يعمل بها هي أن هذا ممكن.

02:26.400 --> 02:29.790
هل هذا لأنه في الأسفل هنا ، يمكنك أن ترى أن هناك مجموعًا.

02:29.790 --> 02:36.480
لذلك يأخذ الأس ويضعه في قوة Z ويضيفه.

02:36.480 --> 02:39.690
إذن Z واحد هو اثنان في جميع فئاتك ، كل هذه القيم.

02:39.690 --> 02:43.470
وهذا هو تطبيعك يحدث هناك.

02:44.130 --> 02:47.310
هذه هي الطريقة التي تعمل بها وظيفة soft max.

02:47.310 --> 02:54.810
ومن المنطقي إدخال وظيفة soft max في الشبكات العصبية التلافيفية ، لأنه سيكون

02:54.810 --> 03:02.370
من الغريب أن يكون لديك فئتان محتملتان من كلب وقطة ، وبالنسبة لفئة الكلاب لديك احتمال

03:03.450 --> 03:08.250
80٪ ، وبالنسبة للقطط فئة لديك احتمال 45٪.

03:08.250 --> 03:08.610
حق؟

03:08.610 --> 03:11.190
إنه ليس له معنى من هذا القبيل.

03:11.190 --> 03:15.810
وبالتالي ، يكون الأمر أفضل بكثير عندما تقوم بإدخال هذه الوظيفة off max وهذا ما

03:15.810 --> 03:19.230
ستجده يحدث معظم الوقت في الشبكات العصبية التلافيفية.

03:19.530 --> 03:25.980
الآن ، الشيء الآخر هو أن وظيفة soft max تأتي جنبًا إلى جنب مع شيء يسمى وظيفة الانتروبيا

03:25.980 --> 03:27.240
المتقاطعة.

03:27.240 --> 03:28.950
وهو أمر مفيد للغاية بالنسبة لنا.

03:28.950 --> 03:30.450
لنلق نظرة على الصيغة أولًا.

03:30.480 --> 03:32.730
هذا ما تبدو عليه وظيفة الانتروبيا المتقاطعة.

03:32.910 --> 03:36.930
سنستخدم بالفعل عملية حسابية مختلفة.

03:36.930 --> 03:40.590
سنستخدم هذا التمثيل للدخول المتقاطع ، لكن النتيجة هي نفسها في الأساس.

03:40.590 --> 03:42.150
هذا فقط أسهل في الحساب.

03:42.270 --> 03:48.990
وما أعلم أن هذا قد يبدو غير مرتبط بأي شيء في الوقت الحالي ، مجرد صيغ على شاشتك ، ولكن سيكون هناك

03:48.990 --> 03:53.010
بعض القراءة الإضافية الموصى بها في نهاية هذا القسم.

03:53.010 --> 03:58.290
لذلك لا تقلق إذا لم تكن تعلم الرياضيات ، مثل إذا لم نقم بشرح الرياضيات الآن.

03:58.290 --> 04:01.710
لكن النقطة هنا هي أن ما هو الانتروبيا المتقاطعة؟

04:01.710 --> 04:03.540
حسنًا ، دالة إنتروبيا متقاطعة.

04:03.540 --> 04:11.460
تذكر كيف كنا في السابق في الشبكات العصبية الاصطناعية ، كانت لدينا وظيفة تسمى دالة الخطأ التربيعي

04:11.460 --> 04:17.700
المتوسط ، والتي استخدمناها كدالة التكلفة لتقييم أداء شبكتنا.

04:17.700 --> 04:23.670
وكان هدفنا هو تقليل MSI من أجل تحسين أداء شبكتنا.

04:23.670 --> 04:26.700
حسنًا ، كانت هذه دالة التكلفة ثم هناك.

04:26.700 --> 04:34.500
وفي الشبكات العصبية التلافيفية ، لا يزال بإمكاننا استخدام MSI ، ولكن تبين أن الخيار الأفضل في الشبكات العصبية

04:34.500 --> 04:39.600
التلافيفية بعد تطبيق وظيفة max soft هو وظيفة الانتروبيا المتقاطعة.

04:39.600 --> 04:45.540
وفي الشبكات العصبية التلافيفية ، عندما تقوم بتطبيق وظائف الانتروبيا المتقاطعة ، لم تعد تكلفتها تسمى

04:45.540 --> 04:49.410
وظيفة التكلفة ، إنها تسمى وظيفة الخسارة ، وهي متشابهة جدًا.

04:49.410 --> 04:55.440
إنها مجرد اختلافات طفيفة في المصطلحات وتختلف قليلاً فيما تعنيه.

04:55.440 --> 04:58.920
لكن لأغراضنا ، إنه نفس الشيء إلى حد كبير و.

04:59.750 --> 05:07.460
ما يحدث هو وظيفة الخسارة ، مرة أخرى ، شيء نريد تقليله من أجل تعظيم

05:07.460 --> 05:09.430
أداء شبكتنا.

05:09.440 --> 05:15.170
لذلك دعونا نلقي نظرة على مثال سريع حول كيفية تطبيق هذه الوظيفة.

05:15.170 --> 05:19.070
لنفترض أننا وضعنا صورة لكلب في شبكتنا.

05:19.550 --> 05:24.410
القيمة المتوقعة للكلب هي 0. 9 وهذا أثناء التدريب.

05:24.410 --> 05:27.020
لذلك نحن نعلم أننا نعرف التسمية التي تشير إلى الكلب.

05:27.020 --> 05:29.320
إذن القيمة التنبؤية هي 0. 9.

05:29.330 --> 05:32.180
القيمة التنبؤية للقط هي 0. 1.

05:32.180 --> 05:33.650
ثم هنا لدينا التسمية.

05:33.650 --> 05:37.700
لذلك نحن نعلم أنه كلب لأن هذا تدريب وآخر للكلاب ، صفر للقطط.

05:37.700 --> 05:42.410
وهكذا في هذه الحالة ، تحتاج إلى استخدام.

05:43.330 --> 05:47.510
يجب عليك إدخال هذه الأرقام في معادلة الانتروبيا المتقاطعة.

05:47.530 --> 05:52.780
إذن كيف تفعل ذلك هل القيم الموجودة على اليسار تذهب إلى المتغير؟

05:52.780 --> 05:58.870
س الذي يوجد تحت اللوغاريتم في الجانب الأيمن والقيم من اليمين ستنتقل إلى P ولذا

05:58.870 --> 06:03.940
فمن المهم أن تتذكر أي واحد يذهب إلى هناك لأنه إذا أخطأت في فهمه ، فأنت

06:03.940 --> 06:09.460
لا تريد أن تأخذ لوغاريتم من a ، من قيمة صفرية أو لوغاريتم من واحد.

06:09.460 --> 06:16.960
لذا فأنت تريد فقط توصيلها ، وتأكد من توصيلها في الأماكن الصحيحة ثم تضيفها بشكل أساسي.

06:16.960 --> 06:19.390
هذه هي الطريقة التي يعمل بها الإدخال المتقاطع.

06:19.390 --> 06:25.150
وسننظر الآن في الواقع سنلقي نظرة على مثال محدد خطوة بخطوة لتطبيق هذه الوظيفة في

06:25.150 --> 06:26.650
الحياة الواقعية.

06:26.650 --> 06:30.220
وسيكون من المنطقي نوعًا ما ما هو الانتروبيا المتقاطعة.

06:30.220 --> 06:36.340
وسيكون هدفي أقل في هذا الدرس هو أن أجعلك أكثر راحة مع الإنتروبيا المتقاطعة

06:36.340 --> 06:45.580
، لأنها يمكن أن تبدو معقدة للغاية ولا يقصد بها التورية ، يمكن أن تحب الشبكات العصبية التلافيفية ، يمكن أن

06:45.850 --> 06:48.190
تبدو معقدة للغاية.

06:48.190 --> 06:48.690
الصحيح.

06:48.790 --> 06:50.740
مخيف ، لكنه ليس كذلك.

06:50.740 --> 06:51.550
هذا هو بيت القصيد.

06:51.550 --> 06:54.010
لذلك دعونا نمضي قدمًا ونطبقه فقط حتى نعرف أنه ليس مخيفًا.

06:54.010 --> 06:56.290
إذن ها هي الشبكة العصبية.

06:56.290 --> 07:01.510
وهذا سيوضح أيضًا سبب قيامنا بذلك ، ولماذا ننظر إلى وظائف الفصل المختلفة.

07:01.510 --> 07:06.280
إذاً الشبكة العصبية الأولى ، الشبكة العصبية الثانية ، لنفترض

07:06.280 --> 07:11.890
أن لدينا شبكتين عصبيتين ثم مررنا صورة لكلب ونعلم أن هذا كلب وليس قطة.

07:11.890 --> 07:16.840
ثم لدينا صورة أخرى لقط هذه المرة حيوان.

07:16.840 --> 07:17.830
وهي قطة وليست كلب.

07:17.830 --> 07:22.960
وهنا لدينا حيوان غريب المظهر ، وهو في الحقيقة كلب وليس قطة ، إذا نظرت

07:22.960 --> 07:23.590
عن كثب.

07:24.100 --> 07:26.280
لذلك نريد أن نرى ما كانت شبكاتنا العصبية.

07:26.470 --> 07:32.290
سيتنبأ في الحالة الأولى شبكة عصبية واحدة 90٪ كلب 10٪ قطة.

07:32.290 --> 07:33.160
صحيح.

07:33.160 --> 07:37.510
الشبكة العصبية الثانية 60٪ كلب 40٪ قطة ما زالت صحيحة.

07:37.510 --> 07:39.040
أسوأ لكن صحيح.

07:40.120 --> 07:46.810
الخيار الثاني أول شبكة عصبية 10٪ قطة كلب 90٪ قطة صحيحة.

07:47.160 --> 07:51.010
وأنت تتحدث فقط عن كلبين بنسبة 30٪ و 70٪ قطة.

07:51.280 --> 07:53.260
أسوأ ، لكنه لا يزال صحيحًا.

07:53.260 --> 07:58.930
وأخيرًا ، الشبكة العصبية واحدة في صورة ثلاثة شبكة عصبية واحدة بنسبة 40٪.

07:58.930 --> 08:08.020
الكلب 60٪ قطة غير صحيحة الشبكة العصبية رقم 2 10٪ كلب 90٪ قطة غير صحيحة وأسوأ.

08:08.020 --> 08:15.430
المفتاح هنا هو أنه على الرغم من أن كلتا الشبكتين أخطأتا في الصورة الأخيرة ، فمن خلال الصور الثلاث ، الشبكة العصبية

08:15.430 --> 08:18.820
، كانت إحداهما تتفوق على الشبكة العصبية الثانية.

08:18.820 --> 08:27.310
لذا ، حتى في الحالة الأخيرة ، كان من الواضح أنها أعطت كلبًا مثل فرصة 40٪ على عكس الشبكة العصبية لإعطاء الكلب

08:27.310 --> 08:29.050
فرصة بنسبة 10٪ فقط.

08:29.050 --> 08:34.990
لذا فإن الشبكة العصبية الأولى تتفوق في الأداء عبر اللوحة عند مقارنتها بالشبكة العصبية الثانية.

08:35.440 --> 08:41.710
والآن سنلقي نظرة على الوظائف التي يمكنهم قياس الأداء التي تحدثنا عنها نوعًا

08:41.710 --> 08:42.730
ما بالفعل.

08:42.730 --> 08:44.770
لذلك دعونا نضع هذه في جدول.

08:44.770 --> 08:46.180
إذاً هناك شبكة عصبية واحدة.

08:46.630 --> 08:49.360
لديك رقم الصف ، لذلك هذا هو رقم الصورة.

08:49.360 --> 08:53.830
ثم بالنسبة للصورة الأولى ، لديك ما توقعته ، 90٪ كلب ، 10٪ قطة.

08:53.830 --> 08:57.250
هذه هي متغيرات القبعة ومن ثم يكون لديك القيم الفعلية.

08:57.250 --> 08:57.430
لذا.

08:57.430 --> 08:59.140
الكلب صحيح.

08:59.140 --> 09:00.340
القط غير صحيح.

09:00.340 --> 09:07.390
نفس الشيء بالنسبة للصورة رقم 2 ونفس الشيء للصورة رقم ثلاثة ونفس الشيء بالنسبة للشبكة العصبية رقم

09:07.390 --> 09:07.630
2.

09:07.630 --> 09:12.010
إذاً الكلب 60٪ ، القط 40٪ في الصورة الأولى ، هذا ما توقعه.

09:12.070 --> 09:14.440
الإجابة الصحيحة هي كلب وليس قطة وهكذا.

09:15.010 --> 09:17.950
والآن دعونا نرى ما هي الأخطاء التي يمكن أن نحصل عليها بالفعل.

09:17.950 --> 09:24.550
إذن ما هي الأخطاء التي يمكننا حسابها لتقدير الأداء ومراقبة أداء شبكاتنا.

09:24.640 --> 09:32.800
لذا فإن أحد أنواع الأخطاء يسمى خطأ التصنيف ، وهذا في الأساس مجرد طرح سؤال ، هل فهمته بشكل

09:32.860 --> 09:33.940
صحيح أم لا؟

09:33.940 --> 09:37.870
بغض النظر عن الاحتمالات ، هل فهمت الأمر بشكل صحيح أم أنك لم تفهمه بشكل صحيح؟

09:37.870 --> 09:44.980
لذلك في كلتا الحالتين ، لكل من الشبكات العصبية ، كل منهما حصل على واحدة أو نحو ذلك.

09:44.980 --> 09:46.240
هذا كم أخطأوا.

09:46.240 --> 09:48.400
لذا فقد حصلوا على واحد من كل ثلاثة خطأ.

09:48.400 --> 09:54.940
لذلك معدل الخطأ 33٪ للشبكة العصبية الأولى و 33٪ معدل الخطأ للشبكة العصبية الثانية.

09:54.940 --> 09:59.080
ومن وجهة النظر هذه ، تعمل كلتا الشبكتين العصبيتين على نفس المستوى.

09:59.080 --> 10:00.100
لكننا نعلم أن هذا ليس صحيحًا.

10:00.100 --> 10:04.150
نحن نعلم أن الشبكة العصبية الأولى تتفوق على الشبكة العصبية الثانية.

10:04.930 --> 10:10.990
هذا هو السبب في أن خطأ التصنيف ليس مقياسًا جيدًا ، خاصةً لأغراض الانتشار العكسي يعني

10:11.680 --> 10:13.690
اختلاف الخطأ التربيعي.

10:13.690 --> 10:16.720
وبالمناسبة ، قمت بهذه الحسابات في Excel.

10:16.930 --> 10:18.340
أنا فقط لا أريد أن أتحملهم معهم.

10:18.340 --> 10:21.940
ولكن يمكنك الجلوس تمامًا والقيام بها على ورقة أو في Excel.

10:21.940 --> 10:23.620
هذه حسابات مباشرة للغاية.

10:23.620 --> 10:32.800
فقط خذ مجموع الأخطاء التربيعية ثم خذ المتوسط عبر ملاحظاتك.

10:32.800 --> 10:34.240
وهذا كل ما في الأمر.

10:34.840 --> 10:38.840
لذلك بالنسبة للشبكة العصبية ، تحصل على 25٪.

10:38.890 --> 10:42.530
للشبكة العصبية ، اثنان ، تحصل على 71٪.

10:42.780 --> 10:43.260
معدلات الخطأ.

10:43.260 --> 10:45.840
لذا كما ترون ، هذا أكثر دقة.

10:45.840 --> 10:51.750
يخبرنا أن الشبكة العصبية واحدة لديها معدل خطأ أقل بكثير من الشبكة العصبية الثانية ثم تعبر الإنتروبيا

10:51.750 --> 10:52.890
مرة أخرى.

10:52.890 --> 10:53.760
لقد رأينا الصيغة.

10:53.760 --> 10:54.900
يمكنك أيضًا حساب هذا.

10:54.900 --> 10:57.900
هذا في الواقع أسهل في الحساب من متوسط الخطأ التربيعي.

10:57.900 --> 11:05.280
عبر الانتروبيا عبر الخطأ يمنحك 38٪ للشبكة العصبية 1 و 1. 06 للشبكة العصبية الثانية.

11:05.280 --> 11:10.140
لذلك يمكنك أن ترى النتائج مختلفة قليلاً عندما تنظر إليها بهذه الطريقة.

11:10.140 --> 11:19.950
عندما تنظر إلى متوسط الخطأ التربيعي والإنتروبيا المتقاطعة ، فإن السؤال عن سبب استخدام الانتروبيا المتقاطعة

11:19.950 --> 11:27.390
على الخطأ التربيعي المتوسط لا يتعلق فقط بنوع الأرقام التي يبصقونها.

11:27.390 --> 11:32.430
كانت هذه الحسابات فقط لتظهر لك أن هذا هو كل ما يمكن القيام به.

11:32.430 --> 11:33.630
يمكنك فقط القيام بذلك على ورقة.

11:33.630 --> 11:37.800
إنها ليست هذه ليست رياضيات شديدة.

11:37.800 --> 11:40.920
هذه أشياء جميلة وبسيطة ومباشرة.

11:40.920 --> 11:46.140
لكن السؤال لماذا قد تستخدم يعني إنتروبيا متقاطعة على خطأ تربيع متوسط؟

11:46.140 --> 11:48.150
إنه سؤال جيد جدًا يجب طرحه.

11:48.150 --> 11:49.200
أنا سعيد لأنك سألت ذلك.

11:49.920 --> 12:00.420
الجواب على ذلك هو أن هناك العديد من مزايا الانتروبيا المتقاطعة على الخطأ التربيعي المتوسط ، وهي غير

12:00.420 --> 12:01.320
واضحة.

12:01.320 --> 12:07.080
ولذا سأذكر الزوجين ، ولكن بعد ذلك سأخبرك أين يمكنك معرفة المزيد.

12:07.080 --> 12:16.830
إذن أحدها هو أنه إذا ، على سبيل المثال ، كنت في بداية الانتشار الخلفي ، فإن قيمة مخرجاتك

12:16.830 --> 12:22.110
صغيرة جدًا جدًا جدًا جدًا وصغيرة جدًا.

12:22.110 --> 12:25.470
لذلك فهي أصغر بكثير من القيمة الفعلية التي تريدها.

12:25.470 --> 12:33.750
ثم في البداية ، سيكون التدرج في نزولك منخفضًا جدًا جدًا ولن يكون كافيًا.

12:33.780 --> 12:40.470
سيكون من الصعب جدًا على الشبكة العصبية البدء في فعل شيء ما والبدء في التحرك والبدء في

12:40.470 --> 12:44.910
تعديل هذه الأوزان والبدء في التحرك في الاتجاه الصحيح.

12:44.910 --> 12:51.000
بينما عندما تستخدم شيئًا مثل الانتروبيا المتقاطعة لأنها تحتوي على هذا اللوغاريتم

12:51.270 --> 12:57.120
، فإنها في الواقع تساعد الشبكة على تقييم خطأ صغير كهذا والقيام بشيء حيال ذلك.

12:57.420 --> 12:58.410
إليك كيفية التفكير في الأمر.

12:58.410 --> 13:03.180
لذلك دعنا نقول مرة أخرى ، هذا هو نهج بديهي للغاية.

13:03.180 --> 13:08.190
هناك ، سيكون هناك رابط للرياضيات ويمكنك اشتقاق هذه الأشياء من خلال الرياضيات بمزيد

13:08.190 --> 13:10.980
من التفصيل ، ولكن بطريقة بديهية للغاية.

13:10.980 --> 13:17.520
دعنا نقول مثلك ، النتيجة التي تريدها هي واحدة.

13:17.520 --> 13:23.070
والآن أنت في 1/1000000 من واحد ، أليس كذلك؟

13:23.070 --> 13:24.900
أ 0. 000001.

13:25.020 --> 13:32.570
وبعد ذلك تتحسن في المرة القادمة التي تقوم فيها بتحسين نتائجك من واحد إلى 1،000.

13:32.580 --> 13:40.200
ومن حيث إذا قمت بحساب مربع الخطأ ، فأنت تقوم فقط بطرح واحدة من الأخرى ، أو بشكل أساسي في كل حالة تقوم بحساب

13:40.200 --> 13:44.910
الخطأ التربيعي وسترى أن مربع الخطأ هو عندما تقارن حالة واحدة

13:44.910 --> 13:46.620
مقابل الأخرى.

13:46.620 --> 13:48.090
لم يتغير كثيرا.

13:48.150 --> 13:51.840
لم تقم بتحسين شبكتك كثيرًا عندما تنظر إلى متوسط الخطأ التربيعي.

13:51.840 --> 13:58.710
ولكن إذا كنت تنظر إلى الانتروبيا المتقاطعة لأنك تأخذ لوغاريتمًا ثم تقارن الاثنين

13:58.710 --> 14:06.090
بتقسيم أحدهما على الآخر ، فسترى أنك قمت بالفعل بتحسين شبكتك بشكل ملحوظ بحيث تقفز من

14:06.090 --> 14:12.750
مليون إلى الألف من حيث متوسط الخطأ التربيعي سيكون منخفضًا جدًا.

14:12.750 --> 14:20.850
سيكون غير مهم ، ولن يوجه عملية تعزيز التدرج أو انتشار ظهرك في الاتجاه

14:20.850 --> 14:21.990
الصحيح.

14:21.990 --> 14:26.640
سوف يوجهه في الاتجاه الصحيح ، لكنه سيكون بمثابة توجيه بطيء للغاية.

14:26.640 --> 14:29.280
لن يكون لديها ما يكفي من القوة.

14:29.490 --> 14:34.620
بينما إذا قمت بذلك من خلال الانتروبيا المتقاطعة ، فإن الانتروبيا المتقاطعة

14:34.620 --> 14:41.970
ستفهم ذلك ، على الرغم من أن هذه تعديلات صغيرة جدًا تُحدث تغييرًا طفيفًا من حيث القيمة المطلقة ، من الناحية النسبية

14:41.970 --> 14:46.020
، إنه تحسن كبير ونحن بالتأكيد نذهب في الاتجاه الصحيح.

14:46.020 --> 14:47.160
دعونا نواصل السير بهذه الطريقة.

14:47.160 --> 14:56.040
لذا فإن الانتروبيا المتقاطعة ستساعد شبكتك العصبية على الوصول إلى اليمين والوصول إلى الحالة المثلى.

14:56.760 --> 15:01.020
إنها طريقة أفضل للشبكة العصبية للوصول إلى الحالة المثلى.

15:01.020 --> 15:08.160
لكن ضع في اعتبارك أن هذا لا يعمل إلا عندما تكون الانتروبيا المتقاطعة هي الطريقة المفضلة فقط للتصنيف.

15:08.160 --> 15:13.590
لذا إذا كنت تتحدث عن أشياء مثل الانحدار ، مثل ما كان لدينا في الشبكات العصبية الاصطناعية

15:13.740 --> 15:17.280
، فإنك تفضل الذهاب معي والخطأ التربيعي.

15:17.280 --> 15:22.860
في حين أن الانتروبيا المتقاطعة أفضل للتصنيف ، ومرة أخرى يتعلق الأمر بحقيقة أننا نستخدم وظيفة

15:22.860 --> 15:23.610
mac soft.

15:23.610 --> 15:26.640
هذا نوع من التفسير البديهي لذلك.

15:26.880 --> 15:29.280
مكان جيد لمعرفة المزيد عن ذلك.

15:29.280 --> 15:34.440
إذا كنت مهتمًا حقًا ، فلماذا نستخدم الإنتروبيا مقابل الخطأ التربيعي المتوسط؟

15:35.190 --> 15:42.150
دعا فيديو Google لجيفري هينتون وظيفة soft max output وهو يشرحها.

15:42.250 --> 15:42.850
ممتاز.

15:42.850 --> 15:47.800
وكما تعلم ، كونك الأب الروحي للتعلم العميق ، فمن يمكنه شرح ذلك بشكل أفضل على أي حال.

15:48.580 --> 15:51.610
وبالمناسبة ، أي فيديو لجيفري هينتون ذهبي.

15:51.610 --> 15:54.220
لديه موهبة كبيرة في شرح الأشياء.

15:55.120 --> 15:58.540
على أي حال ، هذا هو الحد الأقصى الناعم مقابل الانتروبيا المتقاطعة.

15:58.540 --> 16:03.100
آمل أن يمنحك هذا نوعًا من الفهم الحدسي لما يحدث هنا ، ولكن الأهم من ذلك

16:03.100 --> 16:08.980
، أنك لا تتأخر عن مصطلح الانتروبيا المتقاطعة ، لأن Adlon سيذكرها في الدروس العملية.

16:08.980 --> 16:11.020
وأردت التأكد من استعدادك لذلك.

16:11.020 --> 16:17.170
إنها مجرد طريقة أخرى لحساب وظيفة الخسارة وطريقة أخرى لتحسين شبكتك

16:17.170 --> 16:23.560
، وهي مصممة خصيصًا لمشاكل التصنيف وبالتالي الشبكات العصبية التلافيفية

16:23.560 --> 16:27.730
وتأتي جنبًا إلى جنب مع وظيفة soft max.

16:28.060 --> 16:35.230
قراءة إضافية ، إذا كنت ترغب في الحصول على مقدمة خفيفة في الانتروبيا المتقاطعة ، إذا كنت مهتمًا بالانتروبيا المتقاطعة

16:35.230 --> 16:36.370
أكثر قليلاً.

16:36.400 --> 16:42.250
بالطبع ، هناك مقال جيد يجب التحقق منه يسمى "مقدمة ودية لخسارة الانتروبيا المتقاطعة" بواسطة

16:42.250 --> 16:43.410
Rob de Pietro.

16:44.110 --> 16:46.660
2016 هنا الرابط أدناه.

16:47.020 --> 16:48.190
جميل جدا جدا.

16:49.030 --> 16:50.410
ناعم جدا.

16:50.440 --> 16:51.210
لا شئ؟

16:51.220 --> 16:52.060
لا لا.

16:52.060 --> 16:53.770
الرياضيات المعقدة للغاية.

16:54.130 --> 16:56.110
القياس الجيد هو الأمثلة الجيدة.

16:56.110 --> 17:01.120
استخدم تشبيهات السيارات وأنت تنظر إلى السيارات وتتحدث عن المعلومات والقطع والقيود.

17:01.900 --> 17:03.220
وكيف ترميز هذا؟

17:03.220 --> 17:03.880
كيف تقوم بترميز ذلك؟

17:03.890 --> 17:05.770
إنها مقالة جيدة لإلقاء نظرة عليها.

17:05.770 --> 17:08.800
وسنقدم لك نظرة عامة جيدة على الانتروبيا المتقاطعة.

17:09.580 --> 17:15.340
مثل من وجهة نظر تمهيدية ، إذا كنت تريد البحث في الرياضيات الثقيلة مثل ما تراه

17:15.820 --> 17:21.370
هنا ، فراجع مقالًا أو مدونة عن طريق كيفية تنفيذ الشبكة العصبية.

17:21.370 --> 17:29.320
Intermezzo two لذا فإن intermezzo مثل شيء وسيط ، مثل متقطع في الداخل ، مثل عندما

17:29.320 --> 17:36.100
تذهب إلى مسرح ويكون لديك مثل الفاصل بين الجزء الأول والجزء الثاني.

17:36.100 --> 17:40.300
لذلك لأنه يحب أن يمر بكل هذه الخطوات ثم بعد ذلك يقول ، أوه ، يجب أن

17:40.300 --> 17:41.440
أشرح هذا أولاً.

17:42.250 --> 17:44.020
ونعم ، ولهذا السبب يطلق عليه Intermezzo.

17:44.020 --> 17:46.000
لا يوجد سبب آخر ، على حد علمي.

17:46.540 --> 17:50.650
المقال بقلم بيتر رولينز 2016 أيضًا.

17:50.650 --> 17:52.270
لذلك كلاهما حديثان جدًا.

17:52.270 --> 18:00.020
ونعم ، تحقق من هذا إذا كنت ترغب في البحث في الرياضيات وراء الانتروبيا المتقاطعة ، خلف الحد الأقصى الناعم والانتروبيا المتقاطعة

18:00.020 --> 18:02.370
في هذه المقالة في الواقع.

18:02.680 --> 18:03.730
لذا ها نحن ذا.

18:03.730 --> 18:07.210
هذا كل ما في هذين الأمرين.

18:07.240 --> 18:12.670
آمل أن أكون قادرًا على إضافة بعض الوضوح الإضافي ونتمنى لك التوفيق في ذلك.

18:12.670 --> 18:16.870
سيكون الأمر ممتعًا والاستمتاع بالبرامج التعليمية العملية.

18:16.870 --> 18:17.950
سأراك في المرة القادمة.

18:17.950 --> 18:19.840
حتى ذلك الحين ، استمتع بالتعلم العميق.
