WEBVTT

00:00.530 --> 00:03.020
أهلا ومرحبا بكم مرة أخرى في دورة التعلم العميق.

00:03.020 --> 00:07.910
في الدرس السابق ، اكتشفنا ماهية الشبكات العصبية التلافيفية ، واليوم

00:07.910 --> 00:10.820
سنغوص في الخطوة الأولى الالتفاف.

00:10.820 --> 00:14.780
إذن هذه هي وظيفة الالتواء.

00:14.780 --> 00:20.720
أعلم أننا نحاول الابتعاد عن الرياضيات ونبقي الأمور بديهية ، لكن لا يسعني سوى مشاركة

00:20.720 --> 00:23.090
هذه الصيغة معك لأنها بسيطة جدًا.

00:23.090 --> 00:30.320
الالتفاف هو في الأساس تكامل مشترك لوظيفتين ويوضح لك كيف تقوم إحدى الوظائف بتعديل الأخرى

00:30.320 --> 00:32.630
أو تعديل شكل الأخرى.

00:32.630 --> 00:38.360
وإذا كنت قد أجريت أي معالجة للإشارات أو هندسة كهربائية أو مهنة تتطلب معالجة

00:38.360 --> 00:42.350
الإشارات ، فستصادف حتمًا وظيفة الالتفاف.

00:42.350 --> 00:44.030
إنها تحظى بشعبية كبيرة الآن.

00:44.030 --> 00:49.400
مرة أخرى ، سنبقي الرياضيات خفيفة أو نبقيها منفصلة.

00:49.400 --> 00:55.850
وإذا كنت ترغب في الخوض في الرياضيات وراء الشبكات العصبية التلافيفية ، فإن القراءة

00:55.850 --> 01:04.370
الإضافية الرائعة هي مقدمة عن الشبكات العصبية التلافيفية بواسطة جانسون وو ، الأستاذ في جامعة نانجينغ

01:04.370 --> 01:05.630
في الصين.

01:05.630 --> 01:12.710
تم نشر هذه الورقة حرفيًا منذ أيام ، مثل خمسة أو ستة أيام مضت ، وهي موجهة بشكل خاص إلى الأشخاص الذين بدأوا

01:12.710 --> 01:17.330
في المبتدئين ، والذين يتعرفون على الشبكات العصبية التلافيفية.

01:17.330 --> 01:20.090
لذلك يجب أن تكون الرياضيات سهلة الوصول.

01:20.090 --> 01:30.170
لقد قمت بالفعل بإرسال بريد إلكتروني إلى البروفيسور جونسون وو ، وقال إن هدفه كله هو تقليل الأمور المعقدة حتى يتمكن الأشخاص

01:30.170 --> 01:33.260
الجدد في هذا المجال من فهمها.

01:33.260 --> 01:38.900
وذكر أيضًا أن لديه بعض المواد المتاحة على صفحته الرئيسية.

01:38.900 --> 01:46.310
لذلك ، إذا كنت في عنوان URL ، إذا قمت بإزالة الجزأين الأخيرين فقط وذهبت إلى الإعجاب بقطع WJ X إلى هذا الجزء ، فهذه هي

01:46.310 --> 01:51.440
صفحته الرئيسية وستكون قادرًا على العثور على المزيد من البرامج التعليمية والمواد

01:51.440 --> 01:57.860
الإضافية التي لم تكن كذلك تم نشرها كأبحاث ، لكنه يستخدمها في دروسه ، لذلك قد تجدها مفيدة.

01:57.860 --> 02:03.650
لذا تصفح هناك إذا كنت ترغب في الحصول على مقدمة في الرياضيات وراء الشبكات العصبية

02:03.650 --> 02:08.180
التلافيفية ونوعًا من بناء قاعدة صلبة حول تلك المنطقة.

02:08.300 --> 02:12.440
لكننا سنمضي قدمًا وسنتحدث عن الالتفاف.

02:12.440 --> 02:15.980
إذن ما هو الالتفاف من الناحية البديهية؟

02:16.340 --> 02:18.890
هنا على اليسار لدينا صورة إدخال كما ناقشناها.

02:18.890 --> 02:22.670
هذه هي الطريقة التي سننظر بها إلى الصور ، فقط الآحاد والأصفار لتبسيط الأمور.

02:22.670 --> 02:24.770
ويمكنك أن ترى هذا الوجه المبتسم هناك.

02:24.770 --> 02:26.300
ثم لدينا ميزة الكشف.

02:26.300 --> 02:28.400
إذن ، مكشاف الميزة هو مصفوفة ثلاثة في ثلاثة.

02:28.670 --> 02:30.050
هل يجب أن يكون ثلاثة في ثلاثة؟

02:30.050 --> 02:31.040
لا ، ليس كذلك.

02:31.760 --> 02:39.260
أعتقد أن أليكس نت يستخدم سبعة في سبعة ، ثم يستخدم واحدًا آخر من تلك المشهورة الأخرى مثل خمسة في خمسة

02:39.290 --> 02:40.640
كواشف للميزات.

02:41.480 --> 02:48.380
يمكن أن تكون مختلفة ، لكن عادة سترى أنها ثلاثة في ثلاثة وهي أسباب تجعلها ثلاثة

02:48.380 --> 02:49.310
في ثلاثة.

02:49.310 --> 02:53.900
لذلك سنلتزم باتفاقية وجود مكشاف ثلاثي السمات.

02:54.470 --> 02:59.180
أيضًا ، يُطلق على كاشف الميزات هذه المصطلحات المهمة لأنك قد تصادفها العديد

02:59.330 --> 03:04.040
من المصطلحات المختلفة لكاشف الميزات ، ولكن أكثرها شيوعًا هي كاشف الميزات.

03:04.040 --> 03:09.290
أو قد تسمع أنه يطلق عليه نواة أو قد تسمعه يطلق عليه مرشح.

03:09.290 --> 03:14.240
لذلك في هذه الدورة ، سنستخدم إما المرشح أو كاشف الميزات بالتبادل.

03:14.360 --> 03:22.100
لكن فقط ضع في اعتبارك أنه يحتوي على هذه الأسماء وأن عملية الالتفاف تدل على علامة X في

03:22.100 --> 03:26.480
دائرة ، تمامًا كما رأيت في الصيغ من قبل وهنا.

03:26.510 --> 03:33.110
ما يحدث هو على مستوى حدسي ، كل أو مجرد التفكير في الأمر من حيث ما يحدث بالفعل في الخلفية

03:33.110 --> 03:34.820
بدلاً من الرياضيات.

03:34.820 --> 03:40.520
حسنًا ، تأخذ هذه الميزة للكشف أو الفلتر وتضعها على صورتك كما تراه على اليسار.

03:40.520 --> 03:47.570
إذاً تغطي على سبيل المثال ، في هذه الحالة ، الزاوية اليسرى العليا ، هناك تسعة بكسلات في الزاوية اليسرى

03:47.570 --> 03:48.170
العليا.

03:48.170 --> 03:54.050
وتقوم بضرب كل قيمة في كل قيمة بشكل أساسي.

03:54.050 --> 03:54.920
القيم الخاصة بذلك.

03:54.920 --> 04:02.540
إذن ، أعلى صفر بالقيمة اليسرى العلوية بالقيمة اليسرى العلوية ، ثم الموضع الأول بشكل أساسي ، واحد حسب

04:02.540 --> 04:08.600
الموضع رقم واحد ، موضع واحد برقم أو صفر واحد في صفر ، 102 في صفر اثنين وهكذا.

04:08.600 --> 04:14.390
إذن ، مجرد ضرب هذه المصفوفات بطريقة حكيمة ومن ثم جمع النتائج.

04:14.390 --> 04:16.610
لذلك في هذه الحالة ، لا شيء يطابق.

04:16.610 --> 04:19.760
إذن فهو دائمًا إما صفر في صفر صفر في واحد.

04:19.760 --> 04:21.050
إذن فالنتيجة هي صفر.

04:21.620 --> 04:26.480
هنا يمكنك أن ترى أن أحدهما متطابق ، والواحد الموجود على اليسار متطابق.

04:26.480 --> 04:28.060
وبالتالي لدينا واحد هنا.

04:28.070 --> 04:30.680
لا شيء متطابق ، لا شيء متطابق ، لا شيء متطابق.

04:30.680 --> 04:32.060
ثم ننتقل إلى الصف التالي.

04:32.060 --> 04:38.510
إذن ، والخطوة التي نحرّك عندها هذا المرشح بالكامل تسمى الخطوة.

04:38.510 --> 04:40.460
إذن لدينا هنا خطوة بمقدار بكسل واحد.

04:40.460 --> 04:45.650
هنا يمكنك أن ترى مرة أخرى شيئًا ما يطابق الزاوية اليمنى السفلية مقابل خطوة ، لكن الجزء

04:45.650 --> 04:50.800
السفلي في المنتصف يتطابق هنا ، أعلى اليمين ، مباراة واحدة ، ثم لا شيء متطابق.

04:50.840 --> 04:51.980
الخطوة واحدة.

04:52.070 --> 04:57.290
يمكنك تغيير الخطوة ، يمكنك جعلها واحدة ، اثنتين ، يمكنك جعلها ثلاثة.

04:57.290 --> 04:59.510
كل ما يعجبك.

04:59.920 --> 05:02.670
في النهاية الشخص الذي يعمل بشكل جيد عادة ما يكون اثنين.

05:02.670 --> 05:04.260
هذا ما يلتزم به الناس.

05:04.260 --> 05:08.940
وسنتحدث عن الخطوة نحو نهاية هذا البرنامج التعليمي.

05:09.420 --> 05:11.700
ها نحن لدينا المطابقة.

05:11.700 --> 05:12.570
لذلك نحن فقط نواصل الذهاب هنا.

05:12.570 --> 05:17.640
يمكنك أن ترى أننا حصلنا على اثنين لأن اثنين منهم متطابقان وهكذا وهلم جرا ، وهكذا.

05:17.640 --> 05:18.180
وها نحن ذا.

05:18.180 --> 05:19.530
هناك واحد آخر مطابق.

05:21.330 --> 05:22.500
هناك نذهب.

05:23.560 --> 05:24.570
وقد انتهوا.

05:24.580 --> 05:26.300
وماذا في ذلك؟

05:26.320 --> 05:27.660
ماذا خلقنا؟

05:27.670 --> 05:28.270
الصحيح.

05:28.630 --> 05:31.240
زوجان من الأشياء الهامة هنا.

05:31.870 --> 05:34.900
تسمى الصورة الموجودة على اليمين خريطة المعالم.

05:35.170 --> 05:36.610
لديه أيضا عدة شروط.

05:36.610 --> 05:40.190
يمكن أيضًا أن يطلق عليها أحيانًا ميزة خاضعة للرقابة.

05:40.750 --> 05:45.880
لذلك عندما تقوم بتطبيق عملية التفاف على شيء ما ، فإنه لا يصبح معقدًا ، بل يصبح

05:45.880 --> 05:46.930
متضمنًا.

05:46.930 --> 05:53.530
ونعم ، في بعض الأحيان يعجبني ، أفكر في نفسي بطريقة خاطئة ، لكن هذا هو المصطلح الصحيح.

05:53.530 --> 05:57.820
إنها متضمنة ، إنها نوع من الميزات القديمة ، أو يمكن أن تسمى أيضًا خريطة التنشيط.

05:57.820 --> 06:02.650
لكننا سنطلق عليها خريطة المعالم في هذه الدورة التدريبية حتى يمكن تسميتها بأي من هذه الأشياء.

06:03.280 --> 06:06.250
وماذا فعلنا هنا؟

06:06.250 --> 06:09.820
حسنًا ، كما ترى ، قمنا بتقليل حجم الصورة.

06:09.820 --> 06:10.540
هذا رقم واحد.

06:10.540 --> 06:16.060
وهذا هو الشيء المهم الذي أردت أن أذكره حول صورة الإدخال الخاصة بك وميزة الكشف والخطوة

06:16.060 --> 06:17.110
، أليس كذلك؟

06:17.290 --> 06:21.160
إذا كانت لديك خطوة واحدة ، يمكنك رؤية الصورة مختصرة قليلاً ، ولكن إذا كانت لديك

06:21.160 --> 06:23.110
خطوة أو خطوتين ، فستقل الصورة أكثر.

06:23.110 --> 06:30.880
لذلك ستكون خريطة الميزة أصغر ، وهذه وظيفة مهمة جدًا لكاشف الميزات

06:30.880 --> 06:38.320
لخطوة الالتفاف بأكملها وهي جعل الصورة أصغر لأن ذلك سيكون أسهل

06:38.320 --> 06:42.040
في معالجتها وستكون أسرع.

06:42.040 --> 06:43.600
سوف و.

06:45.990 --> 06:51.780
سيكون مجرد حاضنة لأنه تخيل أن لدينا هنا صورة ماذا ، سبعة في سبعة.

06:51.780 --> 06:55.080
لكن تخيل لو كان لديك صورة مناسبة ، أليس كذلك؟

06:55.590 --> 06:59.220
أو لديك صورة 256 × 256 بكسل.

06:59.220 --> 07:06.720
هذا ، هو عدد ضخم من البكسل مثل 256 مربع أو مثل لنفترض أن لديك 300 × 300 بكسل.

07:06.720 --> 07:09.810
لذلك ، لا يتم الخلط بيننا وبين GB 256.

07:09.810 --> 07:14.550
دعنا نقول فقط أن لدينا صورة 300 × 300 من حيث الحجم والبكسل.

07:14.550 --> 07:18.690
ثم لديك 300 مربع من وحدات البكسل ، وهذا رقم ضخم.

07:18.900 --> 07:26.490
وبالتالي فإن أجهزة الكشف عن الميزات ستعمل على تقليل حجم الصورة ، وبالتالي فإن خطوة خطوتين مفيدة

07:26.490 --> 07:27.480
بالفعل.

07:27.480 --> 07:33.450
ولكن السؤال بعد ذلك هو ، هل نفقد المعلومات أم نفقد المعلومات عندما نقوم بتطبيق كاشف

07:33.450 --> 07:34.350
الميزات؟

07:34.350 --> 07:40.470
حسنًا ، نفقد بعض المعلومات ، بالطبع ، لأن لدينا قيمًا أقل في المصفوفة الناتجة.

07:40.470 --> 07:45.870
ولكن في الوقت نفسه ، فإن الغرض من كاشف الميزة هو اكتشاف ميزات معينة ، أجزاء

07:45.870 --> 07:47.910
معينة من الصورة متكاملة.

07:48.420 --> 07:52.920
وهكذا ، على سبيل المثال ، إذا فكرت في الأمر بهذه الطريقة ، مثل أن كاشف الميزات لديه

07:52.920 --> 07:57.870
نمط معين عليه ، فإن أعلى رقم في خريطة المعالم الخاصة بك يكون عندما يتطابق هذا النمط.

07:57.870 --> 08:05.100
في الواقع ، أعلى رقم يمكنك الحصول عليه في مثال مبسط الآن هو عندما تتطابق الميزة.

08:05.100 --> 08:05.490
بالضبط.

08:05.490 --> 08:09.330
ويمكنك أن ترى بهذا الرقم أربعة في خريطة الميزات الخاصة بنا.

08:09.330 --> 08:10.470
هذا هو بالضبط.

08:10.470 --> 08:16.860
لذلك إذا نظرت هنا ، هذا هو بالضبط مكان كاشف الميزات هذا ، لأنه لا يوجد سوى أربعة

08:16.860 --> 08:19.020
منها متطابقة تمامًا.

08:19.020 --> 08:21.240
لذا يمكنكم رؤية هذا الجزء هنا.

08:21.240 --> 08:27.300
لذلك تم اكتشاف الميزة هنا وكما ناقشنا في بداية هذا القسم.

08:28.160 --> 08:33.020
هذه الميزات هي كيف نرى الأشياء ، كيف نتعرف على الأشياء.

08:33.020 --> 08:40.190
نحن لا ننظر إلى كل بكسل ، إذا جاز التعبير ، في ما نراه على صورة أو في الحياة الواقعية.

08:40.190 --> 08:41.750
نحن لا ننظر إلى كل صورة.

08:41.750 --> 08:50.150
ننظر إلى الملامح وننظر إلى الأنف والقبعات والريش والعينين تحت أو العلامات السوداء

08:50.150 --> 08:57.320
الصغيرة تحت عيون الفهد للتمييز بين الفهد والفهد أو شكل القطار.

08:57.320 --> 09:00.620
لا نفرق بين القطار السريع والقطار العادي وما إلى ذلك.

09:00.620 --> 09:02.510
لذلك نحن لا ننظر إلى كل شيء.

09:02.510 --> 09:08.030
نحن ننظر إلى الميزات ، وهذا ما نحافظ عليه وهذا ما تساعدنا خريطة الميزات في الحفاظ عليه.

09:08.030 --> 09:15.410
في الواقع ، هذا ما يسمح لنا بتقديم والتخلص من جميع الأشياء غير الضرورية التي حتى كبشر ، لا

09:15.410 --> 09:22.550
نقوم بمعالجة هذا الكم الهائل من المعلومات التي تدخل عينيك في أي وقت ، مثل غيغابايت من

09:22.550 --> 09:28.430
المعلومات ، إذا نظرت في كل نقطة ، إن لم يكن تيرابايت من المعلومات تذهب إلى

09:28.430 --> 09:35.330
عينيك في الثانية وما زلنا قادرين على معالجة ذلك لأننا نتخلص مما هو غير ضروري.

09:35.330 --> 09:36.920
ركز فقط على الميزات المهمة.

09:36.980 --> 09:42.050
الميزات مهمة بالنسبة لنا وهذا هو بالضبط ما تفعله خريطة الميزات.

09:42.050 --> 09:49.430
لذا الآن ننتقل ، هذه هي صورة الإدخال الخاصة بنا ونحن نقوم بإنشاء خريطة المعالم.

09:49.430 --> 09:52.490
لذا ، لنفترض أن الواجهة الأمامية هي التي أنشأناها للتو.

09:52.490 --> 09:59.630
ولكن كيف يوجد الكثير منها ، لكننا نقوم بإنشاء خرائط ميزات متعددة لأننا نستخدم مرشحات مختلفة ،

09:59.630 --> 10:00.500
أليس كذلك؟

10:00.500 --> 10:03.770
وهذه طريقة أخرى نحافظ فيها على الكثير من المعلومات.

10:03.770 --> 10:10.550
لذلك ليس لدينا خريطة ميزة واحدة فقط ، نحن نبحث عن ميزات معينة وبعد ذلك أو بشكل أساسي تقرر

10:10.550 --> 10:14.570
الشبكة من خلال تدريبها وهذا شيء سنناقشه في نهاية

10:14.570 --> 10:22.490
هذا القسم ، من خلال تدريبها ، تقرر أي الميزات هي مهم لأنواع معينة أو فئات معينة ، ويبحث عنها.

10:22.490 --> 10:26.750
وبالتالي سيكون لدينا فلاتر مختلفة وسنتحدث عن المرشحات الآن ، ولكن في الأساس ستطبق

10:26.750 --> 10:27.710
هذه المرشحات.

10:27.710 --> 10:32.480
لذلك ، للحصول على خريطة المعالم هذه ، قامت بتطبيق مرشح مثل الذي رأيناه.

10:32.480 --> 10:36.200
ولكن بعد ذلك ، للحصول على خريطة المعالم هذه ، مع تطبيق مرشح مختلف لتعيين هذه الميزة ، قم بتطبيق

10:36.200 --> 10:37.460
مرشح مختلف وما إلى ذلك.

10:38.150 --> 10:43.370
ومن ثم فهي تقوم بشكل أساسي بإنشاء خرائط الميزات هذه.

10:43.370 --> 10:49.520
وهذا هو السبب في أنني شخصيًا أعتقد أن مصطلح كاشف الميزات أفضل من عامل التصفية.

10:49.520 --> 10:55.010
لذا تذكر هنا أن لدينا هذا المرشح الذي يمكننا أيضًا أن نطلق عليه كاشف الميزات.

10:55.010 --> 10:59.330
حسنًا ، في الواقع ، أعتقد أن أداة الكشف عن ميزة الكلمة مناسبة بشكل أفضل.

10:59.330 --> 11:03.110
والسبب في ذلك هو الغرض.

11:03.110 --> 11:03.320
الصحيح.

11:03.320 --> 11:06.440
لا نريد فقط أننا لا نريد تصفية صورتنا فقط.

11:06.440 --> 11:10.130
ولكن على الرغم من أن هذا هو الكل إلا أنه مجرد مسألة مصطلحات.

11:10.130 --> 11:11.930
لكن في الأساس ، نريد اكتشاف الميزات.

11:11.930 --> 11:12.200
حسنا.

11:12.200 --> 11:19.610
في هذه الطبقة ، سنكتسب خريطة المعالم هذه التي اكتشفناها حيث توجد ميزات معينة في الصورة في خريطة المعالم

11:19.610 --> 11:23.750
هذه التي اكتشفناها ، حيث توجد بعض الميزات الأخرى ، حيث توجد

11:23.750 --> 11:25.280
ميزة معينة معينة.

11:25.310 --> 11:30.890
اكتشفنا في خريطة الميزات هذه ، حيث توجد ميزة أخرى معينة على الصورة.

11:31.190 --> 11:33.320
هذا ما كنا نفعله.

11:33.320 --> 11:34.550
ودعنا نلقي نظرة على بعض الأمثلة.

11:34.550 --> 11:44.360
نحن هنا نستخدم وهذا من Ingeborg ، وثائقهم ، إنها خالية من نوع من الأدوات مثل الطلاء ويمكنك

11:44.360 --> 11:49.460
استخدامها لتعديل صورك أو العمل مع صورك.

11:49.460 --> 11:56.420
لكن لديهم في الأساس بعض الأمثلة القيمة في وثائقهم ولديهم هنا صورة لتاج محل ويمكنك

11:56.420 --> 11:59.720
اختيار الفلتر الذي تريد تطبيقه.

11:59.720 --> 12:06.080
لذلك إذا قمت بتنزيل هذا البرنامج وقمت بتحميل صورة فيه وبعد ذلك يمكنك بالفعل بدء مصفوفة التفاف

12:06.080 --> 12:12.080
وتطبيق المرشحات ، وسترى أن هذه الأشياء ، يتم تطبيق مصفوفات الالتفاف هذه بالفعل في معالجة

12:12.080 --> 12:15.140
الصور وتصميمها وما إلى ذلك.

12:15.140 --> 12:16.700
لذلك دعونا نلقي نظرة على ما حصلنا عليه وما حصلنا عليه.

12:16.700 --> 12:21.440
لذا ، إذا طبقنا هذا الفلتر خمسة في المنتصف ، ناقص واحد ، ناقص واحد ، ناقص واحد ، ناقص واحد

12:21.440 --> 12:23.540
، يمكنك أن ترى أنه يزيد حدة الصورة.

12:23.540 --> 12:28.820
ونعم ، هذا أمر بديهي تمامًا إذا فكرت في الأمر.

12:28.820 --> 12:36.350
إذاً ، الخمسة هي البكسل ، البيكسل الرئيسي كما هو الحال في منتصف الفلتر أو كاشف الميزة

12:36.350 --> 12:42.250
، ثم ناقص واحد ، ناقص واحد ، ناقص واحد فقط يشبهك نوعًا ما يقلل من البكسل

12:42.290 --> 12:44.960
المحيط به ، بمعنى بديهي.

12:46.100 --> 12:46.850
ثم طمس.

12:46.880 --> 12:54.500
لذلك ، فهي تتطلب أهمية متساوية تعطي أهمية متساوية لجميع وحدات البكسل الموجودة حول وحدة البكسل الموجودة في المركز.

12:54.500 --> 12:58.940
وبالتالي فهي تجمعهم معًا وتحصل على ميزة ضبابية وحافة في يديك.

12:58.940 --> 13:03.770
هنا يمكنك أن ترى ذلك ناقص واحد وواحد ، ثم تحصل على أصفار ، أليس كذلك؟

13:03.770 --> 13:11.210
لذلك تقوم بحذف وإزالة وحدات البكسل الموجودة حول البيكسل الرئيسي في المنتصف وتحتفظ بهذه البيكسل عند ناقص

13:11.210 --> 13:12.740
واحد ويمنحك ميزة.

13:12.740 --> 13:14.960
وهذا صعب قليلاً لفهم كيفية عمله.

13:15.900 --> 13:19.070
ربما يكون من الصعب مجرد التفكير في الأمر بشكل حدسي.

13:19.460 --> 13:20.800
كشف الحافة الحق.

13:20.810 --> 13:23.510
لذلك ربما يكون هذا أكثر منطقية ، أليس كذلك؟

13:23.510 --> 13:32.450
تأخذ الوسط ، تقلل من الوسط ، ربما مثل قوة البكسل الأوسط.

13:32.450 --> 13:41.510
ثم تبحث عن هؤلاء ، وتبحث عن هؤلاء ، وتزيد من قوة من حولهم.

13:42.020 --> 13:43.310
لذلك لديك هؤلاء هناك.

13:44.420 --> 13:44.810
نعم.

13:44.810 --> 13:50.630
هذا ، يمنحك مثل اكتشاف الحافة ويمكنك أن ترى ما تحصل عليه وتدير واحدًا آخر.

13:50.630 --> 13:58.070
المفتاح هنا هو أنه غير متماثل ويمكنك أن ترى الصورة تصبح غير متماثلة أيضًا.

13:58.070 --> 14:05.000
لذلك كان لديك مثل هذا النوع من الشعور بأنه يقف تجاهك وهذا ما تحصل عليه عندما يكون لديك مثل السلبيات

14:05.000 --> 14:07.100
والإيجابيات هنا.

14:07.100 --> 14:12.320
مرة أخرى ، هذا أمر تقني بعض الشيء الآن ، ولكن على الأقل يمكننا الحصول على نوع من الحدس ، نفهم ،

14:12.320 --> 14:14.090
دعنا نراجعها بسرعة مرة أخرى.

14:14.090 --> 14:20.690
إذاً هناك شحذ ، هناك ضبابية ، هناك تحسين للحافة ، هناك كشف للحافة ، هناك نقش.

14:20.690 --> 14:27.230
وكما ترى ، هذه أمثلة رائعة للصورة نفسها ، لكننا نحصل على خرائط ميزات ، لذلك نستخدم كاشفات

14:27.230 --> 14:31.640
ميزات مختلفة للحصول على خرائط ميزات مختلفة للصورة نفسها.

14:31.640 --> 14:39.770
وبالتالي لدينا الآن الكثير من هذه الإصدارات من هذه الصورة حيث حاولنا في كل واحدة اكتشاف أشياء معينة

14:39.770 --> 14:46.640
من هذه المصطلحات ، فهي لا تنطبق علينا هناك باستثناء أن الرئيس ربما لا ينطبق علينا من

14:46.640 --> 14:49.910
حيث الشبكات العصبية التلافيفية.

14:49.910 --> 14:51.530
لكن كشف الحافة ، هذا مهم.

14:51.530 --> 14:56.360
نريد الكشف عن الحواف ، وتحسين الحافة ، وربما لا يتم تشويشها.

14:56.360 --> 15:02.390
لذا فإن بعض الأشياء مثل الحافة هي على الأرجح أهم شيء لنوع عملنا.

15:02.390 --> 15:07.100
ومن حيث الفهم مثل أجهزة الكمبيوتر ، فإنهم سيقررون بأنفسهم ، وستقرر شبكتهم العصبية بنفسها

15:07.100 --> 15:08.930
، ما هو المهم وما هو غير ذلك.

15:08.930 --> 15:12.800
وربما لن تتمكن حتى من التعرف عليه بالعين المجردة.

15:12.830 --> 15:17.060
لن تكون قادرًا على فهم ما تعنيه هذه الميزات ، ولكن الكمبيوتر

15:17.060 --> 15:24.410
سيقرر ، وهذا هو جمال الشبكات العصبية ، أنه يمكنها معالجة العديد من الأشياء المختلفة وفهمها

15:24.410 --> 15:30.620
دون امتلاك هذا الحدس ، دون أن يكون لديك هذا التفسير لماذا سوف نفهم الميزات المهمة

15:30.620 --> 15:39.230
بالنسبة لهم ، سواء كان لدينا اسم لهم أم لا ، فهذا كله سؤال غير ذي صلة بالشبكة العصبية الاصطناعية.

15:39.800 --> 15:50.660
والمفضل لدي ، هذه صورة لجيفري هينتون مرت عبر أحد هذه المرشحات.

15:50.810 --> 15:51.110
حسنا.

15:51.110 --> 15:52.970
هذا يقودنا إلى نهاية البرنامج التعليمي اليوم.

15:52.970 --> 15:55.220
آمل أن تكون قد استمتعت بالتعرف على الالتفاف.

15:55.220 --> 16:02.270
تتمثل الفكرة الأساسية في أن الالتفاف الغرض الأساسي من الالتواء هو العثور على ميزات في صورتك باستخدام

16:02.270 --> 16:08.000
كاشف الميزات ، ووضعها في خريطة المعالم ، ومن خلال وضعها في خريطة مستقبلية ، فإنها

16:08.000 --> 16:15.200
لا تزال تحافظ على العلاقات المكانية بين وحدات البكسل ، وهو أمر مهم جدًا بالنسبة لنا أن نعرفه لأنه إذا

16:15.530 --> 16:19.130
كان مختلطًا تمامًا ، فقد فقدنا النمط.

16:19.130 --> 16:25.040
وفي الوقت نفسه ، من المهم أن نفهم أن الميزات التي ستكتشفها الشبكة العصبية

16:25.040 --> 16:32.930
في معظم الأوقات وتستخدمها للتعرف على صور وفئات معينة لن تعني شيئًا للبشر ، ولكنها مع ذلك تعمل.

16:32.930 --> 16:34.280
وهذا هو الالتفاف.

16:34.280 --> 16:36.140
وأنا أتطلع إلى رؤيتك على خط الاستواء.

16:36.140 --> 16:38.090
حتى ذلك الحين ، استمتع بالتعلم العميق.
